ANALISIS KUALITAS TES DAN BUTIR SOAL Alita arifiana anisa ( 2 mei - TopicsExpress



          

ANALISIS KUALITAS TES DAN BUTIR SOAL Alita arifiana anisa ( 2 mei 2012) BAB I PENDAHULUAN A. Latar Belakang Tes merupakan salah satu cara untuk mengevaluasi proses pembelajaran yang dianggap mampu memfasilitasi kebutuhan orang-orang di bidang pendidikan tentang perangkat atau alat yang mampu memberi gambaran tentang proses pembelajaran yang dilaksanakan. Untuk menghasilkan gambaran yang akurat, relevan dan sesuai dengan data yang sesungguhnya terjadi dilapangan membutuhkan tes yang berkualitas, oleh karena itu dibutuhkan analisis kualitas tes guna menciptakan kualitas tes yang benar-benar mampu melaksanakan tugasnya sebagai alat evaluasi. Analisis kualitas tes merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut. Analisis kualitas tes digunakan untuk menjawab pertanyaan apakah tes sebagai alat ukur benar-benar mampu mengukur apa yang sebenarnya hendak diukur dan apakah tes tersebut dapat diandalkan dan berguna bagi dunia pendidikan. B. Rumusan Masalah Adapun rumusan masalah yang diangkat dalam penulisan ini adalah: a. Bagaimana cara untuk melalukan analisis kualitas tes dan butir soal? b. Bagaimana aplikasi analisis kualitas tes dan butir soal pada dunia pendidikan? C. Tujuan Penulisan ini bertujuan untuk mengetahui bagaimana cara melakukan analisis kualitas tes dan butir soal serta implementasinya dalam proses pembelajaran. BAB II PEMBAHASAN A. Pengertian Analisis Tes dan Butir Soal Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut. B. Tujuan Analisis Tes dan Butir Soal Analisis tes dan butir soal bertujuan untuk: a. Mengetahui apakah tes atau soal yang digunakan untuk mengevaluasi sudah mampu mengukur apa yang sebenarnya ingin diukur melalui tes atau soal tersebut. b. Mengetahui sejauh mana data atau informasi yang dihasilkan oleh tes maupun butir soal dapat diandalkan. c. Mengetahui sejauh mana data yang dihasilkan oleh tes atau soal dapat bergunabagi proses pembelajaran. C. Validitas Suatu instrument dapat dikatakan valid apabila benar-benar mampu mengukur apa yang hendak diukur dengan tepat. Dalam validitas terdapat dua unsur penting, yaitu validitas menunjukan derajat atau hirarki dan validitas selalu dihubungkan dengan suatu tujuan yang spesifik karena tidak ada validitas yang berlaku secara umum. Ada 3 faktor yang dapat mempengaruhi validitas hasil tes yaitu: a. Faktor Instrument Evaluasi Instrument evaluasi yang kurang baik akan menghasilkan hasil evaluasi yang kurang baik pula. b. Faktor Administrasi Evaluasi dan Penskoran Banyak hal yang mempengaruhi hasil evaluasi yang berkaitan dengan administrasi dan penskoran, antara lain, alokasi waktu pengerjaan tes atau soal, kedisplinan guru pengawas, kedisplinan peserta tes, kesalahan penskoran, serta kondisi fisik dan psikis peserta tes. c. Faktor Jawaban dari Pesera Didik Factor ini meliputi kecenderungan peserta didik untuk mengjawab dengan cepat namun kurang tepat, keinginan untuk coba-coba dan menggunakan gaya bahasa tertentu. Berikut ini merupakan jenis-jenis validitas, yaitu : a. Validitas permukaan Jika suatu tes secara sepintas telah dianggap baik maka tes tersebut dapat dikatakan telah memenuhi syarat validitas permukaan dan tidak membutuhkan judgement yang mendalam. b. Validitas isi Validitas isi sering digunakan dalam penilaian hasil belajar atau untuk mengetahui sejauh mana peserta didik menguasai materi pelajaran yang telah disampaikan dan perubahan psikologis yang terjadi setelah mengalami proses pembelajaran. Validitas isi disebut pula validitas kurikuler berkenan dengan relevansi materi tes dengan kurikulum yang ditentukan atau validitas perumusan berkenaan dengan apakah apek dalam soal tercakup dalam apa yang hendak diukur. c. Validitas empiris Validitas empiris dilakukan dengan pendekatan korelasi untuk mencari hubungan skor tes dengan criteria tertentu. Validitas empiris dibagi menjadi 3, yaitu: 1.) Validitas prediktif (Predictive validity) yang digunakan untuk meramalkan prestasi belajar peserta didik pada masa depan. 2.) Validitas kongkuren (concurrent validity) digunakan untuk criteria standar yang berlainan. 3.) Validitas sejenis (congruent validity) untuk criteria yang sejenis. 8 kriteria bahan bandingan berdasarkan pendapat Anastasi dalam Conny Semiawan Stamboel, yaitu: 1.) Diferensiasi umur 2.) Kemajuan akademis 3.) Kriteria dalam Pelaksanaan Latihan Khusus 4.) Kriteria dalam Pelaksanaan Kerja 5.) Penilaian 6.) Kelompok yang Bertentangan 7.) Korelasi dengan tes lain 8.) Konsistensi Internal Contoh perhitungan korelasi: 1.) Korelasi Product Moment dengan Angka Simpangan keterangan: r = koefisien korelasi ∑xy = jumlah produk x dan y Langkah-langkah penyelesaian: - Membuat table persiapan No. X Y x Y x2 y2 Xy - Memasukan nilai masing-masing mata pelajaran X dan Y - Jumlahkan seluruh nilai dan hitung rata-rata masing-masing variable - Isi kolom x dengan nilai tiap peserta pada mata pelajaran X dikurangi dengan nilai rata-rata mata pelajaran X - Isi kolom x dengan nilai tiap peserta pada mata pelajaran Y dikurangi dengan nilai rata-rata mata pelajaran Y - Cari x2 dengan mengkuadratkan nilai pada kolom x - Cari y2 dengan mengkuadratkan nilai pada kolom y - Hitung xy dengan mengalikan nilai pada kolom x dan nilai pada kolom y Korelasi product-moment juga dapat dilakukan dengan menggunakan angka kasar, dengan rumus: 2.) Korelasi Perbedaan Peringkat (Rank Differences Correlation) keterangan: r = koefisien korelasi 1 dan 6 = bilangan tetap D = perbedaan antara dua peringkat atau rank n = jumlah sampel Langkah-langkah: - Cari peringkat dari tiap-tiapmata pelajaran dengan mengurutkan nilai-nilai dari yang terbesar sampai yang terkecil. - Jika terdapat nilai yang sama, maka jumlahkan nilai peringkat pertama dengan kedua lalu bagi dua, maka kedua orang tersebut memiliki peringkat yang sama. - Cari perbedaan peringkat dengan mengurangkan peringkat mata pelajaran X dengan Y - Perbedaan peringkat kemudian dikuadratkan. 3.) Teknik Diagram Pencar (Scatter Diagram) Dalam statistika koefisien korelasi dinotasikan dengan “r” dimana -1,00 ≤ r ≥ 1,00, r = +1,00 artinya korelasi sempurna positif dan r = -1,00 artinya korelasi sempurna negative. Untuk menafsirkan koefisien korelasi dapat menggunakan criteria berikut: 0,81 – 1,00 = sangat tinggi 0,61 – 0,80 = tinggi 0,41 – 0,60 = cukup 0,21 – 0,40 = rendah 0,00 – 0,20 = sangat rendah d. Validitas Konstruk Valditas konstruk merupakan konsep yang dapar diobservasi dan dapat diukur, validitas konstruk dikenal juga dengan istilah validitas logis dan digunakan dalam tes-tes psikologi untuk mengukur gejala perilaku yang abstrak. Validitas konstruk digunakan untuk mengetahui sejauh mana tes dapat mengobservasi dan mengukur fungsi psikologis. e. Validitas Faktor Penilaian hasil belajar kerap menggunakan pengukuran atas suatu variable yang terdiri dar bebrapa factor yang diperoleh dari indicator. Validitas factor dapat dihitung dengan menghitung homogenitas skor setiap factor dengan total skor dan antara skor factor satu dengan lainnya. D. Reliabilitas Reliabilitas merupakan derajat konsistensi suatu instrument. Suatu tes dapat dikatan reliable apabila selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada kesempatan yang berbeda. Berikut ini merupakan empat factor yang mempengaruhi reliabilitas, yaitu: a. Panjang tes (Length of Test) b. Sebaran skor (spread of scores) c. Tingkat kesukaran (Difficulties Index) d. Obyektifitas Menurut perhitungan product Moment ada 3 macam reliabilitas, yaitu: a. Koefisien stabilitas Koefisien stabilitas merupakan jenis reliabilitas yang menggunakan teknik test and retest yaitu memberikan tes kepada sekelompok individu kemudian mengulang tes yang sama pada kelompok yang sama di waktuyangn berbeda. b. Koefisien Ekuivalen Koefisien ekuivalen dilakukan dengan mengkorelasikan tes yang paralel pada kelompok yang sama waktu yang sama dengan syarat kedua tes tersebut memiliki criteria, jumlah, isi, corak, tingkat kesukaran, petunjuk pengerjaan dan waktu pengerjaan yang sama. c. Koefisien Konsistensi Internal Koefisien konsistensi internal merupakan reliabilitas yang didapat dari mengkorelasikan dua buah tes dari kelompok yang sama tetapi diambil dari butir-butir yang berbeda namun jumlahnya sama (genap dengan ganjil atau acak) Rumus Spearman Brown Rumus Kuder Richardson Keterangan P = proporsi peserta didik yang menjawab betul dari suatu butir soal Q = 1-p K = jumlah butir soal Teknik Koefisien Alpha E. Kepraktisan Kepraktisan berarti kemudahan baik dalam hal persiapan, penggunaan, mengolahan, penafsiran maupun pengadminitrasian. Briikut ini merupakan faktir-faktor yang mempengaruhi kepraktisan, yaitu: a. Kemudahan mengadministrasi b. Waktu yang disediakan untuk melancarkan evaluasi c. Kemudahan menskor d. Kemudahan intrepretasi danaplikasi e. Tersedianya bentuk instrument evaluasi yang ekuivalen. F. Analisis Butir Soal a. Tingkat Kesukaran 1.) Soal bentuk objektif Menggunakan rumus tingkat kesukaran Keterangan: WL = jumlah peserta didik yang menjawab salah dari kelompok bawah WH = jumlah peserta didik yang menjawab salah adri kelompok atas nL = jumlah kelompok bawah nH = jumlah kelompok atas Langkah-langkah - Menyusun lembar jawaban dari skor tertinggi sampai terendah - Menyisihkn 27% dari kelompok atas dan bawah - Membuat tabel untuk mengetahui jawaban benar (+) salah (-) Kriteria penafsiran tingkat kesukaran soal: - ≤ 27% = mudah - 27% - 72% = sedang - ≥ 72% = sukar 2.) Soal bentuk uraian Menghitung tingkat kesukaran soal bentuk uraian adalah dengan menghitung persentase peserta didik yang gagal menjawab benar atau dibawah batas lulus b. Daya Pembeda Perhitungan daya pembeda adalah peengukuran sejauh mana suatu butir soal mampu membedakan peserta didik yang belum atau kurang mengasaui kompetensi. Keterangan: DP = daya pembeda n = 27% x N Kriteria Daya pembeda - 0,40 and up = very good items - 0,30 – 0,39 = reasonably good - 0,20 – 0,30 = marginal items - Below 0,19 = poor items 1.) Menghitung Signifikansi Daya Pembeda Soal Objektif - Membuat table persiapan - Menghitung jumlah WL dan WH - Menguranngkan WL dengan WH - Menambahkan WL dengan WH - Membandingkan nilai WL-WH dengan nilai table signifikansi DP 2.) Menghitung Signifikansi Daya Pembeda Soal Uraian G. Analisis Pengecoh Indeks pengecoh: Keterangan: IP = Indeks pengecoh P = jumlah peserta didik yang memilih pengecoh N = jumlah peserta didik yang ikut tes B = jumlah peserta didik yang menjawab benar n = jumlah opsi 1 = bilangan tetap Adapun kualitas pengecoh berdasarkan indeksnya adalah: 76% - 125% = sangat baik 51% -75% atau 126% - 150% = baik 26%- 50% atau 151% - 175% = kurang baik 0% - 25% atau 176% - 200% = jelek Lebih dari 200% = sangat jelek H. Analisis Homogenitas Soal Homogentias diketahui dengan menghitung koefisien korelasi antara skor tiap butir dengan skor total. Salah satu teknik korelasi yang dapat digunakan adalah korelasi product moment atau korelasi point biserial. I. Efektivitas Fungsi Opsi Langkah-langkah: a. Menentukan jumlan peserta didik b. Menentukan jumlah sampel kelompok atas danbawah c. Membuat table pengujian efektivitas d. Menghitung jumlah alternative jawaban yang diipilih peserta didik e. Menentukan efektivitas fungsi opsi dengan criteria: 1.) Opsi kunci - Jumlah pemilih kelompok atas dan bawah antara 25% - 75% Keterangan: ∑PKA = jumlah pemilih kelompok atas ∑PKB = jumlah pemilih kelompok bawah N1 = jumlah sampel kelompok atas N2 = jumlah sampel kelompok bawah - Jumlah pemilih kelompok atas harus lebih banyak dari jumlah pemilih kelompok bawah 2.) Untuk opsi pengecoh - Jumlah pemilih kelompok atas dan bawah tidak kurang dari: 25% Keterangan: d = jumlah opsi pengecoh Ka = kelompok atas Kb = kelompok bawah - Jumlah pemilih kelompok bawah harus lebih besar daripada kelompok atas. BAB III KESIMPULAN Analisis tes dan butir soal merupakan suatu tahap yang harus ditempuh untuk mengetahui derajat kualitas suatu tes, baik tes secara keseluruhan maupun butir soal yang menjadi bagian dari tes tersebut. Suatu instrument dapat dikatakan valid apabila benar-benar mampu mengukur apa yang hendak diukur dengan tepat. Validitas dapat dihitung dengan beberapa metode, antara lain metode korelasi product moment angka simpangan,korelasi perbedaan peringkat peringkat dan diagram pencar. Reliabilitas merupakan derajat konsistensi suatu instrument. Suatu tes dapat dikatan reliable apabila selalu memberikan hasil yang sama bila diteskan pada kelompok yang sama pada kesempatan yang berbeda.Ada beberapa rumus yang dapat digunakan untuk menghitung reliabilitas, yaitu rumus spearman brown, rumus kuder richarson dan rumus koefisien alpha. Hal lain yang perlu diperhatikan dalam menganalisis tes adalak kepraktisan tes terrsebut, dimana kepraktisan berarti kemudahan baik dalam hal persiapan, penggunaan, mengolahan, penafsiran maupun pengadminitrasian. Analisis butir soal dilakukan dengan melakukan perhitungan tingkat kesukaran dan daya pembeda. Analisis lain yang dibutuhkan untuk memastikan kualitas tes dan butir soal adalah analisis pengecoh, analisis homogenitas dan analisis efektivitas fungsi opsi. DAFTAR PUSTAKA Arifin, Zainal. 2010. Evaluasi Pembelajaran. Bandung: PT.Remaja Rosdakarya. Arikunto, Suharsimi. 2009. Dasar-dasar Evaluasi Pendidikan. Jakarta: Bumi Aksara.
Posted on: Thu, 20 Jun 2013 04:07:44 +0000

Trending Topics



Recently Viewed Topics




© 2015