Pack Your Bags and Let's Go!: Validitas dan Reliabilitas

A. Definisi Validitas

Validitas berasal dari bahasa Inggris dari kata validity yang berarti keabsahan atau kebenaran. Dalam konteks alat ukur atau instrumen asesmen, validitas berarti sejauh mana kecermatan atau ketepatan alat ukur dalam

melakukan fungsi ukurnya. Sebuah instrumen yang valid akan menghasilkan data yang tepat seperti yang diinginkan. Sebagai contoh, jika kita ingin mengetahui

berat maka alat ukur yang tepat adalah timbangan atau neraca bukan meteran,

termometer, atau alat yang lain. Dengan kata lain, sifat valid memberikan

pengertian bahwa alat ukur yang digunakan mampu memberikan nilai yang sesungguhnya dari apa yang diinginkan.

Contoh di atas barang kali terlalu sederhana dan mudah untuk mengecek

dan mengendalikannya. Berbeda halnya jika kita akan melakukan pengukuran

dalam dunia pembelajaran atau dunia pendidikan, tidak sesederhana seperti pada

pengukuran berat ataupun panjang. Untuk mengetahui alat ukur prestasi belajar

apakah valid atau tidak maka perlu dipelajari dengan hati -hati.

Validitas sangat berkaitan dengan tujuan pengukuran. Validitas tidak

berlaku secara umum bagi semua pengukuran. Suatu tes mempunyai hasil ukuran

yang baik (valid) untuk suatu tujuan tertentu yang spesifik tetapi tidak valid

untuk tujuan yang lain atau bahkan untuk tujuan yang sama pada kelompok yang

lain.

Linn & Gronlund (2000) mengemukakan hakikat validitas tes dan asesmen

sebagai berikut.

1. Validitas menyatakan ketepatan interpretasi hasil bukan pada prosedurnya.

2. Validitas merupakan persoalan yang berkaitan dengan derajat (tingkatan),

sebagai konsekuensinya kita harus menghindari pemikiran hasil asesmen

sebagai valid atau tidak valid. Oleh karena validitas adalah persoalan

derajad maka sebuah instrumen dapat dikategorikan mempunyai derajad

validitas tinggi, sedang, dan rendah.

3. Validitas selalu bersifat khusus untuk penggunaan atau interpretasi

tertentu. Tidak ada asesmen yang valid untuk semua tujuan. Sebagai

contoh, hasil tes aritmatika mungkin mempunyai tingkat validitas yang

tinggi untuk kemampuan hitung, validitas yang r endah untuk alasan-alasan

aritmatika, dan mempunyai derajat validitas sedang untuk memprediksi

kesuksesan prestasi matematika yang akan datang.

4. Validitas merupakan kesatuan konsep. Hakikat konsep validitas dipandang

sebagai sebuah kesatuan konsep berdasark an berbagai macam bagian dari fakta.

5. Validitas melibatkan sebuah keputusan evaluatif yang menyeluruh.

B. Macam-macam Validitas

Di dalam buku Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B. Anderson dan kawan-kawan disebutkan: A test is valid if it measure what it purpose to measure. Atau jika diartikan lebih kurang demikian: sebuah tes dikatakan valid apabila tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia “valid” disebut dengan istilah “sahih”.

Sebenarnya pembicaraan validitas ini bukan ditekankan pada tes itu sendiri tetapi pada hasil pengetesan atau skornya.

Contoh: skor yang diperoleh dari hasil mengukur kemampuan mekanik akan menunjukkan kemampuan seseorang dalam memegang dan memperbaiki mobil, bukan pengetahuan orang tersebut dalam hall yang berkaitan dengan mobil bukanlah tes yang sahih untuk mekanik.

Secara garis besar ada dua macam validitas, yaitu validitas logis dan validitas empiris.

1) Validitas Logis

Istilah “validitas logis” mengandung kata “logis” berasal dari kata “logika” yang berarti penalaran. Dengan makna demikian maka validitas logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi valid tersebut dipandang terpenuhi apabila instrumen yang bersangkutan sudah dirancang secara baik, mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan mengarang, tentu secara logis karangannya sudah baik.

Maka instrumen yang sudah disusun berdasarkan teori penyusunan instrumen, secara logis dapat dikatakan sudah valid. Dari penjelasan tersebut kita dapat memahami bahwa validitas logis dapat dicapai apabila instrumen disusun mengikuti ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah instrumen tersebut selesai disusun.

Ada dua macam validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu: validitas isi dan validitas konstrak. Validitas isi bagi sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi. Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi sebuah instrumen yang disusun berdasarkan konstrak aspek-aspek kejiwaan yang seharusnya dievaluasi. Penjelasan lebih jauh tentang kedua jenis validitas logis ini akan diberikan berturut-turut dalam membahas jenis-jenis validitas instrumen nanti.

2) Validitas Empiris

Istilah “validitas empiris” memuat kata empiris yang artinya “pengalaman”. Sebuah instrumen dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman. Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat apabila dalam pengalaman dibuktikan bahwa orang tersebut sudah banyak menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari penjelasan dan contoh tersebut diketahui bahwa validitas empiris tidak dapat diperoleh hanya dengan menyusun instrumen seperti validitas logis, tetapi harus dibuktikan melalui pengalaman.

Ada dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan untuk menguji bahwa instrumen memang valid. Pengujian tersebut dilakukan dengan membandingkan kondisi instrumen yang bersangkutan dengan kriterium atau sebuah ukuran. Kriterium yang digunakan sebagai pembanding kondisi instrumen dimaksudkan ada dua, yaitu yang sudah tersedia dan yang belum ada tetapi akan terjadi di waktu yang akan datang. Bagi instrumen yang kondisinya sesuai dengan kriterium yang sudah tersedia disebut memiliki validitas “sekarang ada”, yang dalam istilah bahasa Inggris disebut memiliki concurrent validity. Selanjutnya instrumen yang kondisinya sesuai dengan kreterium yang diramalkan akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi, yang dalam istilah bahasa Inggris disebut memiliki prediktive validity.

Dari uraian adanya dua jenis validitas, yakni validitas logis yang ada dua macam, dan validitas empiris yang juga ada dua macam, maka secara keseluruhan kita mengenal adanya empat validitas, yaitu:

(1) Validitas Isi

(2) Validtas Konstrak

(3) Validitas “ada sekarang” dan

(4) Validitas predictive.

Dua yang pertama yakni (1) dan (2) melalui penyusunan berdasarkan ketentuan atau teori, sedangkan dua berikutnya, yakni (3) dan (4) dicapai atau diketahui sesudah dibuktikan melalui pengalaman. Adapun penjelasan masing-masing validitas adalah sebagai berikut.

1) Validitas Isi (content validity)

Sebuah tes dikatakan memiliki validitas isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum maka validitas ini sering juga disebut validitas kurikuler.

Validitas isi dapat diusahakan tercapainya sejak saat penyusunan dengan cara merinci materi kurikulum atau meteri buku pelajaran. Bagaimana cara merinci materi untuk kepentingan diperolehnya validitas isi sebuah tes akan dibicarakan secara mendalam pada waktu menjelaskan cara penyusunan tes.

2) Validitas Konstruksi (construct validity)

Sebuah tes dikatakan memiliki validitas konstruksi apabila butir-butir soal yang membangun dan mengukur setiap aspek berpikir seperti yang disebutkan dalam Tujuan Instruksional Khusus. Sebagai contoh jika Rumusan Tujuan Instruksioanl Khusus (TIK): “Siswa dapat membandingkan antara aspek biologis dan aspek psikologis”, maka butir soal pada tes merupakan perintah agar siswa membedakan antara dua efek tersebut.

Seperti halnya validitas isi, validitas konstruksi dapat diketahui dengan cara merinci dan memasangkan setiap butir soal dengan setiap aspek dalam TIK. Pengerjaannya dilakukan berdasarkan logika, bukan pengalaman. Dalam pembicaraan mengenai penyusunan tes hal ini akan disinggung lagi.

3) Validitas “ada sekarang” (concurrent validity)

Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah “sesuai” tentu ada dua hal yang dipasangkan. Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada (ada sekarang, concurrent).

Dalam membandingkan hasil sebuah tes maka diperlukan suatu kriterium atau alat pembanding. Maka hasil tes merupakan suatu yang dibandingkan. Untuk jelasnya dibawah ini dikemukakan sebagai contoh: misalnya seorang guru ingin mengetahui apakah hasil tes sumatif disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium masa lalu yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.

4) Validitas Prediksi (predictive validity)

Memprediksi artinya meramal, yaitu selalu mengenai hal yang akan datang, jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai kemampuan untuk meramalkan apa yang akan datang.

Misalnya tes masuk Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya kemampuan mengikuti kuliah. Jika nilai tesnya tinggi tentu menjamin akan mampu mengikuti perkuliahan kelak. Sebaliknya seorang calon dikatakan tidak lulus tes karena memiliki nilai tes rendah diperkirakan akan tidak mampu mengikuti perkuliahan yang akan datang.

Sebagai alat pembanding validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta didik mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memiliki nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki validitas prediksi.

C. Faktor-Faktor yang Mempengaruhi Validitas

Banyak faktor yang menyebabkan hasil asesmen tidak valid. Beberapa di

antaranya tampak jelas dan mudah untuk menghindarinya. Tidak ada guru yang

akan berpikir untuk mengukur pengetahuan biologi dengan asesmen matematika.

Demikian pula juga tidak ada guru yang akan mengukur kemampuan memecahkan masalah (problem solving) biologi kelas 7 SMP dengan

menggunakan asesmen yang didesain untuk kelas 12 SMA. Dalam dua contoh

tersebut sudah sangat jelas hasil asesmen akan menjadi tidak valid.

Faktor yang mempengaruhi validitas tes antara lain:

1) Faktor dari dalam tes itu sendiri

Pengujian terhadap butir tes secara hati-hati akan menunjukkan apakah tes

yang digunakan untuk mengukur isi materi atau fungsi -fungsi mental yang akan

diases oleh guru. Bagaimanapun juga, beberapa faktor berikut dapat menjaga

butir tes dari fungsi yang dikehendaki dan dengan demikian juga terjaga dari

rendahnya validitas hasil asesmen. Lima faktor yang pertama dapat diterapkan

sejajar dengan asesmen penampilan siswa secara luas serta tes-tes tradisional.

Lima faktor yang terakhir lebih diterapkan secara langsung terhadap tes pilihan

dan tes dengan jawaban singkat dengan jawaban benar atau salah.

a. Petunjuk yang tidak jelas. Petunjuk yang tidak jelas menyebabkan siswa kehilangan waktu untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak dapat melakukan apa yang seharusnya dilakukan.

b. Penggunaan kosakata dan struktur kalimat yang sulit dimengerti. Penggunaan kosakata atau struktur kalimat yang sulit dimengerti dapat menyebabkan siswa terjebak untuk memahami maksud dari sebuah pertanyaan bukan untuk menyelesaikan pertanyaan itu sendiri.

c. Ambiguitas. Ambiguitas yaitu adanya kemungkinan multi tafsir juga menyebabkan menurunnya validitas sebuah tes. Karena ambiguitas menyebabkan siswa salah dalam menafsirkan kata-kata.

d. Alokasi waktu yang tidak cukup. Seyogyanya sebuah tes memberikan waktu yang cukup bagi siswa untuk mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam menyelesaikan sebuah tes bisa jadi bukan karena siswa tidak mampu untuk menyelesaikan tesnya tetapi karena keterbatasan kesempatan untuk mengerjakannya.

e. Penekanan yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah ditebak kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat validitas soal.

f. Kualitas butir tes yang tidak memadai untuk mengukur hasil belajar. Kualitas yang tidak memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir tingkat tinggi (higher order thinking) jelas tidak cukup hanya digunakan tes yang bersifat untuk mengungkap pengetahuan faktual saja.

g. Susunan tes yang jelek

h. Tes terlalu pendek.

i. Penyusunan butir tes yang tidak runtut.

j. Pola jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya adalah A semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A, D, C, B, A, dan sebagainya.

2) Faktor berfungsinya tes dan prosedur mengajar

Sebuah tes dikatakan valid apabila dapat memenuhi fungsinya sebagai alat evaluasi yang dapat mengukur jangkauan hasil belajar yang dilakukan oleh guru kepada siswa. Tes yang valid juga digunakan sebagai bahan acuan guru dalam melaksanakan pembelajaran agar dapat mencapai tujuan belajar. Hal ini berfungsi untuk membatasi bahasan atau materi yang akan disampaikan agar tidak terlalu melebar pada konteks yang terlalu luas.

3) Faktor administrasi dan penskoran.

Pemberian skor terhadap jawaban siswa (testee) harus dilakukan secara hati-hati jangan sampai salah tulis atau meremehkan selisih angka walaupun hanya sedikit. Hal ini akan menyebabkan hasil pengujian terhadap validitas akan memberikan makna yang berbeda.

4) Faktor tanggapan siswa.

Tanggapan siswa yang tidak serius bisa hanya dijumpai pada saat siswa diminta untuk mengisi sebuah angket. Hal ini akan menyebabkan siswa mengisi angket secara sembarangan karena merasa tidak penting maupun alasan -alasan yang lain. Oleh karena itu berikan angket pada waktu dan kondisi yang tepat .

5) Hakikat kelompok dan kriteria.

Seperti sudah dijelaskan di atas bahwa validitas bersifat spesifik. Sebuah asesmen atau instrumen alat ukur mungkin hanya valid untuk kelompok tertentu saja dan tidak valid untuk kelompok yang lain. Sebagai contoh misalnya sebuah tes diujicobakan pada siswa jurusan akuntansi hasilnya akan berbeda dengan jika diujicobakan pada siswa jurusan IPA.

D. Definisi Reliabilitas

Reliabilitas diterjemahkan dari kata reliability yang berarti hal yang dapat

dipercaya (tahan uji). Sebuah tes dikatakan mempunyai reliabilitas yang tinggi

jika tes tersebut memberikan data hasil yang tetap (ajeg) walaupun diberikan pada

waktu yang berbeda kepada responden yang sama. Hasil tes yang tetap atau

seandainya berubah maka perubahan itu tidak signifikan maka tes tersebut

dikatakan reliabel. Oleh karena itu reliabilitas sering disebut dengan keterpercayaan, keterandalan, keajegan, konsistensi, kestabilan, dan sebagainya.

Seperti diuraikan di atas sebuah alat ukur yang baik harus valid dan

reliabel. Namun demikian validitas lebih penting dibandingkan dengan

reliabilitas. Reliabilitas merupakan penyokong validitas. Sebuah alat ukur yang

valid selalu reliabel. Akan tetapi alat ukur yang reliabel belum tentu valid, seperti

digambarkan pada ilustrasi di atas. Seperti halnya validitas, reliabilitas juga merupakan tingkatan. Tingkat atau kadar reliabilitas dinyatakan dengan koefisien reliabilitas.

E. Cara-cara Mencari Besarnya Reliabilitas

Reliabiltas adalah ketetapan suatu tes apabila diteskan kepada subyek yang sama. Untuk mengetahui ketetapan ini pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga menggunakan rumus korelasi product moment untuk mengetahui validitas, kesejajaran hasil dalam reliabilitas tes.

Kriterium yang digunakan untuk mengetahui ketetapan ada yang berada diluar tes (consistency external) dan pada tes itu sendiri (consistency internal).

1) Metode bentuk paralel (equivalent)

Tes paralel atau tes ekuivalen adalah dua buah tes yang mempunyai kesamaan tujuan, tingkat kesuakaran, dan susunan, tetapi butir-butir soalnya berbeda. Dalam istilah bahasa Inggris disebut alternate-forms method (paralel form).

Dengan metode bentuk paralel ini, dua buah tes yang paralel, misalnya tes Matematika Seri A yang akan dicari reliabilitasnya dan tes Seri B diteskan kepada sekelompok siswa yang sama, kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah yang menunjukkan keofisien reliabiltas tes Seri A. Jika koefisiennya tinngi maka tes tersebut sudah reliabel dan dapat digunakan sebagai alat pengetes yang terandalkan.

Dalam menggunakan metode tes paralel ini pengetes harus menyiapakan dua buah tes, dan masing-masing dicobakan pada kelompok siswa yang sama. Oleh karena itu, ada orang menyebutkan sebagai double test-double-trial-method. Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi disebut adanya practice-effect dan carry-over effect, artinya ada faktor yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.

Kelemahan dari metode ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.

2) Metode Tes Ulang (test-retest method)

Metode tes ulang dilakukan orang untuk menghindari penyusunan dua tes seri. Dalam menggunakan teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi diujicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali maka metode ini dapat disebut dengan single-test-double-trial-method. Kemudian hasil dari kedua tes tersebut dihitung korelasinya.

Untuk tes yang banyak mengungkapkan pengetahuan (ingatan) dan pemahaman, cara ini kurang mengena krena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu, tenggang waktu antara pemberian tes pertama dengan yang kedua menjadi permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa masih banyak ingat masteri. Sebaliknya kalau faktor waktu terlalu lama, maka faktor-faktor atau kondisi tes sudah akan berbeda. Tentu saja faktor-faktor ini akan berpengaruh bila terhadap reliabilitas. Pada umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes yang pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice effect dan carry over effect. Yang penting adalah adanya kesejajaran hasil atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.

Contoh:

Siswa	Tes Pertama		Tes Kedua
Siswa	Skor	Rangking	Skor	Rangking
A B C D E	15 20 9 18 12	3 1 5 2 4	20 25 15 23 18	3 1 5 2 4

Walaupun tampak skornya naik, akan tetapi kenaikannya dialami oleh semua siswa. Metode ini juga disebut self-correlation method (korelasi diri sendiri) karena mengkorelasikan hasil dari tes yang sama.

3) Metode Belah Dua atau Split-half Method

Kelemahan penggunaan metode dua-tes dua kali percobaan dan satu tes dua kali percobaan diatas dengan metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes hanya menggunakan sebuah tes dan dicobakan dua kali. Oleh karena itu, disebut juga single-test-single-trial method.

Berbeda dengan metode pertama dan kedua yang setelah diketemukan koefisien korelasi langsung ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru diketahui reliabilitas setengah tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus Sperman-Brown sebagai berikut.

Contoh:

Di mana:

r_1/21/2= korelasi antara skor-skor setiap belahan tes

r₁₁ = koefisien reliabilitas yang sudah disesuaikan.

Contoh:

Korelasi antara belahan tes = 0,60

Maka reliabilitas tes =

Banyak pemakai metode ini salah membelah hasil tes pada waktu menganalisis. Yang mereka lakukan adalah mengelompokan hasil separo subyek peserta tes dan separo yang lain kemudian hasil kedua kelompok ini dikorelasikan. Yang benar adalah membelah item atau butir soal. Tidak akan keliru kiranya bagi pemakai metode ini harus ingat bahwa banyaknya butir soal harus genap agar dapat dibelah.

Ada dua cara membelah butir soal ini yaitu:

a. Membelah atas item-item genap dan item-item ganjil yang selanjutnya disebut belahan ganjil-genap, dan

b. Membelah atas item-item awal dan item-item akhir yaitu separo jumlah pada nomor-nomor akhir yang selanjutnya disebut belahan awal-akhir.

Selain menggunakan rumus korelasi product moment, dua orang ahli mengajukan rumus lain. Seorng bernama Flanagan menemukan rumus yang perhitungannya menngunakan belah dua ganjil-genap dan seorang lagi bernama Rulon yang rumusnya diterapkan pada data awal-akhir.

Penggunaan rumus Flanagan

Rumus

Di mana:

r₁₁= reliabilitas tes

varians belahan pertama (1) yang dalam hal ini varians skor item ganjil

varians belahan kedua (2) yaitu varians skor item genap

= varians total yaitu skor total

Secara sederhana dapat dipahami bahwa varians adalah standar deviasi kuadrat. Dengan demikian bagi peminat yang menghitung dengan kalkulator statistik varians ini diperoleh dengan menguadratkan standar deviasi. Untuk mereka yang tidak menggunakan kalkulator statistik maka varians dapat dicari dengan rumus sebagai berikut:

Standar deviasi (SD) dapat disebut dengan istilah Indonesia Simpangan Baku (SB). Namun huruf S (B besar) juga dapat dikatakan sudah menyebut standar deviasi. Dalam kalkulator tertera dengan simbol σ.

Bagi yang berminat mencari S dulu untuk mencari varians, dapat menggunakan rumus S, yaitu:

S = standar deviasi

x = Simpangan baku X dan

, yang dicari dari

S² = Varians, selalu dituliskan dalam bentuk kuadrat, karena standar deviasi kuadrat

N = Banyaknya subjek pengikut tes

Penggunaan Rumus Rulon

Rumus: r₁₁ = 1 -

Di mana:

varians beda (verians difference)

difference yaitu perbedaan antara skor belahan pertama (awal( dengan skor belahan kedua (akhir)

Penggunaan Rumus K-R.20

Rumus r₁₁ =

Di mana:

r₁₁= reliabilitas tes secara keseluruhan

p = proporsi subjek yang menjawab item dengan benar

q = proporsi subjek yang menjawab item dengan salah (q = 1- p)

∑pq = jumlha hasil perkalian antara p dan q

p = banyaknya item

S = standar deviasi tes (standar deviasi adalah akar varians)

Dalam buku-buku lain n (n kecil) ini sering diganti dengan huruf k (k kecil), yang juga melambangkan banyaknya item. Demikian juga huruf S sebagai lambang standar deviasi, dituliskan SB sebagai singkatan dari kata “Simpangan Baku.” Maka rumus K-R 20 menjadi:

r₁₁ =

Penggunaan rumus K-R 21

Rumus K-R 21;

r₁₁ =

keterangan

M = Mean atau rerata skor total

Jika dibandingkan reliabilitas yang dihitung dengan K-R 20 dan K-R 21 lebih besar yang pertama. Memang menggunakan rumus K-R 20 cenderung memberikan hasil yang lebih tinggi, tetapi pekerjaan lebih rumit.

Penggunaan Rumus Hoyt

Rumusnya adalah:

r₁₁ = 1 -

atau r₁₁=

r₁₁= Reliabilitas seluruh soal

Vr = Varians Responden

Vs = Varians sisa

Untuk mencari reliabilitas suatu soal dilakukan dengan langkah-langkah sebagai berikut:

Langkah 1: mencari jumlah kuadrat responden dengan rumus:

Jk_(r) =

–

Keterangan:

Jk_(r)= jumlah kuadrat responden

X_t = skor total tiap responden

K = banyaknya item

N = banyaknya responden atau subyek

Langkah 2: mencari jumlah kuadrat item dengan rumus:

Jk_(i)=

Keterangan:

Jk₍₁₎ = Jumlah kuadrat item

∑B²= Jumlah kuadrat jawab benar seluruh item

(∑X_t)²= Kuadrat dari jumlah skor total

Langkah 3: Mencari jumlah kuadrat total dengan rumus

Jk_(t) =

Keterangan:

Jk_(t) = jumlah kuadrat total

∑B = jumlah jawab benar seluruh item

∑S = jumlah jawab salah seluruh item

Langkah 4: mencari jumlah kuadrat sisa, dengan rumus:

Jk_(s) = Jk_(t) – Jk_(r)– J_(i)

Langkah 5: mencari varians responden dan varians sisa dengan tabel F.

Dalam mencari varians ini diperlukan d.b (derajat kebebasan) dari masing-masing sumber varians kemudian d.b ini digunakan sebagai penyebut terhadap setiap jumlah kuadrat untuk memperoleh variansi.

d.b = banyaknya N setiap sumber variansi dikurangi 1.

Jadi Variansi =

Langkah 6: Memasukkan ke dalam rumus r₁₁

_{mencari reliabilitas}tes bentuk uraian

apa yang sudah dibeicarakan didepan atau juga yang banyak terdapat di buku-buku lain, hanya meliputi uraian mengenai reliabilitas tes bentuk objektif, yaitu soal yang terdiri dari butir-butir soal yang dinilai hanya “benar” atau “salah.” Menilai soal bentuk uraian tidak dapat dilakukan seperti itu. Suatu butir soal uraian menghendaki gradualisasi penilaian. Barangkali butir soal nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai tertinggi hanya 5, dan butir soal 3 sampai 10, dan sebagainya.

Untuk keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan analisis butir soal seperti halnya soal bentuk objektif. Skor untuk masing-masing butir soal dicantunkan pada kolom item menurut apa adanya. Rumus yang digunakan adalah rumus Alpha sebagai berikut:

r₁₁=

di mana:

r₁₁ = reliabilitas yang dicari

= jumlah varians skor tiap-tiap item

= varians total

Bagi mahasiswa yang menulis skripsi dan ingin menguji reliabilitas angket yang digunakan untuk mengumpulkan data, rumus Alpha ini dapat juga diterapkan. Kesalahan fatal yang sering kita jumpai adalah penggunaan teknik belah dua untuk menghitung reliabilitas angket. Dalam menggunakan teknik belah dua, peneliti harus selalu ingat persyaratannya, antara lain bahwa belahan pertama dengan belahan kedua yang dicari kesejajaran harus seimbang.

Pack Your Bags and Let's Go!

Kamis, Januari 24, 2013

Validitas dan Reliabilitas

Tidak ada komentar:

Posting Komentar

Followers