A. Definisi
Validitas
Validitas berasal dari bahasa Inggris dari kata validity
yang berarti keabsahan atau kebenaran. Dalam konteks alat ukur atau
instrumen asesmen, validitas berarti sejauh mana kecermatan atau ketepatan alat
ukur dalam
melakukan fungsi ukurnya. Sebuah instrumen yang valid
akan menghasilkan data yang tepat seperti yang diinginkan. Sebagai contoh, jika
kita ingin mengetahui
berat maka alat ukur yang tepat adalah timbangan atau
neraca bukan meteran,
termometer, atau alat yang lain. Dengan kata lain,
sifat valid memberikan
pengertian bahwa alat ukur yang digunakan mampu
memberikan nilai yang sesungguhnya dari apa yang diinginkan.
Contoh di atas barang kali terlalu sederhana dan mudah
untuk mengecek
dan mengendalikannya. Berbeda halnya jika kita akan
melakukan pengukuran
dalam dunia pembelajaran atau dunia pendidikan, tidak
sesederhana seperti pada
pengukuran berat ataupun panjang. Untuk mengetahui
alat ukur prestasi belajar
apakah valid atau tidak maka perlu dipelajari dengan
hati -hati.
Validitas
sangat berkaitan dengan tujuan pengukuran. Validitas tidak
berlaku secara umum bagi semua pengukuran. Suatu tes
mempunyai hasil ukuran
yang baik (valid) untuk suatu tujuan tertentu yang spesifik
tetapi tidak valid
untuk tujuan yang lain atau bahkan untuk tujuan yang
sama pada kelompok yang
lain.
Linn & Gronlund (2000) mengemukakan hakikat
validitas tes dan asesmen
sebagai berikut.
1.
Validitas
menyatakan ketepatan interpretasi hasil bukan pada prosedurnya.
2.
Validitas
merupakan persoalan yang berkaitan dengan derajat (tingkatan),
sebagai konsekuensinya kita harus menghindari
pemikiran hasil asesmen
sebagai valid atau tidak valid. Oleh karena validitas
adalah persoalan
derajad maka sebuah instrumen dapat dikategorikan
mempunyai derajad
validitas tinggi, sedang, dan rendah.
3.
Validitas
selalu bersifat khusus untuk penggunaan atau interpretasi
tertentu. Tidak ada asesmen yang valid untuk semua
tujuan. Sebagai
contoh, hasil tes aritmatika mungkin mempunyai tingkat
validitas yang
tinggi untuk kemampuan hitung, validitas yang r endah
untuk alasan-alasan
aritmatika, dan mempunyai derajat validitas sedang
untuk memprediksi
kesuksesan prestasi matematika yang akan datang.
4.
Validitas
merupakan kesatuan konsep. Hakikat konsep validitas dipandang
sebagai sebuah
kesatuan konsep berdasark an berbagai macam bagian dari fakta.
5.
Validitas
melibatkan sebuah keputusan evaluatif yang menyeluruh.
B. Macam-macam
Validitas
Di dalam buku
Encyclopedia of Educational Evaluation yang ditulis oleh Scarvia B. Anderson
dan kawan-kawan disebutkan: A test is valid if it measure what it purpose to
measure. Atau jika diartikan lebih kurang demikian: sebuah tes dikatakan valid
apabila tes tersebut mengukur apa yang hendak diukur. Dalam bahasa Indonesia
“valid” disebut dengan istilah “sahih”.
Sebenarnya
pembicaraan validitas ini bukan ditekankan pada tes itu sendiri tetapi pada hasil pengetesan atau
skornya.
Contoh: skor yang diperoleh dari
hasil mengukur kemampuan mekanik akan menunjukkan kemampuan seseorang dalam
memegang dan memperbaiki mobil, bukan pengetahuan orang tersebut dalam hall
yang berkaitan dengan mobil bukanlah tes yang sahih untuk mekanik.
Secara garis besar ada
dua macam validitas, yaitu validitas logis dan validitas empiris.
1) Validitas
Logis
Istilah “validitas
logis” mengandung kata “logis” berasal dari kata “logika” yang berarti
penalaran. Dengan makna demikian maka validitas
logis untuk sebuah instrumen evaluasi menunjuk pada kondisi bagi sebuah
instrumen yang memenuhi persyaratan valid berdasarkan hasil penalaran. Kondisi
valid tersebut dipandang terpenuhi apabila instrumen yang bersangkutan sudah dirancang secara baik,
mengikuti teori dan ketentuan yang ada. Sebagaimana pelaksanaan tugas lain
misalnya membuat sebuah karangan, jika penulis sudah mengikuti aturan mengarang,
tentu secara logis karangannya sudah baik.
Maka instrumen yang sudah disusun
berdasarkan teori penyusunan instrumen, secara logis dapat dikatakan sudah valid. Dari
penjelasan tersebut
kita dapat memahami bahwa validitas logis dapat dicapai apabila instrumen
disusun mengikuti ketentuan yang ada. Dengan demikian, dapat disimpulkan bahwa
validitas logis tidak perlu diuji kondisinya tetapi langsung diperoleh sesudah
instrumen tersebut selesai disusun.
Ada dua macam
validitas logis yang dapat dicapai oleh sebuah instrumen, yaitu: validitas isi
dan validitas konstrak. Validitas isi bagi sebuah instrumen menunjuk suatu
kondisi sebuah instrumen yang disusun berdasarkan isi materi pelajaran yang dievaluasi.
Selanjutnya validitas konstrak sebuah instrumen menunjuk suatu kondisi sebuah
instrumen yang disusun berdasarkan konstrak aspek-aspek kejiwaan yang
seharusnya dievaluasi. Penjelasan lebih jauh tentang kedua jenis validitas
logis ini akan diberikan berturut-turut dalam membahas jenis-jenis validitas
instrumen nanti.
2) Validitas
Empiris
Istilah
“validitas empiris” memuat kata empiris yang artinya “pengalaman”. Sebuah
instrumen dikatakan memiliki validitas empiris apabila sudah diuji dari
pengalaman. Sebagai contoh sehari-hari, seseorang dapat diakui jujur oleh masyarakat
apabila dalam pengalaman dibuktikan bahwa orang tersebut sudah banyak
menghasilkan ide-ide baru yang diakui berbeda dari hal-hal yang sudah ada. Dari
penjelasan dan contoh tersebut diketahui bahwa validitas empiris tidak dapat
diperoleh hanya dengan menyusun instrumen seperti validitas logis, tetapi harus
dibuktikan melalui pengalaman.
Ada
dua macam validitas empiris, yakni ada dua cara yang dapat dilakukan untuk
menguji bahwa instrumen memang valid. Pengujian tersebut dilakukan dengan
membandingkan kondisi instrumen yang bersangkutan dengan kriterium atau sebuah
ukuran. Kriterium yang digunakan sebagai pembanding kondisi instrumen
dimaksudkan ada dua, yaitu yang sudah tersedia dan yang belum ada tetapi akan
terjadi di waktu yang akan datang. Bagi instrumen yang kondisinya sesuai dengan kriterium yang
sudah tersedia disebut
memiliki validitas “sekarang ada”, yang dalam istilah bahasa Inggris disebut
memiliki concurrent validity.
Selanjutnya instrumen yang kondisinya sesuai dengan kreterium yang diramalkan
akan terjadi, disebut memiliki validitas ramalan atau validitas prediksi, yang
dalam istilah bahasa Inggris disebut memiliki prediktive validity.
Dari
uraian adanya dua jenis validitas, yakni validitas logis yang ada dua macam,
dan validitas
empiris yang juga ada dua macam, maka
secara keseluruhan kita mengenal adanya empat validitas, yaitu:
(1) Validitas
Isi
(2) Validtas
Konstrak
(3) Validitas
“ada sekarang” dan
(4) Validitas
predictive.
Dua yang pertama yakni (1) dan (2) melalui
penyusunan berdasarkan ketentuan atau teori, sedangkan dua berikutnya, yakni
(3) dan (4) dicapai atau diketahui sesudah dibuktikan melalui pengalaman.
Adapun penjelasan masing-masing validitas adalah sebagai berikut.
1) Validitas
Isi (content validity)
Sebuah tes dikatakan
memiliki validitas
isi apabila mengukur tujuan khusus tertentu yang sejajar dengan materi atau isi
pelajaran yang diberikan. Oleh karena materi yang diajarkan tertera dalam kurikulum
maka validitas ini sering
juga disebut validitas kurikuler.
Validitas isi dapat
diusahakan tercapainya sejak saat penyusunan dengan cara merinci materi
kurikulum atau meteri buku pelajaran. Bagaimana cara merinci materi untuk
kepentingan diperolehnya validitas isi sebuah tes akan dibicarakan secara
mendalam pada waktu menjelaskan cara penyusunan tes.
2) Validitas
Konstruksi (construct validity)
Sebuah tes dikatakan
memiliki validitas konstruksi apabila butir-butir soal yang membangun dan mengukur setiap aspek berpikir seperti
yang disebutkan dalam Tujuan
Instruksional
Khusus.
Sebagai contoh jika Rumusan Tujuan Instruksioanl Khusus (TIK): “Siswa dapat
membandingkan antara aspek
biologis dan aspek psikologis”, maka butir soal pada tes merupakan perintah
agar siswa membedakan antara dua efek tersebut.
Seperti halnya
validitas isi, validitas konstruksi dapat diketahui dengan cara merinci dan
memasangkan setiap butir soal dengan setiap aspek dalam TIK. Pengerjaannya
dilakukan berdasarkan logika, bukan pengalaman. Dalam pembicaraan mengenai
penyusunan tes hal ini akan disinggung lagi.
3) Validitas
“ada sekarang” (concurrent validity)
Validitas ini lebih
umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas
empiris jika hasilnya sesuai dengan pengalaman. Jika ada istilah “sesuai” tentu
ada dua hal yang dipasangkan.
Dalam hal ini hasil tes dipasangkan dengan hasil pengalaman. Pengalaman selalu
mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah
ada (ada sekarang, concurrent).
Dalam membandingkan
hasil sebuah tes maka diperlukan suatu kriterium atau alat pembanding. Maka
hasil tes merupakan suatu yang dibandingkan. Untuk jelasnya dibawah ini
dikemukakan sebagai contoh: misalnya seorang guru ingin mengetahui apakah hasil tes sumatif
disusun sudah valid atau belum. Untuk ini diperlukan sebuah kriterium masa lalu
yang sekarang datanya dimiliki. Misalnya nilai ulangan harian atau nilai
ulangan sumatif yang lalu.
4) Validitas
Prediksi (predictive validity)
Memprediksi artinya
meramal, yaitu
selalu mengenai hal yang akan datang, jadi sekarang belum terjadi. Sebuah tes
dikatakan memiliki validitas prediksi atau validitas ramalan apabila mempunyai
kemampuan untuk meramalkan apa yang akan datang.
Misalnya tes masuk
Perguruan Tinggi adalah sebuah tes yang diperkirakan mampu meramalkan
keberhasilan peserta tes dalam mengikuti kuliah dimasa yang akan datang. Calon
yang tersaring berdasarkan hasil tes diharapkan mencerminkan tinggi-rendahnya
kemampuan mengikuti kuliah. Jika
nilai tesnya tinggi tentu menjamin akan mampu mengikuti perkuliahan kelak. Sebaliknya
seorang calon dikatakan tidak lulus tes karena memiliki nilai tes rendah diperkirakan
akan tidak mampu mengikuti perkuliahan yang akan datang.
Sebagai alat pembanding
validitas prediksi adalah nilai-nilai yang diperoleh setelah peserta didik
mengikuti pelajaran di Perguruan Tinggi. Jika ternyata siapa yang memiliki
nilai tes lebih tinggi gagal dalam ujian semester I dibandingkan dengan yang
dahulu nilai tesnya lebih rendah maka tes masuk yang dimaksud tidak memiliki
validitas prediksi.
C. Faktor-Faktor
yang Mempengaruhi Validitas
Banyak faktor yang menyebabkan hasil asesmen tidak
valid. Beberapa di
antaranya tampak jelas dan mudah untuk menghindarinya.
Tidak ada guru yang
akan berpikir untuk mengukur pengetahuan biologi
dengan asesmen matematika.
Demikian pula juga tidak ada guru yang akan mengukur
kemampuan memecahkan masalah (problem solving) biologi kelas 7 SMP
dengan
menggunakan asesmen yang didesain untuk kelas 12 SMA.
Dalam dua contoh
tersebut sudah sangat jelas hasil asesmen akan menjadi
tidak valid.
Faktor yang mempengaruhi validitas tes antara lain:
1) Faktor
dari dalam tes itu sendiri
Pengujian terhadap butir tes secara hati-hati akan
menunjukkan apakah tes
yang digunakan untuk mengukur isi materi atau fungsi
-fungsi mental yang akan
diases oleh guru. Bagaimanapun juga, beberapa faktor
berikut dapat menjaga
butir tes dari fungsi yang dikehendaki dan dengan
demikian juga terjaga dari
rendahnya validitas hasil asesmen. Lima faktor yang
pertama dapat diterapkan
sejajar dengan asesmen penampilan siswa secara luas
serta tes-tes tradisional.
Lima faktor yang terakhir lebih diterapkan secara
langsung terhadap tes pilihan
dan tes dengan jawaban singkat dengan jawaban benar
atau salah.
a.
Petunjuk
yang tidak jelas. Petunjuk yang tidak jelas menyebabkan siswa kehilangan waktu
untuk sekedar memahami petunjuk pengerjaan atau bahkan tidak dapat melakukan
apa yang seharusnya dilakukan.
b.
Penggunaan
kosakata dan struktur kalimat yang sulit dimengerti. Penggunaan kosakata atau
struktur kalimat yang sulit dimengerti dapat menyebabkan siswa terjebak untuk memahami
maksud dari sebuah pertanyaan bukan untuk menyelesaikan pertanyaan itu sendiri.
c.
Ambiguitas.
Ambiguitas yaitu adanya kemungkinan multi tafsir juga menyebabkan menurunnya
validitas sebuah tes. Karena ambiguitas menyebabkan siswa salah dalam
menafsirkan kata-kata.
d.
Alokasi
waktu yang tidak cukup. Seyogyanya sebuah tes memberikan waktu yang cukup bagi
siswa untuk mengerjakan seluruh butir tes yang ada. Kekurangan waktu dalam
menyelesaikan sebuah tes bisa jadi bukan karena siswa tidak mampu untuk
menyelesaikan tesnya tetapi karena keterbatasan kesempatan untuk mengerjakannya.
e.
Penekanan
yang berlebihan terhadap aspek tertentu, sehingga terlalu mudah ditebak
kecenderungan dari jawaban soal akan menyebabkan menurunnya tingkat validitas
soal.
f.
Kualitas
butir tes yang tidak memadai untuk mengukur hasil belajar. Kualitas yang tidak
memadai misalnya tes dimaksudkan untuk megukur kemampuan berpikir tingkat
tinggi (higher order thinking) jelas tidak cukup hanya digunakan tes
yang bersifat untuk mengungkap pengetahuan faktual saja.
g.
Susunan
tes yang jelek
h.
Tes
terlalu pendek.
i.
Penyusunan
butir tes yang tidak runtut.
j.
Pola
jawaban yang mudah ditebak, misalnya pada soal pilihan ganda jawabannya adalah
A semua, atau B semua atau menunjukkan pola tertentu misalnya D, C, B, A, D, C,
B, A, dan sebagainya.
2)
Faktor
berfungsinya tes dan prosedur mengajar
Sebuah tes dikatakan valid apabila dapat memenuhi
fungsinya sebagai alat evaluasi yang dapat mengukur jangkauan hasil belajar
yang dilakukan oleh guru kepada siswa. Tes yang valid juga digunakan sebagai
bahan acuan guru dalam melaksanakan pembelajaran agar dapat mencapai tujuan
belajar. Hal ini berfungsi untuk membatasi bahasan atau materi yang akan
disampaikan agar tidak terlalu melebar pada konteks yang terlalu luas.
3)
Faktor
administrasi dan penskoran.
Pemberian
skor terhadap jawaban siswa (testee)
harus dilakukan secara hati-hati jangan sampai salah tulis atau meremehkan
selisih angka walaupun hanya sedikit. Hal ini akan menyebabkan hasil pengujian
terhadap validitas akan memberikan makna yang berbeda.
4)
Faktor
tanggapan siswa.
Tanggapan
siswa yang tidak serius bisa hanya dijumpai pada saat siswa diminta untuk
mengisi sebuah angket. Hal ini akan menyebabkan siswa mengisi angket secara
sembarangan karena merasa tidak penting maupun alasan -alasan yang lain. Oleh
karena itu berikan angket pada waktu dan kondisi yang tepat .
5)
Hakikat
kelompok dan kriteria.
Seperti
sudah dijelaskan di atas bahwa validitas bersifat spesifik. Sebuah asesmen atau
instrumen alat ukur mungkin hanya valid untuk kelompok tertentu saja dan tidak
valid untuk kelompok yang lain. Sebagai contoh misalnya sebuah tes diujicobakan
pada siswa jurusan akuntansi hasilnya akan berbeda dengan jika diujicobakan
pada siswa jurusan IPA.
D. Definisi
Reliabilitas
Reliabilitas diterjemahkan dari kata reliability yang
berarti hal yang dapat
dipercaya (tahan uji). Sebuah tes dikatakan mempunyai
reliabilitas yang tinggi
jika tes tersebut memberikan data hasil yang tetap (ajeg) walaupun diberikan pada
waktu yang berbeda kepada responden yang sama. Hasil
tes yang tetap atau
seandainya berubah maka perubahan itu tidak signifikan
maka tes tersebut
dikatakan reliabel. Oleh karena itu reliabilitas
sering disebut dengan keterpercayaan, keterandalan, keajegan, konsistensi,
kestabilan, dan sebagainya.
Seperti diuraikan di atas sebuah alat ukur yang baik
harus valid dan
reliabel. Namun demikian validitas lebih penting
dibandingkan dengan
reliabilitas. Reliabilitas merupakan penyokong
validitas. Sebuah alat ukur yang
valid selalu reliabel. Akan tetapi alat ukur yang
reliabel belum tentu valid, seperti
digambarkan pada ilustrasi di atas. Seperti halnya
validitas, reliabilitas juga merupakan tingkatan. Tingkat atau kadar
reliabilitas dinyatakan dengan koefisien reliabilitas.
E. Cara-cara
Mencari Besarnya Reliabilitas
Reliabiltas adalah
ketetapan suatu tes apabila diteskan kepada subyek yang sama. Untuk mengetahui ketetapan ini
pada dasarnya dilihat kesejajaran hasil. Seperti halnya beberapa teknik juga
menggunakan rumus korelasi product moment untuk mengetahui validitas, kesejajaran hasil
dalam reliabilitas tes.
Kriterium yang
digunakan untuk mengetahui ketetapan ada yang berada diluar tes (consistency external) dan pada tes itu
sendiri (consistency internal).
1) Metode
bentuk paralel (equivalent)
Tes paralel atau tes ekuivalen adalah dua buah tes yang
mempunyai kesamaan tujuan, tingkat kesuakaran, dan susunan, tetapi butir-butir
soalnya berbeda. Dalam istilah bahasa Inggris disebut alternate-forms method
(paralel form).
Dengan metode bentuk paralel
ini, dua buah tes yang paralel, misalnya tes Matematika Seri A yang akan dicari
reliabilitasnya dan tes Seri B diteskan kepada sekelompok siswa yang sama,
kemudian hasilnya dikorelasikan. Koefisien korelasi dari kedua hasil tes inilah
yang menunjukkan keofisien reliabiltas tes Seri A. Jika koefisiennya tinngi
maka tes tersebut sudah reliabel dan dapat digunakan sebagai alat pengetes yang
terandalkan.
Dalam menggunakan
metode tes paralel ini pengetes harus menyiapakan dua buah tes, dan masing-masing dicobakan pada
kelompok siswa yang sama. Oleh karena itu, ada orang menyebutkan sebagai double test-double-trial-method.
Penggunaan metode ini baik karena siswa dihadapkan kepada dua macam tes
sehingga tidak ada faktor “masih ingat soalnya” yang dalam evaluasi disebut
adanya practice-effect dan carry-over effect, artinya ada faktor
yang dibawa oleh pengikut tes karena sudah mengerjakan soal tersebut.
Kelemahan dari metode
ini adalah bahwa pengetes pekerjaannya berat karena harus menyusun dua seri
tes. Lagi pula harus tersedia waktu yang lama untuk mencobakan dua kali tes.
2) Metode
Tes Ulang (test-retest method)
Metode tes ulang
dilakukan orang untuk menghindari penyusunan dua tes seri. Dalam menggunakan
teknik atau metode ini pengetes hanya memiliki satu seri tes tetapi
diujicobakan dua kali. Oleh karena tesnya hanya satu dan dicobakan dua kali
maka metode ini dapat disebut dengan single-test-double-trial-method.
Kemudian hasil dari kedua tes tersebut dihitung korelasinya.
Untuk tes yang banyak
mengungkapkan pengetahuan (ingatan) dan pemahaman, cara ini kurang mengena
krena tercoba akan masih ingat akan butir-butir soalnya. Oleh karena itu,
tenggang waktu antara pemberian tes pertama dengan yang kedua menjadi
permasalahan tersendiri. Jika tenggang waktu terlalu sempit, siswa masih banyak
ingat masteri. Sebaliknya kalau faktor waktu terlalu lama, maka faktor-faktor
atau kondisi tes sudah akan berbeda. Tentu saja faktor-faktor ini akan berpengaruh bila terhadap reliabilitas. Pada
umumnya hasil tes yang kedua cenderung lebih baik daripada hasil tes yang
pertama. Hal ini tidak mengapa karena pengetes harus sadar akan adanya practice effect dan carry over effect. Yang penting adalah adanya kesejajaran hasil
atau ketetapan hasil yang ditunjukkan oleh koefisien korelasi yang tinggi.
Contoh:
|
Siswa
|
Tes
Pertama
|
Tes
Kedua
|
||
|
Skor
|
Rangking
|
Skor
|
Rangking
|
|
|
A
B
C
D
E
|
15
20
9
18
12
|
3
1
5
2
4
|
20
25
15
23
18
|
3
1
5
2
4
|
Walaupun tampak skornya naik, akan tetapi kenaikannya
dialami oleh semua siswa. Metode ini juga disebut self-correlation method (korelasi diri sendiri) karena
mengkorelasikan hasil dari tes yang sama.
3) Metode
Belah Dua atau Split-half Method
Kelemahan penggunaan
metode dua-tes dua kali percobaan dan satu tes dua kali percobaan diatas dengan
metode ketiga ini yaitu metode belah dua. Dalam menggunakan metode ini pengetes
hanya menggunakan sebuah tes dan dicobakan dua kali. Oleh karena itu, disebut
juga single-test-single-trial method.
Berbeda dengan metode
pertama dan kedua yang setelah diketemukan koefisien korelasi langsung
ditafsirkan itulah koefisien reliabilitas, maka dengan metode ketiga ini tidak
dapat demikian. Pada waktu membelah dua dan mengkorelasikan dua belahan, baru
diketahui reliabilitas setengah
tes. Untuk mengetahui reliabilitas seluruh tes harus digunakan rumus
Sperman-Brown sebagai berikut.
Contoh:

Di mana:
r1/21/2
= korelasi antara skor-skor setiap belahan tes
r11
= koefisien reliabilitas yang sudah disesuaikan.
Contoh:
Korelasi
antara belahan tes = 0,60
Maka
reliabilitas tes = 
Banyak pemakai metode ini salah
membelah hasil tes pada waktu menganalisis. Yang mereka lakukan adalah
mengelompokan hasil separo subyek peserta tes dan separo yang lain kemudian
hasil kedua kelompok ini dikorelasikan.
Yang benar adalah membelah item atau butir soal. Tidak akan keliru kiranya bagi
pemakai metode ini harus ingat bahwa banyaknya butir soal harus genap agar
dapat dibelah.
Ada dua cara membelah butir soal ini
yaitu:
a. Membelah atas item-item genap dan
item-item ganjil yang selanjutnya disebut belahan ganjil-genap, dan
b. Membelah atas item-item awal dan
item-item akhir yaitu separo jumlah pada nomor-nomor akhir yang selanjutnya
disebut belahan awal-akhir.
Selain menggunakan rumus korelasi
product moment, dua orang ahli mengajukan rumus lain. Seorng bernama Flanagan menemukan rumus yang
perhitungannya menngunakan belah dua ganjil-genap dan seorang lagi bernama Rulon yang rumusnya diterapkan pada
data awal-akhir.
Penggunaan rumus Flanagan
Rumus 
Di mana:
r11 = reliabilitas tes
Secara sederhana dapat dipahami
bahwa varians adalah standar deviasi kuadrat. Dengan demikian bagi peminat yang
menghitung dengan kalkulator statistik
varians ini diperoleh dengan menguadratkan standar deviasi. Untuk mereka yang
tidak menggunakan kalkulator statistik maka varians dapat dicari dengan rumus
sebagai berikut:

Standar deviasi (SD) dapat disebut
dengan istilah Indonesia Simpangan Baku (SB). Namun huruf S (B besar) juga
dapat dikatakan sudah menyebut standar deviasi. Dalam kalkulator tertera dengan
simbol σ.
Bagi yang berminat mencari S dulu
untuk mencari varians, dapat menggunakan rumus S, yaitu:
S = standar deviasi
x = Simpangan baku X dan
, yang dicari dari 
S2 = Varians, selalu
dituliskan dalam bentuk kuadrat, karena standar deviasi kuadrat
N = Banyaknya subjek pengikut tes
Penggunaan
Rumus Rulon
Rumus: r11 = 1 - 
Di mana:
Penggunaan
Rumus K-R.20
Rumus r11 = 
Di mana:
r11=
reliabilitas tes secara keseluruhan
p =
proporsi subjek yang menjawab item dengan benar
q =
proporsi subjek yang menjawab item dengan salah (q = 1- p)
∑pq =
jumlha hasil perkalian antara p dan q
p =
banyaknya item
S =
standar deviasi tes (standar deviasi adalah akar varians)
Dalam buku-buku lain n (n kecil) ini
sering diganti dengan huruf k (k kecil), yang juga melambangkan banyaknya item.
Demikian juga huruf S sebagai lambang standar deviasi, dituliskan SB sebagai
singkatan dari kata “Simpangan Baku.” Maka rumus K-R 20 menjadi:
r11
= 
Penggunaan
rumus K-R 21
Rumus K-R
21;
r11
= 
keterangan
M = Mean
atau rerata skor total
Jika
dibandingkan reliabilitas yang dihitung dengan K-R 20 dan K-R 21 lebih besar
yang pertama. Memang menggunakan rumus K-R 20 cenderung memberikan hasil yang
lebih tinggi, tetapi pekerjaan lebih rumit.
Penggunaan Rumus Hoyt
Rumusnya
adalah:
r11
= 1 -
atau
r11 = 
r11 =
Reliabilitas seluruh soal
Vr =
Varians Responden
Vs =
Varians sisa
Untuk mencari reliabilitas suatu
soal dilakukan dengan langkah-langkah sebagai berikut:
Langkah
1: mencari
jumlah kuadrat responden dengan rumus:
Jk(r)
=
– 
Keterangan:
Jk(r)
= jumlah kuadrat responden
Xt
= skor total tiap responden
K
= banyaknya item
N
= banyaknya responden atau subyek
Langkah 2: mencari jumlah kuadrat item dengan rumus:
Jk(i)
=
- 
Keterangan:
Jk(1)
= Jumlah kuadrat item
∑B2
= Jumlah kuadrat jawab benar seluruh item
(∑Xt)2
= Kuadrat dari jumlah skor total
Langkah
3: Mencari
jumlah kuadrat total dengan rumus
Jk(t)
= 
Keterangan:
Jk(t)
= jumlah kuadrat total
∑B
= jumlah jawab benar seluruh item
∑S
= jumlah jawab salah seluruh item
Langkah
4: mencari
jumlah kuadrat sisa, dengan rumus:
Jk(s)
= Jk(t) – Jk(r) – J(i)
Langkah
5: mencari
varians responden dan varians sisa dengan tabel F.
Dalam
mencari varians ini diperlukan d.b (derajat kebebasan) dari masing-masing
sumber varians kemudian d.b ini digunakan sebagai penyebut terhadap setiap
jumlah kuadrat untuk memperoleh variansi.
d.b
= banyaknya N setiap sumber variansi dikurangi 1.
Jadi
Variansi = 
Langkah
6:
Memasukkan ke dalam rumus r11
mencari reliabilitas tes bentuk uraian
apa
yang sudah dibeicarakan didepan atau juga yang banyak terdapat di buku-buku
lain, hanya meliputi uraian mengenai reliabilitas tes bentuk objektif, yaitu
soal yang terdiri dari butir-butir soal yang dinilai hanya “benar” atau
“salah.” Menilai soal bentuk uraian tidak dapat dilakukan seperti itu. Suatu
butir soal uraian menghendaki gradualisasi penilaian. Barangkali butir soal
nomor 1 penilaian terendah 0 tertinggi 8, tetapi butir soal nomor 2 nilai
tertinggi hanya 5, dan butir soal 3 sampai 10, dan sebagainya.
Untuk
keperluan mencari reliabilitas soal keseluruhan perlu juga dilakukan analisis
butir soal seperti halnya soal bentuk objektif. Skor untuk masing-masing butir
soal dicantunkan pada kolom item menurut apa adanya. Rumus yang digunakan
adalah rumus Alpha sebagai berikut:
r11
=
di
mana:
r11
= reliabilitas yang dicari
Bagi
mahasiswa yang menulis skripsi dan ingin menguji reliabilitas angket yang
digunakan untuk mengumpulkan data, rumus Alpha ini dapat juga diterapkan.
Kesalahan fatal yang sering kita jumpai adalah penggunaan teknik belah dua
untuk menghitung reliabilitas angket. Dalam menggunakan teknik belah dua,
peneliti harus selalu ingat persyaratannya, antara lain bahwa belahan pertama
dengan belahan kedua yang dicari kesejajaran harus seimbang.
Tidak ada komentar:
Posting Komentar
komen o yo rek,, *suwun