A. Validitas
1. Pengertian
Validitas merupakan suatu ukuran yang
menunjukkan kevalidan atau kesahihan suatu instrument. Jadi pengujian validitas
itu mengacu pada sejauh mana suatu instrument dalam menjalankan fungsi.
Instrument dikatakan valid jika instrument tersebut dapat digunakan untuk
mengukur apa yang hendak diukur (Sugiyono, 2006).
Sebagai contoh ingin mengukur kemampuan siswa dalam matematika.
Kemudian diberikan soal dengan kalimat yang panjang dan yang berbelit-belit
sehingga sukar ditangkap maknanya. Akhimya siswa tidak dapat menjawab, akibat
tidak memahami pertanyaannya. Contoh lain yaitu peneliti ingin mengukur
kemampuan berbicara, tapi ditanya mengenai tata bahasa atau kesusastraan
seperti puisi atau sajak. Pengukur tersebut tidak tepat (valid). Validitas
tidak berlaku universal sebab bergantung pada situasi dan tujuan penelitian.
Instrumen yang telah valid untuk suatu tujuan tertentu belum otomatis akan
valid untuk tujuan yang lain.
2. Macam-macam
Validitas
Menurut Sugiyono (2006) ada tiga jenis
validitas yang sering digunakan dalam penyusunan instrumen, yaitu:
a.
Validitas isi
Validitas
isi berkenaan dengan kesanggupan instrumen mengukur isi yang harus diukur.
Artinya, alat ukur tersebut mampu mengungkap isi suatu konsep atau variabel
yang hendak diukur. Misalnya tes hasil belajar bidang studi IPS, harus bisa
mengungkap isi bidang studi tersebut. Hal ini bisa dilakukan dengan cara
menyusun tes yang bersumber dari kurikulum bidang studi yang hendak diukur. Di
samping kurikulum dapat juga diperkaya dengan melihat atau mengkaji buku
sumber. Sehingga tes hasil belajar tidak mungkin dapat mengungkap semua materi
yang ada dalam bidang studi tertentu sekalipun hanya untuk satu semester. Oleh
sebab itu harus diambil sebagian dari materi dalam bentuk sampel tes. Sebagai
sampel maka harus dapat mencerminkan materi yang terkandung dari seluruh materi
bidang studi. Cara yang ditempuh dalam menetapkan sampel tes adalah memilih
konsep-konsep yang esensial dari materi yang di dalamnya. Misalnya menetapkan
sejumlah konsep dari setiap pokok bahasan yang ada. Dari setiap konsep
dikembangkan beberapa pertanyaan tes (lihat bagan). Di sinilah pentingnya
peranan kisi-kisi sebagai alat untuk memenuhi validitas isi.
TES HASIL BELAJAR
Bidang studi : ....................
Semester :
....................
Kelas :
....................
Pokok
bahasan
untuk
satu
semester
sesuai
dengan kurikulum
|
Konsep
atau
materi
esensial
|
Jumlah
pertanyaan
|
Jenis tes
|
abilitas
yang
diakui
|
Pokok bahasan 1
|
1.1
……....
|
3 soal
|
Pilihan
ganda
Aplikasi
dan
seterusnya
|
Aplikasi
dan
seterusnya
|
Pokok
bahasan 2
|
1.2
……..
|
2 soal
|
||
Pokok
bahasan 2
|
2.1
………
2.2
………
|
2 soal
3 soal
|
||
Pokok
bahasan
3
|
3.1
………
3.2
………
|
3 soal
2 soal
|
Dalam
hal tertentu tes yang telah disusun sesuai dengan kurikulum
(materi
dan tujuannya) agar memenuhi validitas isi, peneliti atau pemakai tes dapat
meminta bantuan ahli bidang studi untuk menelaah apakah konsep materi yang
diajukan telah memadai atau tidak, sebagai sampel tes. Dengan demikian
validitas isi tidak memerlukan uji coba dan analisis
statistik
atau dinyatakan dalam bentuk angka-angka.
b. Validitas bangun pengertian (Construct validity)
Validitas bangun pengertian (Construct
validity) berkenaan dengan kesanggupan alat ukur mengukur
pengertian-pengertian yang terkandung dalam materi yang diukurnya.
Pengertian-pengertian yang terkandung dalam konsep kemampuan, minat, sebagai
variabel penelitian dalam berbagai bidang kajian harus jelas apa yang hendak
diukurnya. Konsep-konsep tersebut masih abstrak, memerlukan penjabaran yang
lebih spesifik, sehingga mudah diukur. Ini berarti setiap konsep harus
dikembangkan indikator-indikatomya. Dengan adanya indikator dari setiap konsep
maka bangun pengertian akan nampak dan memudahkan dalam menetapkan cara
pengukuran. Untuk variabel tertentu, dimungkinkan penggunaan alat ukur yang
beraneka ragam dengan cara mengukurnya yang berlainan.
Menetapkan indikator suatu konsep dapat
dilakukan dalam dua cara, yakni
1) Menggunakan
pemahaman atau logika berpikir atas dasar teori pengetahuan ilmiah
2) Menggunakan
pengalaman empiris, yakni apa yang terjadi dalam kehidupan nyata.
Contohnya yaitu Konsep mengenai “Hubungan
Sosial”, dilihat dari pengalaman, indikatornya empiris adalah keterkaitan dari:
1) Bisa
bergaul dengan orang lain
2) Disenangi
atau banyak teman-temannya
3) Menerima
pendapat orang lain
4) Tidak
memaksakan pendapatnya
5) Bisa
bekerja sama dengan siapa pun
6) Dan
lain-lain.
Mengukur
indikator-indikator tersebut, berarti mengukur bangun pengertian yang terdapat
dalam konsep hubungan sosial. Contoh lain yaitu konsep sikap dapat dilihat dari
indikatornya secara teoretik (deduksi teori) antara lain keterkaitan dari:
1) Kesediaan
menerima stimulus objek sikap
2) Kemauan
mereaksi stimulus objek sikap
3) Menilai
stimulus objek sikap
4) Menyusun/mengorganisasi
objek sikap
5) Internalisasi
nilai yang ada dalam objek sikap.
Apabila hasil tes
menunjukkan indikator-indikator tes yang tidak berhubungan secara positif satu
sama lain, berarti ukuran tersebut tidak memiliki validitas bangun pengertian.
Atas dasar itu indikatornya perlu ditinjau atau diperbaiki kembali. Cara lain
untuk menetapkan validitas bangun pengertian suatu alat ukur adalah
menghubungkan (korelasi) antara alat ukur yang dibuat dengan alat ukur yang
sudah baku atau standardized, seandainya telah ada yang baku. Bila
menunjukkan koefisien korelasi yang tinggi maka alat ukur tersebut memenuhi
validitasnya..
c. Validitas ramalan (predictive validity)
Validitas
ramalan artinya dikaitkan dengan kriteria tertentu. Dalam validitas ini yang
diutamakan bukan isi tes tapi kriterianya, apakah alat ukur tersebut dapat
digunakan untuk meramalkan suatu ciri atau perilaku tertentu atau kriteria
tertentu yang diinginkan. Misalnya alat ukur motivasi belajar, apakah dapat
digunakan untuk meramal prestasi belajar yang dicapai. Artinya terdapat
hubungan yang positif antara motivasi dengan prestasi. Dengan kata lain dalam
validitas ini mengandung ciri adanya relevansi dan keajegan atau ketetapan
(reliability). Motivasi dapat digunakan meramal prestasi bila skor-skor yang
diperoleh dari ukuran motivasi berkorelasi positif dengan skor prestasi.
Validitas ramalan ini mengandung dua makna. Pertama validitas jangka pendek dan
kedua jangka panjang. Validitas jangka pendek, artinya daya ramal alat ukur
tersebut hanya untuk masa yang tidak lama. Artinya, skor tersebut berkorelasi
pada waktu yang sama. Misalnya, ketetapan (reliability) terjadi pada semester
dua artinya daya ramal berlaku pada semester dua, dan belum tentu terjadi pada
semester berikutnya. Sedangkan validitas jangka panjang mengandung makna skor
tersebut akan berkorelasi juga di kemudian hari. Mengingat validitas ini lebih
menekankan pada adanya korelasi, maka faktor yang berkenaan dongan persyaratan
terjadinya korelasi harus dipenuhi. Faktor tersebut antara lain hubungan dari
konsep dan variabel dapat dijelaskan berdasarkan pengetahuan ilmiah, minimal
masuk akal sehat dan tidak mengada-ada. Faktor lain adalah skor yang
dikorelasikan memenuhi linieritas. Ketiga validitas yang dijelaskan di atas
idealnya dapat digunakan dalam menyusun instrumen penelitian, minimal dua
validitas, yakni validitas isi dan validitas bangun pengertian. Validitas isi
dan bangun pengertian mutlak diperlukan dan bisa diupayakan tanpa melakukan
pengujian secara statistika.
3.
Faktor-faktor
yang Mempengaruhi Validitas
Banyak
faktor yang dapat mempengaruhi hasil tes evaluasi tidak valid. Beberapa faktor
tersebut secara garis besar dapat dibedakan menurut sumbernya, yaitu faktor
internal dari tes, faktor eksternal tes, dan faktor yang berasal dari responden
yang bersangkutan (Sukardi, 2008).
1) Faktor
yang berasal dari dalam tes
a) Arahan tes
yang disusun dengan makna tidak jelas sehingga dapat mengurangi validitas tes
b) Kata-kata
yang digunakan dalam struktur instrument evaluasi, tidak terlalu sulit
c) Item tes
dikonstruksi dengan jelas.
d) Tingkat
kesulitan item tes tidak tepat dengan materi pembelajaran yang diterima siswa.
e) Waktu yang
dialokasikan tidak tepat, hal ini termasuk kemungkinan terlalu kurang atau
terlalu longgar.
f) Jumlah item
terlalu sedikit sehingga tidak mewakili sampel
g) Jawaban
masing-masing item evaluasi bisa diprediksi responden
2)
Faktor yang berasal dari administrasi dan
skor tes.
a)
Waktu pengerjaan tidak cukup sehingga responden dalam
memberikan jawaban dalam situasi tergesa-gesa.
b) Adanya kecurangan
dalam tes.
c) Pemberian
petunjuk dari dari pengawas yang tidak dapat dilakukan pada semua responden.
d) Teknik
pemberian skor yang tidak konsisten.
e) Responden
tidak dapat memngikuti arahan yang diberikan dalam tes baku.
f) Adanya joki
(orang lain bukan siswa) yang masuk dalam menjawab item tes yang diberikan.
3)
Faktor yang berasal dari jawaban
responden.
Seringkali terjadi bahwa interpretasi
terhadap item-item tes evaluasi tidak valid, karena dipengaruhi oleh jawaban
responden dari pada interpretasi item-item pada tes evaluasi.
4.
Cara Menentukan Validitas
a.
Cara Menentukan Validitas dengan Menggunakan Rumus
Menurut Arikunto (2002) perhitungan
validitas dari sebuah instrumen dapat menggunakan rumus korelasi product
moment atau dikenal juga dengan korelasi pearson. Adapun rumusnya
adalah sebagai berikut :
rxy
= koefisien korelasi
N
= jumlah responden uji coba
X
= skor tiap item
Y
= skor seluruh item responden uji coba
Untuk
menginterpretasikan tingkat validitas, maka koefisien korelasi dikategorikan
pada kriteria sebagai berikut:
Kriteria
Validitas Instrumen Tes
Nilai r
|
Interpretasi
|
0,81 – 1,00
|
Sangat Tinggi
|
0,61 – 0,80
|
Tinggi
|
0,41 – 0,60
|
Cukup
|
0,21 – 0,40
|
Rendah
|
0,00 – 0,20
|
Sangat Rendah
|
Setelah harga koefisien
validitas tiap butir soal diperoleh, kemudian hasil diatas dibandingkan dengan
nilai r dari tabel pada taraf signifikansi 5% dan taraf signifikansi 1% dengan
df= N-2. Instrumen
penelitian dikatakan valid apabila r hitung lebih besar dari r tabel dan dikatakan
tidak valid jika r hitung lebih
kecil dari r tabel dengan tingkat kemaknaan 5%.
5.
Kegunaan Validitas
Kegunaan validitas menurut Arikunto (2002) adalah:
a. Untuk
menghindari pertanyaan yang kurang jelas
b. Untuk
meniadakan kata-kata yang terlalu asing atau kata-kata yang menimbulkan
kecurigaan
c. Untuk
memperbaiki pertanyaan-pertanyaan yang kurang jelas
d. Untuk
menambah item yang diperlukan atau meniadakan item yang dianggap tidak relevan
e. Untuk
mengetahui validitas kuesioner tersebut
B.
Reliabilitas
1. Pengertian
Reliabilitas berasal dari kata reliability
berarti sejauh mana hasil suatu pengukuran dapat dipercaya. Suatu hasil
pengukuran dapat dipercaya apabila dalam beberapa kali pelaksanaan pengukuran
terhadap kelompok subyek yang sama, diperoleh hasil pengukuran yang relatif
sama, selama aspek yang diukur dalam diri subyek memang belum berubah. Reliabilitas
ukuran menyangkut seberapa jauh skor deviasi individu, atau skor-z, relatif
konsisten apabila dilakukan pengulangan pengadministrasian dengan tes yang sama
atau tes yang ekivalen. Reliabilitas berguna untuk mengetahui atau menunjukkan
keajegan suatu tes dalam mengukur gejala yang sama pada waktu dan kesempatan
yang berbeda. (Usman,2003).
Azwar (2003) menyatakan bahwa reliabilitas
merupakan salah satu ciri atau karakter utama instrumen pengukuran yang baik. Suatu
tes dikatakan reliabel jika selalu memberikan hasil yang sama bila diteskan
pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Reliabilitas
alat ukur adalah ketetapan atau keajegan alat tersebut dalam mengukur apa yang
diukurnya. Artinya, kapan pun alat ukur tersebut digunakan akan memberikan
hasil ukur yang sama. Contoh paling nyata adalah timbangan atau meteran. Hal
yang sama terjadi untuk alat ukur suatu gejala, tingkah laku, ciri atau sifat
individu dan lain-lain. Misalnya alat ukur prestasi belajar seperti tes hasil
belajar, alat ukur sikap, kuesioner dan lain-lain, hendaknya meneliti sifat
keajegan tersebut. Tes hasil belajar dikatakan ajeg apabila hasil pengukuran
saat ini menunjukkan kesamaan hasil pada saat yang berlainan waktunya, terhadap
siswa yang sama. Misalnya siswa kelas V pada hari ini di tes kemampuan
matematik. Minggu berikutnya siswa tersebut di tes kembali. Hasil dari kedua tes
relatif sama. Sehingga masih mungkin terjadi ada perbedaan hasil untuk hal-hal
tertentu akibat faktor kebetulan, selang waktu, terjadinya perubahan pandangan
siswa terhadap soal yang sama. Jika ini terjadi, kelemahan terletak dalam alat
ukur itu, yang tidak memiliki kepastian jawaban atau meragukan siswa. Dengan
kata lain derajat reliabilitasnya masih rendah. Di lain pihak perbedaan hasil
pengukuran bukan disebabkan oleh alat ukurnya, melainkan kondisi yang terjadi
pada diri siswa. Misalnya fisik siswa dalam keadaan sakit pada waktu tes yang
pertama, motivasi pada waktu tes pertama berbeda dengan motivasi tes pada
berikutnya.
2. Faktor Yang Mempengaruhi Reliabilitas
Menurut
Sukardi (2008), koefisien reliabilitas dapat dipengaruhi oleh waktu
penyelenggaraan tes-retes. Interval penyelenggaraan yang terlalu dekat atau
terlalu jauh, akan mempengaruhi koefisien reliabilitas. Faktor-faktor lain yang
juga mempengaruhi reliabilitas instrument evaluasi di antaranya sebagai
berikut:
a.
Panjang tes, semakin panjang suatu tes evaluasi,
semakin banyak jumlah item materi pembelajaran diukur.
b.
Penyebaran skor, koefisien reliabelitas
secara langsung dipengaruhi oleh bentuk sebaran skor dalam kelompok siswa yang
di ukur. Semakin tinggi sebaran, semakin tinggi estimasi koefisien reliable.
c.
Kesulitan tes, tes normative yang terlalu
mudah atau terlalu sulit untuk siswa, cenderung menghasilkan skor reliabilitas
rendah.
d.
Objektifitas, yang dimaksud dengan
objektif yaitu derajat dimana siswa dengan kompetensi sama, mencapai hasil yang
sama.
3. Macam-Macam Realibilitas
Arikunto
(2000) menyatakan bahwa reliabilitas dibedakan atas
dua
macam, yaitu
a. Reliabilitas
konsistensi tanggapan
Reliabilitas
konsistensi tanggapan responden mempersoalkan apakah tanggapan responden atau
obyek ukur terhadap tes atau instrumen tersebut sudah baik atau konsisten.
Dalam hal ini apabila suatu tes atau instrumen digunakan untuk melakukan
pengukuran terhadap obyek ukur kemudian dilakukan pengukuran kembali terhadap
obyek ukur yang sama, apakah hasilnya masih tetap sama dengan pengukuran
sebelumnya. Jika hasil pengukuran kedua menunjukkan ketidakkonsistenan maka
jelas hasil pengukuran itu tidak mencerminkan keadaan obyek ukur yang
sesungguhnya. Untuk mengetahui apakah tanggapan terhadap tes atau instrumen itu
mantap, konsisten atau tidak plin-plan, dapat dilakukan dengan cara memberikan
tes yang sama secara berulang kali (dua kali) kepada obyek ukur atau responden
yang sama. Pengetesan dua kali merupakan syarat minimal untuk mengetahui apakah
tanggapan obyek ukur terhadap tes tersebut konsisten atau tidak.
Dalam
pelaksanaan pengetesan dua kali ini dapat ditempuh berbagai cara yaitu kita
melakukan pengetesan dua kali dengan tes sama terhadap obyek ukur yang sama,
atau dengan melakukan pengetesan sekali dengan menggunakan dua tes yang
butir-butirnya setara. Jika kita menggunakan pengetesan sekali maka kesamaan
atau kesetaraan tes yang digunakan merupakan syarat mutlak yang harus dipenuhi,
karena kemantapan atau konsistensi tanggapan terhadap butir-butir yang akan
diperiksa. Pada teknik belah dua ini pengukuran dilakukan dengan dua kelompok
butir yang setara pada saat yang sama. Karena setiap kelompok butir merupakan
separuh dari seluruh tes, maka biasanya kelompok butir pertama diambil dari
butir-butir tes yang bernomor ganjil, sedangkan kelompok butir yang kedua
diambil dari butir-butir tes yang bernomor genap. Perlu diketahui bahwa
reliabilitas dengan teknik ini sangat relatif, karena reliabilitas akan
tergantung pada cara penomoran dan pengelompokan butir yang diambil. Di sini
pengukuran dilakukan dengan menggunakan dua tes yang dibuat setara kemudian
diberikan kepada responden atau obyek tes dalam waktu yang bersamaan. Skor dari
kedua kelompok butir tes tersebut dikorelasikan untuk mendapatkan reliabilitas
tes.
b. Reliabilitas
konsistensi gabungan butir.
Reliabilitas
konsistensi gabungan butir berkaitan dengan kemantapan antara butir suatu tes.
Hal ini dapat diungkapkan dengan pertanyaan, apakah terhadap obyek ukur yang
sama, butir yang satu menunjukkan hasil ukur yang sama dengan butir yang
lainnya. Dengan kata lain bahwa terhadap bagian obyek ukur yang sama, apakah
hasil ukur butir yang satu tidak kontradiksi dengan hasil ukur butir yang lain.
Jika
terhadap bagian obyek ukur yang sama, hasil ukur melalui butir yang satu kontradiksi
atau tidak konsisten dengan hasil ukur melalui butir yang lain maka pengukuran
dengan tes (alat ukur) sebagai suatu kesatuan itu tidak dapat dipercaya. Dengan
kata lain tidak reliabel dan tidak dapat digunakan untuk mengungkap ciri atau
keadaan yang sesungguhnya dari obyek ukur. Kalau hasil pengukuran pada bagian
obyek ukur yang sama antara butir yang satu dengan butir yang lain saling
kontradiksi atau tidak konsisten maka kita jangan menyalahkan obyek ukur,
melainkan alat ukur (tes) yang dipersalahkan dengan mengatakan bahwa tes
tersebut tidak reliabel terhadap obyek yang diukur.
Koefisien
reliabilitas konsistensi gabungan butir untuk skor butir dikotomi dapat
dihitung dengan menggunakan rumus Kuder-Richardson yang dikenal dengan nama
KR-20 dengan rumus:
KR-20= (
Keterangan:
k = cacah butir.
piqi = varians skor butir.
pi = proporsi jawaban yang benar untuk butir
nomor i.
qi = proporsi jawaban yang salah untuk butir
nomor i.
St2 = varians skor total responden.
.
Koefisien reliabilitas
gabungan butir untuk skor butir politomi, maka koefisien reliabilitas dihitung
menggunakan koefisien Alpha
(Djaali, 2000:
122) dengan rumus:
= (
Keterangan:
rii = koefisien
reliabilitas.
k = cacah butir.
Si2
= varians skor butir.
St2
= varians skor total responden.
Interpretasi terhadap koefisien
reliabilitas merupakan intrepretasi relatif, artinya tidak ada batasan mutlak
yang menunjukkan berapa angka koefisien minimal yang harus dicapai agar suatu
pengukuran dapat disebut reliabel. Namun, memberikan informasi tentang hubungan
varians skor teramati dengan varians skor sejati kelompok individu. Misalnya,
diperoleh koefisien reliabilitas sama dengan 0,87. Koefisien reliabilitas ini
dapat diartikan bahwa:
1) 87%
varians skor teramati diakibatkan oleh varians skor sejati kelompok individu,
2) Korelasi
antara skor teramati dan skor sejati sama dengan 0,87 atau 0,93.
KESIMPULAN
Validitas merupakan suatu
ukuran yang menunjukkan kevalidan atau kesahihan suatu instrument. Instrument
dikatakan valid jika instrument tersebut dapat digunakan untuk mengukur apa
yang hendak diukur. Validitas tidak berlaku universal sebab bergantung pada
situasi dan tujuan penelitian. Instrumen yang telah valid untuk suatu tujuan
tertentu belum otomatis akan valid untuk tujuan yang lain. Ada tiga jenis
validitas yang sering digunakan dalam penyusunan instrumen, yaitu validitas isi, validitas bangun pengertian
(Construct validity), dan validitas ramalan (predictive validity). Perhitungan
validitas dari sebuah instrumen dapat menggunakan rumus korelasi product
moment atau dikenal juga dengan korelasi pearson.
Reliabilitas berasal dari
kata reliability berarti sejauh mana hasil suatu pengukuran dapat
dipercaya. Suatu tes dikatakan reliabel jika selalu memberikan hasil yang sama
bila diteskan pada kelompok yang sama pada waktu atau kesempatan yang berbeda. Reliabilitas
alat ukur adalah ketetapan atau keajegan alat tersebut dalam mengukur apa yang
diukurnya. Reliabilitas dibedakan atas dua macam, yaitu reliabilitas
konsistensi tanggapan dan reliabilitas konsistensi gabungan butir. Koefisien
reliabilitas konsistensi gabungan butir untuk skor butir dikotomi dapat
dihitung dengan menggunakan rumus Kuder-Richardson yang dikenal dengan nama
KR-20 sedangkan untuk skor butir politomi, maka koefisien reliabilitas dihitung
menggunakan koefisien Alpha.
DAFTAR PUSTAKA
Arikunto, S. 2002. Prosedur Penelitian, Suatu Pendekatan Praktek. Jakarta: Rineka
Cipta.
Azwar, Saifuddin.2003. Reliabilitas dan Validitas. Yogyakarta:
Pustaka Pelajar.
Sugiyono. 2006. Statistika untuk Penelitian. Bandung: Alfabeta.
Sukardi. 2008. Metode Penelitian Kualitatif dan Kuantitatif. Bandung: Alfabeta.
Usman. 2003. Pengantar Statistika.
Jakarta: Bumi Aksara.
No comments:
Post a Comment