Ini adalah sambungan dari ulasan saya dalam Tajuk: Awas dengan Likert Scale ! Saya ingin memperkenalkan Rasch Model (RM) yang boleh membantu penilaian melalui soal selidik yang boleh di calibrate untuk mendapatkan makna dapatan yang lebih reliable. Saya mulakan dengan membaca dan memahami buku tulisan Azrilah Abdul Aziz “Rasch Model Fundamentals: Scale construct and Measurement Structure” terbitan tahun 2010 yang saya beli semasa menghadiri bengkel Prof Trevor Bond di UKM.
Ni ler buku yang dimaksudkan |
Salam.
Terdahulu saya ingin mengucapkan tahniah, kerana sudah mengenali Rasch. Dan saya juga berterima kasih kerana memberi sokongan terhadap buku saya. InsyaAllah kita akan terbitkan buku Rasch di dalam versi Bahasa Melayu.
Saya sungguh berbesar hati dengan cadangan tuan memuatkan ringkasan tentang Rasch model ke dalam blog tuan. Saya tidak mempunyai masalah dalam perkara tersebut. Saya juga berharap kita sama-sama dapat memanfaatkan ilmu yang kita dapat ini.
Saya pernah memberi ceramah di dalam workshop Rasch di UKM, jemputan daripada Persatuan Siswazah. Kita akan adakan juga bengkel selanjutnya, mengilkut jadual yang akan di beri oleh Persatuan Siswazah nanti. Mungkin boleh menghubungi Saudara Kashfi untuk maklumat lanjut.
Rgds,
Azrilah
Saya cuba akan ringkaskan idea utama sahaja. Saya sendiri masih belum memahami sepenuhnya. Rasch Model (RM) secara mudahnya adalah analisis yang boleh diaplikasikan dalam membina instrument penilaian sains sosial dengan skor dua kategori (0,1), tiga kategori (0,1,2) dan seterusnya yang mewakili peningkatan tahap respon variable yang ditanya seperti tahap pencapaian atau tahap persetujuan. Skor item2 ini dijumlah dengan bagi memberikan satu nilai skor yang merujuk kepada pengukuran satu variable (unidimensional variable).
RM adalah analisis yang menjadikan jumlah skor merentas item sebagai satu parameter bagi mencirikan responden bagi setiap kategori item. Parameter bagi item ini dpanggil satu threshold (the level that must be reached for an effect to be produced). Maksudnya skor dua kategori 0,1 seperti gagal atau lulus mempunyai satu threshold katakan pengetahuan tentang sesuatu fakta yang ditanya dalam item tersebut yang membezakan respon samada gagal atau lulus. Jika tiga kategori (0,1,2) pula mempunyai dua threshold dan seterusnya.
Dalam pengukuran sains sosial, konstruk yang diukur adalah suatu pengalaman bersifat continuous tetapi bila anda cuba mengkelaskannya (setuju, sangat setuju, tidak setuju dsb) ia menjadi diskret. Konstruk wujud dalam individu seperti kecewa, gembira, berpengetahuan dll yang tidak boleh di ukur secara terus (spt anda mengukur variable tinggi dan berat badan anda). Namun anda boleh mengukur variable tingkahlaku yang berkaitan dengan konstruk tersebut dengan menyediakan item yang standard seperti 0 = gagal, 1= lulus. Jumlah skor yang diperolehi individu merentas item boleh ditukar kepada ukuran linear keupayaan individu dengan kesukaran item. Skor yang berterusan (gagal ke lulus) ditukar dengan skor diskret (gagal atau lulus)
Konstruk sesuatu instrument adalah focus kajian yang ingin diukur. Bagi item yang menguji konstruk pencapaian pelajar, item yang dibina selalunya berdasarkan Jadual Spesifikasi Ujian, sama ada item tersebut menguji dimensi peringkat ingatan fakta, pemahanan, analisis dsb (ingat Taxonomi Bloom ?). Mendapatkan konstruk yang betul akan membawa kepada analisis dan penilaian yang betul. Akhirnya akan membawa kepada membuat keputusan yang juga betul. Ini penting dalam membuat instrumentseperti menilai prestasi individu.
Bagi menghasilkan konstruk, anda perlu menentukan variable yang ingin dikaji, dari literature review dan kajian lepas. Kemudian anda kena tentukan definisi operasi. Namun anda masih perlu dapatkan komen pakar bagi meningkatkan validity kajian instrument anda.
Melaksanakan kajian deskriptif dan korelasi yang umumnya dijalankan diperingkat master tidak memberikan banyak makna kepada dapatan dalam mengkaji sikap manusia. Bacaan kofisien korelasi sebenarnya bukan lah satu pengukuran, ia hanya perkaitan yang bersifat superficial (luaran) sahaja.
Dapatan skala Likert misalnya 1,2,3,4,5 adalah data ordinal mentah yang masih perlu diproses kerana sifatnya sebagai data ordinal bukan interval, wpun ada penyelidik menukarkan status tersebut. Data ordinal yang bersifat kategori tidak mempunyai selang yang tetap sebagaimana data interval. Masalah ini telah diselesaikan oleh Rasch Model.
Katakan anda mengukur persetujuan dengan mengadakan ujian ulangan (focus kajian anda) kepada pelajar tingkatan empat berikutan dengan prestasi pelajar yang tidak berapa baik. Apabila anda bertanya seorang pelajar, kebarangkalian (kb) adalah 0.5 (iaitu 50:50) untuk pelajar tersebut bersetuju kerana terdapat 0.5 lagi dia berkata tidak setuju. Jika ditanya kepada 10 pelajar, kb mungkin 0.5 juga (10 setuju: 10 tidak setuju) atau 50:50, atau 0.9 (9 bersetuju: 1 tidak bersetuju) atau 9:1. Beginilah asasnya RM menukar skala ordinal kepada skala kb atau nisbah bagi tujuan pengukuran kerana sifatnya seperti data interval.
Jika ada 100 pelajar maka nisbah terkecil adalah seorang bersetuju: 99 tak setuju atau 1/99. Nisbah terbesar adalah 99 bersetuju dan seorang tak setuju atau 99/1. Bagi mendapatkan skala interval yang berselang sama, maka kita gunakan log 10. Bagaimana RM menukar skala ordinal ke interval? Sila baca Tajuk 141.... skala ordinal ditukar ke intervel dengan unit yang dinamakan LOGIT !! Baca jgn tak baca....
Katakan empat pelajar P, Q, R dan S menjawab 7 item dengan pilihan respon betul / salah, dengan skor 1= betul dan 0 = salah. Dapatan boleh diringkaskan sebagai data berikut seperti Jadual 1 berikut:
Katakan empat pelajar P, Q, R dan S menjawab 7 item dengan pilihan respon betul / salah, dengan skor 1= betul dan 0 = salah. Dapatan boleh diringkaskan sebagai data berikut seperti Jadual 1 berikut:
Pelajar
|
Item 1 - 7
| ||||||
P
|
1
|
0
|
0
|
1
|
1
|
0
|
0
|
Q
|
0
|
1
|
1
|
0
|
1
|
1
|
1
|
R
|
1
|
1
|
1
|
0
|
0
|
1
|
1
|
S
|
1
|
0
|
0
|
0
|
1
|
1
|
1
|
Jadual 1
Jadual mengandungi data ordinal yang hanya boleh diproses dengan frekuensi.
Bagi mengetahui responden yang mendapat skor tertinggi, item mestilah diketahui tahap kesukarannya. RM memastikan item disusun mengikut yang mudah kepada yang sukar seperti Jadual 2:
Perhatikan nilai 1 merujuk kepada jawapan yang betul berada sebelah kiri atas Jadual 2. Pelajar P paling berupaya dan pelajar S paling tidak berupaya. Jika dibuat garisan merentas (garis putus) terdapat banyak skor 1 di atas garisan berbading di bawah garisan. Skor 0 oleh pelajar P di atas garisan adalah kerana kecuaian pelajar manakala skor 1 oleh pelajar S di bawah garisan adalah tekaan jawapan. Inilah idea asas RM.
Bagi mengetahui skala LOGIT sila ke Tajuk 141 !!! You will be amazed dengan idea Rasch....
Jadual 2 |
Bagi mengetahui skala LOGIT sila ke Tajuk 141 !!! You will be amazed dengan idea Rasch....
Otak dr ot mmg bergeliga! :)
ReplyDelete