.

"ANTARA BLOG TERBAIK DI NATIONAL EDUCATIONAL BLOGGING SUMMIT 2011"


MORE THAN 3 MILLION HITS !

Statistik

SPSS - STATISTIK PENYELIDIKAN SECARA SANTAI

Pertanyaan: zahinothman@gmail.com



-------------------------------------------------------------------------------------------------------------------------------------------------------

Sila joint dan sign-in. Anda FOLLOWER kehormat drotspss...

Saya klik Follow dan BANGGA menjadi follower drotspss...

Thursday, January 27, 2011

Tajuk 52 - Tak faham statistk - Anda dalam kelompok mana?


Ini semester ke 3 saya mengajar statistic. Saya dapati ada 4 jenis pelajar.

Pertama, pelajar yang takut dengan statistic, menganggap dia susah, dan apabila diperkenalkan z-skor jer terus panik! Confirm stat ni susah... Mereka berusaha cuba nak faham tapi hanya bergantung kepada nota....sering berkata “saya mmg lemah maths sejak dulu...susah nak faham lah nombor2 ni..” sebab memang mereka susah nak faham.... akhirnya seperti give up. Pelajar ni tak sampaipun peringkat “recall / knowledge” ikut Bloom. Bila ujian 1 jer....  sangkut.... dgn fobia yang dibawa...mereka cukup2 makan sampai ke final.

Kedua, pelajar yang tak ambil kisah pun pasal statistik....kebanyakkan mereka pulak ambil courseworks....mereka tiada masalah untuk faham tapi tak usah nak faham lebih....sekadar faham nota sahaja......Pelajar kumpulan ni berada antara” recall – comprehension”.... Mereka ni selalu kata "ala relex lah.... nak exam kita studi ler..." Bila ujian 1.... cukup2 makan. Finalpun cukup2 makan.

Ketiga pelajar yang komited, focus dalam kelas dan berusaha keras......belum masuk kelas dah membaca dan cuba memahami dulu....then sering berjumpa saya....nak pastikan pemahaman mereka betul... byk buat latihan selalu berkata “ betul tak saya buat macam ni..betul tak saya faham macam ni...buku mana yang bagus  nak baca....” Pelajar ini berada antara “comprehension – application”. Bila ujian 1...mereka  dalam kelompok teratas... then kekal sampai final.

Keempat...pelajar takut statistic tapi berkawan dengan kumpulan ketiga....ada kumpulan studi.... positif...fokus dan mereka berada dalam kelompok “recall” mulanya tetapi berjaya melonjakkan diri ke “comprehension”. Mereka dikenali dgn ucapan “barulah saya faham sekarang....” Dalam ujian 1 cukup-cukup makan tapi dalam final mereka cemerlang!

Statitik bukan SUSAH cuma cara pemahamannya tidak direct macam anda belajar sejarah atau sains. Anda guna sampel untuk estimate nilai populasi maka ada pengiraan melibatkan min, s.d, std error dll. Then terdapat pelbagai jenis ujian berdasarkan skala. Terdapat berbagai taburan...Z, t, F dll. Ada ANOVA, ANCOVA, MANOVA phew... Mann-Whitney, Kurskal-Wallis, Othman-Talib.. phew..phew...Jadi anda perlu FOKUS.... jgn tak hadir satu kuliahpun....buat bacaan tambahan biarpun 10 kali baru boleh faham.... then adakan kumpulan studi.... sebab mengikut Vygotsky dan Ausubel.... berbincang akan menghasilkan meaningful learning...

Nasihat saya.. jadilah sekurang2nya kelompok keempat. Saya sendiri dalam kelompok mana ha? 

Monday, January 24, 2011

Tajuk 51- Apa sebab sampel n = 30 untuk kajian eksperimen?

Saya bagai nak giler bila pelajar tanya "Apsal n = 30 dikatakan mencukupi khususnya bagi kajian eksperimental? Saya dah baca dalam buku tak derpun.... pensyarah pun tak tahu....". Mana tak giler.... saya bukan statistician yang boleh jawab begitu jer. Saya akan ambil pendekatan mudah, sekurang2nya dapat digunakan bagi mempertahankan n = 30 sebagai sufficient enough untuk analisis statistik anda.

Anda memahami bahawa taburan bagi populasi adalah taburan frekuensi individu skor yang menghasilkan min dan s. piawai. Apabila anda mengambil satu kumpulan sampel secara rawak dari populasi tersebut, maka minnya akan menghampir min populasi.

Jika anda mengambil, katakan 20 sampel dengan setiap satunya mempunyai saiz sampel n = 5  iaitu n1, n2, n3...n20 dan anda plotkan min-min sampel tersebut anda akan dapati ianya cenderung tertabur secara normal, tak kira samada taburan populasi  dimana sampel diambil tertabur secara normal ataupun tidak normal. Jika anda tambah saiz bagi 20 sampel-sampel tersebut, katakan saiz sampel n = 10, taburan akan menjadi lebih menghampiri taburan normal dengan variability yang lebih kecil.

Jika diulang dengan n = 30, taburan yang terhasil adalah "cukup tertabur secara normal" maka  saiz sampel n = 30 (yang diambil secara random) adalah mencukupi untuk  tujuan statistik inferens seperti t-test, ANOVA atau ANCOVA bagi mengesan sebarang kesignifikanan. Maka untuk tujuan eksperimental, mencukupilah anda mengambil sampel n = 30 bagi setiap kumpulan kawalan dan eksperimental. Tiada masalah jika anda ingin  mengambil lebih sedikit sampel anda katakan n = 35 bagi mengatasi masalah keciciran sampel atau ada data yang ekstreme.... disamping itu anda kena pastikan faktor extraneous dikawal.

Malah.... jka anda ada sampel katakan n > 30 katakan 40, anda boleh gunakan Z-test. So saya "berpendapat: anda masih boleh jalankan kajian eksperimen dgn yakin walaupun n < 30 sebab anda menggunakan taburan-t bukannya Z. Jika anda ada sampel n = 25 bagi kumpulan eksperimen dan kawalan masing dengan varians kedua2nya homogen, jalankan kajian anda dengan syarat anda kawal variabel luaran (extraneous) dan tunjukkan cara anda mengawal dalam kajian anda dan laporan. Ingat, taburan-t digunakan apabila anda ada sample n < 30.... so selamat menjalankan kajian eskperimen dengan tenang....

Cuma jangan lupa... jika anda melakukan survey.... anda perlu sampel yang lebih ramai kerana anda tidak mengawal sampel anda dan tidak memanipulasi apa2 treatment. Ini telah saya bincangkan dalam tajuk yang lalu.... sila semak.
Satu-satunya sampel yang boleh tidor kat mana sahaja....

Saturday, January 22, 2011

Tajuk 50: Ape ke bendenyer darjah kebebasan (df) tu?

Sukar nak jelaskan konsep df ni, khususnya bagi pelajar sains sosial / pendidikan. Wbagaimanapun, cubalah fahami contoh berikut:


Konsep df tidak perlu dalam statistik deskriptif sebab anda mengira data mentah secara terus, spt mencari min atau mode satu set data mentah. Begitu juga, bila ada ada taburan populasi, anda gunakan data mentah bagi mengira min (parameter) bagi populasi tersebut. Konsep df hanya diperlukan apabila anda menggunakan data dari sampel katakan min sampel (statistik) bagi menganggar satu nilai katakan min populasi (parameter) bagi membuat inferen. Dalam bahasa mudah apabila melibatkan inferens, penggunaan data ini tidak secara terus, anda menggunakan nilai statistik untuk menganggar parameter, maka anda tidak bebas menggunakan data dari sampel tersebut, ada satu df yang perlu anda patuhi. Sebab itu bila anda semak taburan pupulasi (parameter) tiada df diperlukan. TETAPI bila anda semak taburan t, atau F atau chi square, anda perlu ambilkira df yang didasarkan kepada n dan bilangan parameter yang anda ingin buat inferen. Sebab itu ada df bagi jadual taburan tersebut. 


Cuba perhatikan contoh berikut: Katakan anda ingin menganggar varians dalam pengiraan ketinggian seluruh populasi pelajar UPM, maka anda kena tahu min populasi pelajar UPM. Ingat - varians adalah pengiraan yang melibatkan perbezaan antara individu data dengan min, kemudian dikuasadua bagi mengatasi masalah nilai negatif hasil perbezaan tersebut. Oleh kerana anda tidak tahu min populasi ketinggian pelajar UPM (tak tahu sebab takkan mungkin dapat ukur ketinggian semua pelajar UPM), maka anda menganggar min tersebut daripada sampel (statistik) yang diambil secara rawak (sebab itu antara andaian ujian-t, sampel rawak dan tertabur secara normal). 


Katakan anda mengukur ketinggian sampel dua pelajar UPM (n = 2) ,iaitu 4 dan 5 kaki (cukuplah dua sampel sbg contoh), maka anggaran anda bagi min populasi adalah:

Min populasi = (4+5)/2 = 4.5.

Dan jika anda kira dua anggaran varians ini dari dua sampel:

Anggaran 1 = (4-4.5)2 = 0.25 (anda guna min sample anggar varians populasi)


Anggaran 2 = (5-4.5)2 = 2.25

Adakah anggaran 1 dan 2 bersandar atau bebas antara satu sama lain? Tentulah bersandar sebab pengiraan 1 dan 2 saling berkait iaitu setiap nilai ketinggian menyumbang kepada pengiraan min populasi (4.5) bagi kedua2 pengiraan varians. Oleh itu, dua pengukuran yang melibatkan dua sampel ini saling bersandar, maka anda hanya ada satu darjah kebebasan sahaja dalam menentukan nilai varians populasi. Pening ke? Teruskan membaca....

Perkaitan antara bilangan observation (dalam kes ini bilangan sampel atau n) dengan bilangan parameter yang dikira, k adalah df = n – k . Dalam kes ini, k adalah 1 iaitu min populasi (parameter) yg dianggar dari min sampel. Ini kerana df adalah satu fungsi bagi bilangan observation atau bilangan sampel, n dan bilangan parameter, k yang dianggar. Dalam kes ini, df = n -1 kerana hanya ada 1 parameter yang dianggar.  Dalam kes ini juga terdapat dua observation (4 dan 5), dan kita perlu menganggar satu parameter (min populasi).  Maka, untuk menganggar varians seterusnya dengan satu min populasi yang dianggar, anda mempunyai df = n - k, atau df = 2 - 1 = 1. 


Bagi mengurangkan kepeningan anda, sebagai analogi, sama seperti anda mempunyai 6 pelajar yang anda ingin letakkan dalam berbagai posisi sebagai satu pasukan bola tampar, maka anda hanya ada darjah kebebasan 5 sahaja untuk meletakkan pelajar dalam mana2 posisi, kerana pelajar yang terakhir iaitu pelajar ke 6 tiada pilihan untuk diletakkan dimana2 posisi. Dia terpaksa mengisi satu posisi terakhir yang tinggal. Dengan n = 6, dan k = 1 (iaitu posisi - menganggar posisi dalam permainan) maka df = n - k atau df = 6 -1 = 5.


 Secara amnya, df = (bil observation atau data individu yang terlibat dalam estimation) – (bilangan parameter).  Mungkin satu lagi cara memahami konsep df adalah dengan melibatkan, katakan  empat nombor  p,q,r,s  (katakan mewakili empat data atau observation)  yang setiap satunya mesti dikira bagi mendapatkan min 20 (katakan min mewakili parameter yang ingin dianggar), maka anda boleh menentukan dengan bebas tiga nombor sahaja secara rawak, sedangkan nombor ke empat tidak bebas atau tetap yang akan menjadikan min 20. Jadi df = n-1 = 4 – 1 = 3. Oleh kerana kita membuat anggaran atau inferens sampel ke populasi spt dalam t-test, F-test…. Chi-square….. kita memerlukan df.


Jika anda ada dua kumpulan pula katakan A dan B....untuk ditentukan posisi, k(AB) = 2 iaitu mencari posisi bagi dua pasukan berbeza dengan nA = 6 dan nB = 6 maka df = (nA + nB) - 2 atau df = n - k = 12 - 2 = 10.


Camner lagi nak diperjelaskan....?
Zahin ni ada df yang tinggi sebab tu bebas tidor kat mana2...





Thursday, January 13, 2011

Tajuk 49 - Soalselidik tak cukup ada reliability.... perlukan Factor Analysis

Baru nak buat item dapat dapat kekasih ! 
Saya mulanya tidak bercadang untuk menulis berkaitan factor analysis atau analisis faktor (AF). Namun setelah mendapat byk pertanyaan, saya usahakan juga memberi ringkasan mengapa kita perlu lakukan analisis ini. AF sebenarnya boleh dipanggil juga analisis item. Bila sebut item, tentulah berkaitan soalselidik. Katakan anda membina soal selidik dengan 60 item dan 5 konstruk pada skala Likert bagi mengukur personaliti kekasih yang baik. Konstruk tersebut adalah 1. Rupa paras menawan 2. Bijak berkomunikasi 3. Saling menghormati 4. Periang 5. Empati. Selalunya anda hanya lakukan proses validity diikuti dengan reliability dengan Cronbach alpha. So cukuplah jika anda dapat nilai alfa katakan 0.7. Namun, bagi meningkatkan validity dan reliability ini, terutamanya bagi soalselidik yang anda sendiri bina, maka sayugianya anda boleh menjalankan AF ini. Barulah mantap tesis anda, khususnya yang nak buat PhD!
Tujuan AF adalah bagi memastikan bilangan konstruk yang diwakili oleh 60 item anda tersebut. Item yang mengukur konstruk / konsep / idea yang sama, sepatutnya mempunyai korelasi yang tinggi antara satu sama lain. Sebaliknya item yang mengukur konstruk / konsep / idea yang berbeza akan mempunyai korelasi yang rendah.

Contohnya, semua item yang mengukur konstruk 1. (Rupa paras menawan) mestilah mempunyai korelasi yang tinggi antara satu sama lain. Item yang mengukur konstruk 1. akan mempunyai korelasi yang rendah dengan item yang mengukur konstruk 2. (Bijak berkomunikasi). Namum terdapat juga item yang saling mempunyai korelasi yang tinggi dengan beberapa konstruk. Item begini perlu dibuang kerana akan menyukarkan tafsiran dibuat. Sebab tu lah AF ni dalam SPSS berada bawah Anlyze – Data Reduction - Factor. Anda perlu jalankan pilot dengan sampel yang agak besar, katakan 150 untuk laksanakan AF ini.

Dalam SPSS, anda akan gunakan nilai eigen (Jadual Total Variance Explained) atau Graf screeplot bagi menentukan bilangan faktor atau konstruk. Bilangan faktor ditunjukkan dengan graf yang menegak. Jika Graf screeplot tersebut hanya menunjukkan 4 faktor sahaja, maka anda telah tersilap satu kosntruk yang tidak diwakili dengan baik oleh item yang anda tulis. Jadual output Component matrix akan menunjukkan item apa berada dalam keempat-empat faktor ini. Terdapat item yang perlu dibuang kerana tidak berada dalam kelompok yang betul, katakan 10 item. Akhirnya anda ada 50  item yang diwakili oleh 4 konstruk dengan 10 item telah dibuang.  Ini hanya idea….. untuk anda faham konsep dan tujuan menggunakan AF....

Tuesday, January 11, 2011

Tajuk 48 - Bila nak guna ANCOVA...abis ANOVA camner pulak?

Selamat Tahun Baru Masehi 2011. Cabaran 2010 telah berlaku. Lawatan saya ke Florence (Italy) Amsterdam, Medan, Cairo dan Semenanjung Sinai (Laut Merah) sepanjang tahun 2010 byk memberi kesan mendalam. Pelajar master EDU5900 dan EDU5950 byk memberi refleksi kepada saya untuk meningkatkan pengetahuan. Bertemu dengan pelajar siswazah UKM juga memberi satu peluang bagi saya memperbaiki diri. Buat SEMUA…LUV U ALL.

Setelah hampir dua bulan tidak menulis kerana ada kesibukan hujung tahun yang lain. Kali ini saya menulis tentang ANCOVA. ANCOVA adalah gabungan pengiraan korelasi dan regresi. ANCOVA dijalankan untuk kawal faktor gangguan atau extraneous variable yang ganggu DV anda selain IV yang digunakan. Jika tiada kesan mana2 kovariat, anda boleh saje guna ANOVA satu hala jika ada IV atau ANOVA dua hala jika anda guna 2 IV.  Namun, jika ada kesan variable lain seperti IQ, kenalah anda gunakan ANCOVA. ANCOVA juga digunakan jika anda jalankan kuasi-eskperimen dengan intact group yang mana random sampel tidak dapat dilakukan bagi menghasilkan dua kumpulan atau lebih kumpulan yang tak setara. Lazimnya anda ambil skor pre-test sebagai kovariat bagi mensetarakan kumpulan intact tersebut dari aspek penguasaan dalam pre-test. Anda sebenarnya boleh mengunakan lebih dari satu kovariat dgn syarat anda ukur kovariate anda sebelum tretmen. Apabila ANCOVA menyingkirkan kesan  kovariat, ia juga menyingkirkan sebahagian kesan tretmen yang dihasilkan oleh kovariat, maka mengurangkan sedikit peluang untuk mendapat hasil yang signifikan.... namun ANCOVA meningkatkan sensitiviti dan POWER statistik anda. Ini kerana kovariat mempunyai korelasi dengan DV anda dan anda berjaya melenyapkannyer..

Timbul persoalan. Macamana nak tahu kovariat ada kesan korelasi dgn DV? Sonang bah itu! Anda hanya perlu jalankan analisis korelasi bagi membuktikan adanya hubungan LINEAR yang kuat antara kovariat dgn DV... he he....Jika nilai koefisien hanya 0.2 jer.... tak der lah kesan yang kuat bagi kovariat anda tu. Jika 0.7 ker... barulah ANCOVA anda benar2 kaw! Maka POWER bagi analisis statistik anda akan bertambah.... fuhh! Jika anda ada lebih dari satu kovariat, pastikan juga semuanya mempunyai hubungan korelasi yang linear dengan DV. Jika tidak.... POWER akan turun pulak! Macam ANOVA, anda juga ada ANCOVA satu hala (satu IV dengan lebih 2 kategori)  dan satu DV dan satu atau lebih kovariate dan ANCOVA dua hala (faktorial ler tu)..

Katakan anda membuat kajian eksperimental teknik X, Y dan Z bagi melihat kesannya kepada skor maths  kumpulan X, Y dan Z. Katakan anda kenalpasti faktor IQ mempengaruhi skor maths (maknanya ada pengaruh linear atau  korelasi faktor IQ dgn skor maths). Ingat! ANCOVA hanya untuk sampel tak bersandar kerana tujuan ANCOVA bagi mensetarakan kumpulan yang berbeza (tak bersandar) ini akibat faktor kovariat. Jika anda membuat pengukuran berulang bagi satu kumpulan yang sama, faktor kovariat sudah tidak releven lagi. Bagi kes begini, jalankan sahaja ANOVA biasa, sehala atau dua hala bergantung kepada IV anda. Sama seperti anda hanya memerlukan ujian Levene bagi kumpulan tak bersandar, untuk mengetahui samada varians kumpulan tersebut homogen mahupun tidak.  Ujian Levene tidak relevan pada kumpulan yang bersandar. Betul..betul..betul...
ANOVA ku...

Related Posts Plugin for WordPress, Blogger...