.

"ANTARA BLOG TERBAIK DI NATIONAL EDUCATIONAL BLOGGING SUMMIT 2011"


MORE THAN 3 MILLION HITS !

Statistik

SPSS - STATISTIK PENYELIDIKAN SECARA SANTAI

Pertanyaan: zahinothman@gmail.com



-------------------------------------------------------------------------------------------------------------------------------------------------------

Sila joint dan sign-in. Anda FOLLOWER kehormat drotspss...

Saya klik Follow dan BANGGA menjadi follower drotspss...

Tuesday, November 30, 2010

Tajuk 47: Pelaporan Chi-square

Chi-square digunakan bagi mengetahui perkaitan antara dua variable nominal (kategori) yang biasanya dlm bentuk frekuensi / kekerapan. Katakan anda ingin mengetahui sama ada terdapat hubungan antara jantina (lelaki dan perempuan) dengan pemilihan tempat bekerja (awam atau swasta). Anda boleh laporkan seperti berikut:
  • Analisis chi-square yang dijalankan menunjukkan  bahawa jantina mempunyai perkaitan yang signifikan dengan pemilihan tempat bekerja pada x2 = 0.2, p<.05. (x2 tu simbol chi square yang tak dpt ditaip dalam blog ini)
  • Data ini menunjukkan jantina mempunyai perkaitan dengan pemilihan tempat bekerja.
  • Ini bermakna golongan lelaki lebih cenderung memilih untuk bekerja disektor swasta manakala golongan perempuan lebih cenderung untuk bekerja disektor awam.
Anak-anakku anak zaman Gen-Net !

Tajuk 46: Statistik parametrik dan pasangan bukan parametrik

Saya ingin menyentuh sikit statistik bukan parametrik. Spt yang saya telah jelaskan dalam tajuk terdahulu, statistik bukan parametrik digunakan apabila sampel kecil, data tidak normal atau skala ordinal dan nominal digunakan.


Sebelum itu, mari kita hafal nama2 statistik bukan parametrik yang menjadi pengganti statistik parametrik:


i) Korelasi:
  • Pearson r = Spearman's rho (ordinal + ordinal) @ chi-square (nominal + nominal)
ii) Perbandingan min dua kumpulan:
  • Ujian-t tak bersandar = Ujian Mann-Whitney (M-W)
  • Ujian-t sampel bersandar = Ujian Wilcoxon
iii) Perbandingan min > dua kumpulan
  • ANOVA sehala (1 IV) = Ujian Kruskall-Wallis (K-W)
  • ANOVA sehala (pengukuran berulang) = Ujian Friedman
Tips untuk mengingat nama ujian bukan parametrik:
  • Sample tak bersandar (sampel berbeza)  maka terdapat pasangan dua nama: M-W dan K-W 
  • Bagi sample bersandar (sampel sama) terdapat satu nama sahaja = Wilcoxon dan Friedman
Komputer teman setiaku di mana sahaja
(semasa aku menulis di Florence, Italy..)
OT

Tajuk 45: Pelaporan ANOVA Dua hala

ANOVA dua hala bermakna anda ada 2 IV dengan 2 atau lebih tahap bagi setiap IV dengan hanya satu DV sahaja. Katakan anda mengkaji perbezaan lokasi pelajar (Bandar, Luar bandar) dengan tahap SES (Tinggi, Sederhana, Rendah) terhadap pencapaian sains. Ini bermakna anda menggunakan rekabentuk faktorial 2x3. Anda bernasib baik kerana kesan saiz (eta squared) dan kuasa telah tersedia dalam jadual. Anda boleh memilih post hoc multiple comparison (Scheffe) seperti ANOVA satu hala. Laporan anda boleh jadi bergini.....


Setelah menjalankan analisis faktorial 2x3, kesan utama (main effect) lokasi pelajar menunjukan  perbezaan yang signifikan dalam pencapaian sains pada F(1, 99) = 14.33, p <.05. Namun begitu tiada perbezaan yang signifikan dalam pencapaian sains dari kesan utama perbezaan SES pada  F(2, 99) = 4.55, p > .05. Begitu juga, tidak terdapat kesan interaksi lokasi dan SES yang signifikan terhadap pencapaian sains pada F (2, 99) = 1.22, p > .05. Kesan saiz pula menunjukkan nilai 0.11 dan 0.09 terhadap lokasi dan SES masing-masing. Sementara itu, ujian post hoc Scheffe menunjukkan hanya pelajar bandar tinggi berbeza secara signifikan dengan pelajar luar bandar dalam pencapaian sains.


Dapatan ini menunjukan bahawa lokasi mempunyai kesan yang lebih besar iaitu 11.0 peratus berbanding dengan SES yang menyumbang 9 peratus kepada varians pencapaian sains. Pelajar dari bandar didapati mempunyai pencapaian yang lebih baik ( min = 67) daripada pelajar luar bandar (min = 61). Sementara itu, perbezaan SES tidak memberikan perbezaan yang signifikan terhadap pencapaian sains.


Dapatan ini memberi isyarat bahawa lokasi pelajar memainkan peranan dalam pencapaian sains tanpa mengira latar belakang SES mereka. Dapat disimpulkan bahawa pelajar bandar mempunyai kemampuan yang lebih untuk mencapai skor sains yang lebih baik berbanding dengan pencapaian pelajar luar bandar.


Nota: Berbelit2 kepala saya cuba memberikan pelaporan di atas........
Bila bersama anak-anak... hilang fikiran yang berbelit-belit....

Tajuk 44: Laporan ANOVA sehala

Hubungan ini tetap dua-hala tetapi satu jiwa....
Katakan anda membandingkan skor 3 kumpulan pelajar berbeza tahap EQ terhadap pencapaian sains. Anda boleh laporkan dapatan anda berdasarkan Jadual Anova dan Multiple Comparison hasil bilangan yang dibandingkan oleh analisis Bonferroni dan ujian post hoc Scheffe.


Setelah menjalankan ujian ANOVA dan multiple comparison, terdapat perbezaan yang signifikan antara Kumpulan EQ tinggi (min = 70), Kumpulan EQ sederhana (min = 50) dan Kumpulan rendah (min = 55) dalam ujian pencapaian sains dengan nilai F(2, 97) = 2.44, p < .05. Pengiraan kesan saiz, eta squared menunjukkan nilai 0.12 sedang aplikasi perisian G*Power menunjukkan kuasa statistik 0.8 (rujuk tajuk tulisan saya yang lepas tentang perisian ini).


Dapatan ini menunjukkan perbezaan tahap EQ mempengaruhi pencapaian dalam sains. Ujian post hoc menunjukkan Kumpulan EQ tinggi berbeza secara signifikan dengan kedua-dua kumpulan EQ yang lain, manakala tiada perbezaan yang signifikan antara Kumpulan EQ sederhana dan rendah. Perbezaan antara kumpulan pula dipengaruhi oleh 12.0 peratus oleh perbezaan EQ, iaitu satu saiz kesan yang sederhana pada kuasa statistik yang besar iaitu .80.


Ini menunjukkan bahawa Kumpulan EQ tinggi mempunyai pencapaian yang tinggi dalam sains berbanding dengan kumpulan EQ sederhana dan rendah. Dengan ini, perbezaan EQ haruslah diambilkira adalah dalam pencapaian sains terutamanya bagi kumpulan yang mempunyai IQ yang tinggi.


OT

Monday, November 29, 2010

Tajuk 42: Melapor dapatan SPSS - ujian-t dan korelasi

Setelah anda yakin analisis statistik yang anda pilih, jeng...jeng.... tibalah masanya untuk menulis hasil dapatan anda. Abis nak tulis ikut format apa? Betul.... anda kenalah tulis ikut format APA. Berikut adalah cadangan dari saya.... hanya cadangan bukannya jawapan yang standard untuk anda copy and paste satu persatu kay.. Perhatikan saya sediakan laporan dalam 3 tahap supaya dapat dipersembahkan mengikut APA secara explisit...


1. Ujian-t sampel tak bersandar:


  • Setelah menjalankan analisis ujian-t sampel tak bersandar, dapatan dalam Rajah X menunjukkan wujudnya perbezaan yang signifikan, t(58) = 3.04, p < .05 antara skor min kumpulan A dengan skor min kumpulan B.
  • Ini bermakna, nilai skor min kumpulan A mengatasi nilai skor kumpulan B secara signifikan
  • Keputusan ini menunjukkan bahawa rawatan yang diberikan kepada kumpulan A telah meningkatkan nilai skor dalam ujian sains mengatasi nilai skor dalam ujian sains kumpulan B. Oleh itu, rawatan yang diberikan kepada kumpulan A berkesan dalam meningkatkan skor ujian sains kumpulan A.


2. Korelasi:


  • Setelah menjalankan analisis korelasi, dapatan dalam Jadual X menunjukkan terdapatnya hubungan positif yang kuat  r = .07; p<.05 dan signifikan antara IQ dan EQ  (he.. he.. ini variable favorite saya sebab senang nak eja). 
  • Ini bermakna skor IQ mempunyai perkaitan positif yang kuat dengan skor IQ iaitu semakin tinggi skor IQ makan semakin tinggi pula skor EQ.
  • Keputusan ini membawa implikasi bahawa seseorang yang mempunyai IQ yang tinggi juga berkemungkinan cenderung mempunyai EQ yang tinggi. Oleh itu, tahap EQ seseorang dapat dijangkakan dari tahap IQnya.
(Harus diingat, hubungan korelasi bukan hubungan kesan-akibat, jadi hubungan hanya satu kemungkinan sahaja, atau trend. Hati-hati dalam membincangkan keputusan korelasi. Sebab itu kajian korelasi sahaja tidak memadai untuk satu kajian peringkat master yang lengkap dan berwibawa.... apatah lagi peringkat PhD).
    PERHATIKAN ada at least 3 tahap pelaporan....bersambung lagi dengan ujian-ujian lain....... nak siap gi kerje ler....

    Korelasi bersandar antara anak dan ayah...

    Friday, November 26, 2010

    Tajuk 41: Jangan ingat mudah menulis soalselidik.....

    Di Bukit Merah Lake Town Resort..
    Teringat lagi apabila seorang calon PhD UKM menyuarakan soalselidik untuk saya komen. Terkejut apabila dimaklumkan nilai alfa yang  tinggi tetapi bila item soal selidik diamati terdapat beberapa kesalahan yang amat ketara dalam penulisan soalselidik tersebut. Soalselidik adalah instrumen yang sering dibina oleh penyelidik sendiri. Oleh kerana calon tersebut adalah calon PhD, yang ingin mengukur konstruk psikometrik yang abstrak, adalah disyorkan beliau (atau anda yang membaca artikel ini) supaya  mengambil inisiatif menjalankan faktor analisis terlebih dahulu bagi memastikan konstruk yang benar2 kuat dan item yang benar2 mengukur konstruk tersebut dipilih.


    Jalankan kajian rintis bagi tujuan ini terhadap ressponden dari populasi yang sama tetapi tidak terlibat dalam kajian sebenar. Menjalankan factor analysis akan memberikan weight kepada tesis calon tersebut dan ini menunjukkan beliau menjalankan analisis yang lebih mendalam berbanding pelajar sarjana. Ini kerana factor analysis akan memberikan nilai loading factor yang tinggi kepada konstruk dan item yang mengukur konstruk tersebut secara konsisten. Item dengan loading factor yang rendah perlu dibuang.


    Saya syorkan supaya pembina soalselidik meneliti semula item yang dibina supaya:
    • Item perlu jelas dan ringkas (macamana nak ukur sesuatu yang abstrak jika item pun asbtrak juga). 
    Contoh: 
    Item 1: Setakat manakah anda menghayati solat yang anda lakukan? 
    (Item ini sangat abstrak untuk mengukur penghayatan.)

    Item 2: Berapa kalikah anda mengerjakan solat tahajud?
    (Item ini ukur kekerapan dan boleh kaitkan dengan penghayatan)
    • Konstruk dipilih dari teori dan sekaligus mampu menjawab persoalan kajian.
    • Elak item yang mempunyai maksud berganda atau lebih dari satu pilihan. Contoh: Guru Pendidikan Islam saya suka menegur kesalahan pelajar dan suka memberi nasihat.
    • Jalankan factor analysis dan baiki item anda. Jalankan kajian rintis 2 atau 3 kali sehingga anda dapat menghasilkan item yang mempunyai loading factor dan nilai Cronbach alfa yang tinggi. Siapa kata kajian rintis cukup sekali sahaja? 
    • Sediakan juga beberapa item negatif bagi meningkatkan tumpuan responden dalam menjawab soalselidik dan mengelakkan responden hanya menjawab secara sambil lewa.
    • Elakkan item dua kali negatif kerana sangat mengelirukan.
    Contoh:
    Apakah pendapat anda tentang kurangnya (-ve) graduan yang tidak memohon (-ve) untuk melanjutkan pelajaran diperingkat sarjana?

    Tukar jer menjadi:
    Apakah pendapat anda tentang bertambahnya graduan yang memohon untuk melanjutkan pelajaran diperingkat sarjana?
      He he kan sonang !!


      OT

      Tajuk 40: Tak fahamlah keperluan Definisi Operasi

      Definisi cabaran bagi anak lelaki adalah snorkeling bersama
      Alhamdulillah..... saya telah menulis 40 tajuk, jika dicampur sub-tajuk dahpun mencapai hampir 50. Satu lagi isu yang sering ditanyakan kepada saya adalah..... Definisi Operasi. Terdapat banyak istilah dalam kajian yang tidak jelas dan mempunyai maklum yang luas cakupannya ataupun tidak menepati maksud yang difahami secara umum yang perlu didefinisikan secara operasi dalam konteks kajian anda supaya difahami oleh pembaca. Jika kajian anda bertajuk:

      Kajian keberkesanan aplikasi koswer animasi bagi mata pelajaran Sains terhadap penguasaan konsep fotosintesis dalam kalangan pelajar Tahun Dua di Daerah Kajang.

      Terdapat istilah yang tidak perlu didefinisikan kerana anda menggunakannya dalam konteks yang difahami umum seperti aplikasi, mata pelajaran, pelajar Tahun Dua dan Daerah Kajang. Namun begitu, istilah seperti keberkesanan, koswer animasi, penguasaan konsep perlu didefinisikan secara operasi  dalam konteks kajian anda. Pembaca / penilai tak akan bertanya maksud pelajar Tahun Dua, atau mata pelajaran atau Daerah Kajang. Jika ada 100 orang, mereka akan memberikan maksud yang hampir sama.

      Berbeza dengan istilah seperti koswer animasi, penguasaan konsep. Umum maybe memahami koswer animasi sebagai koswer yang ada animasi seperti gerakkan teks atau objek, namun bagi kajian anda maksudnya agak khusus. Beitu juga degan istilah keberkesanan yang ada maksud yang lebih khusus dalam konteks kajian anda. Maka istilah2 spt ini wajib anda berikan definisi operasi seperti berikut:

      Berikut adalah contoh definisi operasi
      • Keberkesanan - perbezaan skor ujian pasca berbanding dengan ujian pra
      • Koswer animasi - koswer tajuk fotosintesis Tingkatan Dua yang menggunakan animasi bagi menunjukkan proses berlakunya fotosisntesis secara eksplisit. Animasi ini dibina berdasarkan model konstruktivis Posner (2009)
      • Penguasaan konsep - perbezaan min skor ujian pasca dan pra yang diperolehi selepas menjawab 30 soalan konsep berkaitan proses fotosintesis 
      Jangan sekali-sekali (dua kali lagi tak boleh) merujuk definisi dari Kamus Dewan atau kamus apapun lebih-lebih lagi Wikipedia kerana ianya membawa maksud umum dan bukan dalam konteks kajian anda. 

      Tajuk 39: Tiga kriteria Persoalan Kajian yang baik

      Dah banyak saya tulis tentang statistik, mari berbalik kepada kaedah penyelidikan. Saya sering diminta menyemak persoalan kajian dan mendapati ramai yang menulis tanpa memikirkan apa yang sebenarnya yang patut ditulis. Terus terang, saya bukannya pakar dalam semua bidang kajian dan tahu semua perkara. Walau bagaimanapun, penulisan persoalan kajian perlulah mengambilkira perkara berikut, tanpa mengira apapun bidang kajian anda, khususnya kajian kuantitatif:

      1. Elakkan dari membina persoalan kajian yang boleh dijawab dengan Ya atau Tidak
      2. Fokuskan persoalan kajian kepada semua variable yang terlibat dalam kajian
      3. Persoalan kajian akan terjawab dengan "mudah" dari data yang anda kumpulkan diikuti dengan analisis data yang anda pilih.
      Sekali sekala bersantai dengan anak di pantai..... terasa muda he he...

      Tajuk 38: Menguji normality data dari nilai Skewness dan Kurtosis

      Dari Tajuk 37, anda boleh dapat nilai skewness dan Kurtosis. Katakan anda mendapat nilai skewness dan kurtosis masing2 adalah -.712 dan -5.22. Ape mendenye ler pulak dua istilah ini? Skewness adalah kepencongan graf normal samada ke kanan (positif) atau kekiri (negatif). Kurtosis adalah keadaan samada puncak graf kuncup / kurus (negatif) atau lebar (positif) berbanding puncak graf normal.  Nilai skewness dan kurtosis data normal adalah 0. Oleh kerana kedua-dua nilai tersebut berada dalam julat +/-1.7 maka data dikatakan tertabur secara normal. Ada buku yang mencadangkan julat +/-2 masih lagi menunjukkan data masih tertabur secara normal. Anda boleh gunakan maklumat ini selain dari merujuk kepada nilai kenormalan Kolmogorov-Smirnov atau Shapiro-Wilk.


      Komen sikit pasal bandar Sri Manjung..... ....malam2 sibuk ngalahkan KL woo....Lumut plak...... bersih juga ler... tak tahulah jika pergi waktu siang esok!!

      Normal lah jika tunjuk kan adik cara-cara hisap dalam botol!

      Tajuk 37: Bolehkah data dibuang bagi mencantikkan dapatan analisis data?

      Ayah dan anak bujang.. maintain.......
      Saya sedang bercuti di Lumut sambil melawat anak yang praktikal di Hospital Sri Manjung. Malam masih muda. Saya mengimbau kembali bengkel SPSS yang saya kendalikan di UKM 2 hari lepas berkaitan "outliers". Outliers adalah data yang berbeza dari set data anda mungkin terjadi kerana tersalah taip ataupun terlalu berbeza dari data-data yang lain. Anda boleh gunakan operasi Analyse - Descriptive Statistics - Explore bagi mendapatkan nilai mean, median, s.d., 5% trimmed mean, maximum, minimum,  Skewness, Kurtosis dll.

      Katakan nilai mean skor sains = 50.85 manakala nilai 5% trimmed mean = 40.02, bermakna nilai min setelah 5% data outliers / extreme dibuang telah mengubah min dengan banyak. Ini bermakna outliers mempunyai nilai yang sangat berbeza dan lebih sesuai dibuang. Jika nilai 5% trimmed mean = 50.02 iaitu tidak banyak berbeza dengan min sebenar, anda tidak perlu buang nilai outliers ini kerana nilainya bukanlah nilai yang terlalu berbeza.

      Othman Talib
      Sri Manjung

      Thursday, November 25, 2010

      Tajuk 36 : One-Tailed atau Two-Tailed?

      SPSS secara default menyediakan analisis two-tailed. Abis camner dengan kajian anda, one- atau two-tailed?
      Ambil contoh kajian perbandingan skor min kumpulan A dan B

      (i)  Ho: Kumpulan A = Kumpulan B
      (i)  Ha1: Kumpulan A > Kumpulan B (1-tailed)
      (ii) Ha2: Kumpulan A tidak sama Kumpulan B (2-tailed)

      Ha1 adalah hipotesis berarah atau one-tailed  apabila anda ingin menguji bahawa tretment anda akan menyebabkan skor min Kumpulan A > Kumpulan B (atau sebaliknya). Jika ujian anda menunujukkan bahawa nilai Sig. (2-tailed) = 0.064, anda tidak boleh mengatakan ianya tidak signifikan, p>0.05 kerana nilai yang patut anda rujuk adalah 0.064 / 2 = 0.032 (1-tailed). Nilai ini adalah signifikan, p<0.05.

      Ini menunjukkan pengujian hipotesis 1-hala lebih "mudah" mencapai signifikan kerana nilainya separuh dari nilai signifikan 2-tailed. Ini menjadikan pengujian hipotesis 2-tailed lebih "sukar" mencapai signifikan.

      Persoalannya nak guna yang mana 1-tailed ker 2-tailed? Jika anda yakin bahawa satu kumpulan akan mengatasi satu kumpulan lagi anda gunalah 1-tailed. Namun begitu, adalah lebih "selamat" menggunakan 2-hala, sebab itulahlah SPSS menjadikaannya sebagai default.

      Bengkel SPSS - Suka Penyelidikan Suka Statistik !

      Bengkel SPSS UPM - 1

      Seronok menunjukkan analisis yang berjaya dilakukan
      Ni bukan chi square satu hala..... ni dah tak tentu hala....


      Ramai2pun tak boleh buat gak !
      Apo pulok pos hoc ni? Mu tau tak? Aku tok se jumpo bendo ni!


      He...he... mengikut statistik.... gigi kamilah paling cantik di UPM ni !


      Punyalah lama aku dok usha ANOVA ni.... apsal tak dapat?


      Apsal jawapan dia tak sama dengan aku dapat hah?


      Senyum dapat buat ker senyum tak dapat?
      Bengkel SPSS UPM - 2

      Anda berminat (kat saya?) Sila hantar permohonan untuk di proses dalam SPSS !


      Camni punya hipotesis.... dalam hipnosis pun boleh buat daaa.... 


      Tiga dara manis.... sedang bermain data... satu tersalah analisis... tinggal lagi dua...dua dara manis....sedang mati kutu.....satu tersalah analisis... tinggal lagi satusatu dara manis....(sambung sendiri la....)


      Tunjuk ajar ku Shifu....nanti Datin belanja pot-luck


      Mu ni sume mende mu nok klik....Klik hok t-test jer.... 


      Nak guna M-W...Wilcoxon...Kendall....atau.....bedal jer lah!




      Nak posing dulu...data satupun belum key-in lagi...ishk..iskh

      Emmm..... tekun


      Aku ingat ni t-test.... rupanya salah.... saja jer nak test kau !

      Bengkel Penulisan Cepat Tesis 
      Intensif Statistik Inferens dan SPSS di UKM 
      Di Bilik Gerbang Minda UKM
      Macam ni cepat ler aku tulis tesis
      ANOVA...ANCOVA...MANOVA....dan CASANOVA.... hah? 

      Wednesday, November 24, 2010

      Tajuk 35: Antara korelasi dan signifikan.... camner nak interpret?

      Mengukuhkan korelasi dengan Allah
      Bertemu kembali. Selama dua hari, 23 dan 24hb Nov saya berbengkel dengan siswazah UKM (Luv U all..). Saya sendiri mendapat pengalaman berharga. Terima kasih kepada Sdr Kashfi kerana menjemput saya memberi bengkel asas statistik dan SPSS secara intensif.... hingga hilang suara saya kerana bercakap 6 jam tanpa henti.... selama 2 hari..


      Saya ingin mengulas sedikit maksud signifikan bagi korelasi linear  yang menimbulkan beberapa pertanyaan dari peserta bengkel. Perhatikan set dapatan bagi ujian Pearson skor IQ vs EQ berikut yang saya hanya buat andaian:


      a. r = 0.8, sig. = 0.01 (signifikan)
      b. r = 0.8, sig. = 0.06 (tak signifikan)
      c. r = 0.3, sig. = 0.01 (signifikan)
      d. r = 0.3, sig. = 0.06 (tak signifikan)


      a: Hubungan linear yang kuat (r=0.8) yang signifikan (p<.05) antara IQ dan EQ. Signifikan diterjemahkan sebagai sebarang perubahan IQ akan menyebabkan perubahan linear yang signifikan juga pada EQ.  Keyakinan anda tinggi kerana nilai ini signifikan, iaitu korelasi tersebut tidak berlaku secara kebetulan, ianya memang wujud. Ini selalu berlaku jika saiz sampel besar, kerana mudah mengesan hubungan yang wujud secara signifikan.

      b: Hubungan linear yang kuat (r=0.8) yang TIDAK signifikan (p>.05) antara IQ dan EQ.  Keyakinan anda terhadap signifikannya hubungan ini rendah  kerana korelasi tersebut mungkin wujud secara kebetulan sahaja. Ini selalu berlaku jika saiz sampel kecil.

      c: Hubungan lemah  (r=0.3) tetapi signifikan (p<.05) antara IQ dan EQ. Signifikan diterjemahkan sebagai sebarang perubahan IQ akan menyebabkan perubahan linear yang rendah tetapi signifikan pada EQ.  Keyakinan anda tinggi untuk menyatakan nilai ini sememang rendah kerana nilai ini signifikan. Ini selalu berlaku jika sampel saiz besar, kerana saiz sampel yang besar dapat mengesan korelasi yang kecil secara signifikan.

      d. Hubungan lemah (r=0.3) yang TIDAK signifikan (p>.05) antara IQ dan EQ.   Keyakinan anda rendah untuk menyatakan nilai ini sememangnya rendah, iaitu korelasi yang rendah tersebut mungkin berlaku secara kebetulan. Ini selalu berlaku jika saiz sampel kecil - dahlah r rendah tak signifikan pulak!!


      Kesimpulan: Nilai r dan nilai signifikan adalah 2 benda berbeza. Anda boleh mendapat r yang kuat, tetapi kerana sampel anda kecil, nilai tersebut tidak signifikan, bermakna anda tidak boleh pasti hubungan yang kuat tersebut memang wujud atau secara kebetulan berdasarkan sampel yang kecil. 


      Anda boleh dapat r yang kecil tetapi signifikan, kerana saiz sampel yang besar, iaitu walaupun r kecil, keyakinan anda signifikan untuk mempercayai nilai r tersebut. Dgn lain perkataan, korelasi tersebut boleh dipercayai wujud walaupun lemah, bukan sekadar berlaku secara kebetulan.


      Anda juga boleh dapat nilai r yang kecil dan tidak signifikan wpun saiz sampel besar. Ini membuatkan anda percaya bahawa korelasi antara variable tersebut sememang kecil.


      Jadi signifikan merujuk kepada keyakinan anda kepada nilai r yang diperolehi.... moral of the story pastikan saiz sampel anda mencukupi untuk anda mempercayai serta mempertahankan dapatan. Jika tidak.... anda akan bye-bye masa viva.... 

      Monday, November 15, 2010

      Tajuk 34: Apa konsep pengiraan dalam stat bukan parametrik

      Bab tidur Zuhayr ranking ketiga selepas Nine dan Zahin
      Dari Tajuk 33, jelas stat bukan parametrik tidak menepati ciri-ciri normal. Jadi bagaimana pengiraan dilakukan? Katakan anda meminta dua kumpulan 5 pelajar anda menjawab soalan kuiz dan mereka mendapat skor berikut: Kumpulan A: 55, 56,57,59,61 dan kumpulan B: 54, 58,60,62,63.


      Anda tidak boleh menganalisis menggunakan prosidur stat parametrik kerana data kecil dan tak tertabur secara normal. Maka anda ranking data tersebut dari data terkecil hingga sebagai terbesar (nilai terkecil sentiasa mendapat 1). Anda susun semua data: 54, 55,56,57,58,59,60,61,62,63,64 dengan ranking 1,2,3,4,5,6,7,8,9,12


      Maka ranking kumpulan adalah seperti berikut:


      Kumpulan A: 2,3,4, 6, 8 dan Kumpulan B: 1,5, 7, 9, 10


      Operasi pengiraan akan berdasarkan nilai ranking ini seperti jumlah ranking, min ranking, s.p dan seterusnya  dan BUKAN lagi nilai skor asal atau skor mentah kedua-dua kumpulan. Ini bermakna anda tidak menggunakan nilai data mentah sebenar (55,56,57...71) sebaliknya menggunakan nilai ranking (1,2,3,,,10) tersebut. Ini sekadar asas.....kerana pengiraan statistik bukan parametrik seperti Mann-Whitney, Kruskal-Wallis etc ada syarat, andaian dan rumusnya tersendiri...


      OT

      Tajuk 33: Cian statistik bukan parametrik... dahlah tak fofular dikatakan lemah pula...

      SK Undang Rembau, 1971.. 40 tahun yang lepas
      (Fuhh..cam tak caya !)
      Saya masih termimpi-mimpi untuk menjelaskan statistik bukan parametrik ini....sebab dahlah ianya tak fofular... dikatakan lemah pula....Nak tahu kenapa....Anda terpaksa gunakan ujian statistik bukan parametrik (jangan salah taip paramedic pulak...)... apabila anda berhadapan dengan situasi berikut....(jgn main hentam sahaja semuanya parametrik)


      a) Anda mengukur IQ pelajar sebuah kolej dan anda dapati 80% pelajar mempunyai skor rendah dan sederhana iaitu graf normal anda terpesong ke kiri (atau ke kanan.... ). Dalam keadaan ini anda xboleh gunakan statistik parametrik yang berasaskan taburan normal....


      b) Anda mengumpulkan pelajar anda untuk mendapatkan skor kreativiti, malang sungguh hanya 7 pelajar sahaja yang hadir dari 45 orang sebab masa tu ada van Milo bagi air free kat kolej...dah pasti ler data ini tidak normal...Abih jika dah tak normal...samaler macam ker (i) di atas


      c) Anda mengedarkan soal selidik bagi mengetahui samada 50 pelajar anda berada dalam kategori "sudah berpunya", "masih single" atau "sedang bercinta". Anda mengkategorikan pelajar anda kepada 3 dengan mengira frekuensi setiap satunya. Anda sebenarnya tidak mengukur apa2pun.... tidak ada sebarang skor pun anda ambil (katalain xde DV). Jika tak ada skor, manalah ade pengiraan min ker... s.piawai ker... apatah lagi nak dapatkan t obtained....so tak derlah pengujian parametrik yang anda boleh lakukan...

      Begitulah ader nyer....


      OT

      Saturday, November 13, 2010

      Tajuk 32 - Kenapa skala nominal dan ordinal tidak normal?

      Tahukah anda menjawab persoalan di atas? Jangan baca artikel ini....cuba ler jawab dulu. Amacam tahu tak.....emmmm


      Ramai yang tahu (sebab semua buku menulis begitu, pensyarahpun kata gitu...), data dengan skala ratio dan interval boleh menggunakan ujian parametrik kerana data tertabur secara normal. Data dengan skala nominal dan ordinal pula menggunakan statistik bukan parametrik kerana data tidak tertabur secara normal. Soalan saya, mengapa data nominal dan ordinal tidak boleh tertabur secara normal?


      Ambil contoh anda mengkaji populasi dengan 10 ribu responden KL dan 10 ribu lagi di London dan mengambil ukuran berikut: Ketinggian (ratio), IQ (interval), Agama (nominal) dan Persetujuan kawin sejenis (ordinal)


      Dengan yakin anda akan menjawab:
      Ketinggian - terdapat sebahagian kecil responden di KL dan London mempunyai ketinggian yang ekstrem (sgt pendek atau sgt tinggi) dan majoriti mempunyai ketinggian menghampiri purata - bermakna data tertabur secara normal


      IQ - terdapat sebahagian kecil responden di KL dan London mempunyai skor IQ yang ekstrem (sgt rendah atau sgt tinggi) dan majoriti mempunyai IQ menghampiri IQ purata - bermakna data tertabur secara normal


      Agama - bolehkah anda jangkakan agama Hindu dan Buddha mempunyai bilangan sangat ekstrem (sgt sedikit atau sgt banyak) dan majoriti adalah Islam atau agama lain di KL dan London? No way man... sebab tidak mungkin data tertabur secara normal (mana sama KL dgn London)


      Persetujuan kawin sejenis - bolehkah anda jangkakan sedikit sahaja yang "sangat tidak bersetuju" atau "sangat bersetuju" dan majoriti "Antara bersetuju dengan tidak bersetuju" samada responden di KL atau London. No way man...sebab data tidak mungkin tertabur secara normal. Di KL mungkin majoriti tak setuju.... tapi di London mungkin majoriti setuju.....  Kalau di KL, bukan sahaja dapatan tidak normal, kawin sejenispun dianggap tidak normal, ntah2 soalselidik pun tak dilulus untuk diedarkan secara formal!!


      Sebab itu t-test yang diasaskan dari graf taburan normal tidak boleh dijalankan pada data nominal dan ordinal sebab data dengan skala tersebut tidak tertabur secara normal.... kwang kwang kwang....


      Duniaku dihujung jari.....
      OT

      Thursday, November 11, 2010

      Tajuk 31 - Adakah Chi square statistik inferens?

      Secara asas, Chi square membandingkan frekuensi yang dikira, fo (katakan 55 suka Nokia dan 45 suka Ericsson) dengan frekuensi dijangka, fe (50 suka Nokia dan 50 suka Ericsson) iaitu chi square = Jumlah (fo - fe / fe.)


      Jika tiada perbezaan , fo - fe / fe = 0. 


      Katakan anda mengambil sampel dari populasi, anda boleh mengira nilai chi square bermula dari 0 dan menyediakan jadual taburan chi square. Oleh itu, chi square adalah statistik inferens walaupun ia statistik bukan parametrik. Dalam ayat lain, chi square adalah statistik bukan parametrik yang boleh dibuat inferens. Sebab itu, anda perlu menguji hipotesis juga untuk chi square disamping menetapkan nilai alfa sebagaimana anda lakukan untuk ujian-t dan ANOVA.


      Alahai manjanyer.....

      Tajuk 31 - Bolehkan dapatan korelasi Pearson diinferenskan?

      Konsep korelasi antara dua variabel mudah difahami dengan mengira koefisien korelasi, r (+1 hingga -1). Tapi bolehkah inferens dilakukan dengan korelasi sebagaimana ujian-t iaitu membuat generalisasi berdasarkan korelasi sampel?


      Taburan persampelan (spt taburan normal) dibina dari nilai koefisien korelasi Pearson, r dengan nilai 0 (tiada korelasi antara dua variabel = spt tiada perbezaan antara min) setara dengan z = 0. Bagi taburan persamplean korelasi, nilai r = 0 berada ditengah2 taburan. Jika 2 variable dari satu SAMPEL diambil dari POPULASI yang sama diulang 19 kali, anda akan dapat 20 nilai r yang berbeza, katakan r1, r2,r3...r20.


      Dengan menganggap nilai2 r ini sebagai data, anda boleh plotkan graf taburan normal bagi persampelan korelasi. Dengan cara yang sama, anda boleh mengira nilai r-value (seperti konsep t-obtain) dan bandingkan dengan r kritikal yang diperolehi dari jadual taburan Pearson. Anda sebenarnya telah menjalankan proses yang membolehkan anda membuat INFERENS dapatan sampel anda kepada populasi. Phew....
      Husna dan Uzma sedang berkolerasi dengan kuda



      Wednesday, November 10, 2010

      Tajuk 30 - Konsep ANOVA

      Ujian-t terhad hanya kepada SATU IV dengan dua kategori sahaja seperti membandingkan min skor teknik pengajaran (SATU IV) yang berbeza iaitu penggunaan ICT dan Transparensi (2 kategori). Mudah kata, ujian-t terhad kepada perbandingan min dua kumpulan sahaja iaitu kumpulan ICT dengan kumpulan transparensi.


      Jadi... cinta anda beralih arah pula kepada sicantik manis berambut blonde bernama ANOVA satu-hala dan kakaknya ANOVA dua-hala (atau ANOVA faktorial).


      Satu dan dua hala  merujuk kepada IV (juga disebut factor) yang terlibat. Katakan anda banding satu IV iaitu kaedah mengajar dengan 3 tahap berbeza - ICT , Video dan role play (Ingat - ada SATU IV sahaja disini iaitu kaedan pengajaran!). Anda akan membandingkan variability data bagi 3 kumpulan berbeza, A (ICT), B (video) dan C (role play):


      (i)  Between-groups, BG - untuk mengetahui kesan pengajaran berbeza (treatment) yang diterima kumpulan A,B dan C dalam bentuk perbandingan skor ANTARA kumpulan A, B dan C. Skor yang berbeza menunjukkan kesan pengajaran (treatment) yang berbeza ke atas masing2 kumpulan
      (ii) Within-group, WG - untuk mengetahui kesan pengajaran yang sama ke atas skor setiap individu dalam kumpulan masing-masing. Skor ini menunjukkan adakah treatment yang sama memberikan variation skor yang sama.


      Konsep ANOVA:
      • Anda bandingkan nisbah mean square (MSB) between dan mean square within (MSW) untuk dapat nisbah F 
      • F = MSB / MSW
      • Anda sebenarnya membandingkan mean square bagi variation antara kumpulan (BG) berbanding mean square dalam kumpulan (WG).
      • Jika MSB > MSW maka variation tersebut disebabkan oleh treatment.
      • Jika tiada apa2 treatment dan semua kumpulan homogen dengan min yang sama maka: F ~ 1
      • Jika treatment diberikan berkesan maka F > 1 iaitu perubahan skor BG > WG menunjukkan treatment yang berkesan.
      • Sebab itu graf taburan-F (sempena nama pengasasnya Fisher) bagi ANOVA hanya one-tailed sahaja (sebelah kanan sahaja sebab >1, perhatikan semua nilai dalam jadual taburan F sentiasa > 1.)
      Persoalannya samada nilai F > 1 tersebut cukup besar untuk menunjukkan perbezaan yang signifikan, anda terpaksa mengira F obtained dan bandingkan dengan F kritikal, sama seperti ujian-t.


      Oleh kerana anda menggunakan taburan, yang mana anda akan membuat inferens, maka pengiraan anda akan melibatkan darjah kebebasan (baca tajuk 50 dalam blog ini kenapa anda perlukan df)




      Taburan F ada DUA degrees of freedom, df1 untuk numerator (within-group) dan df2 for the denominator (between-group). Bila df meningkat, taburan F less dispersed. Taburan F bergantung juga kepada nilai alfa (signifikan level). Jadi anda kena baca nilai F berdasarkan nilai alfa yang anda tentukan dari awal.


      Jika alfa = 0:05, df1 = 20 bagi numerator, and df2 = 5 bagi denominator, maka nilai F kritikal adalah 4.56 (F20;5;0:05 = 4:56)


      • df bagi within-group adalah df1 = k -1 (jika ada 3 kump. maka 3 -1)
      • df bagi between-group adalah df2 = n - k (jika ada 30 bil sampel, 3 kump. maka 30 - 3)
      (Bagi memudahkan anda ingat - setelah anda faham - maka k = bil. kump. dan n = bil. sampel)


      Tua muda miskin kaya kecik besaq....semua ada fesbuk !




      OT


      Tajuk 29 - Ujian-t sampel bersandar dan tak bersandar

      Bagi membandingkan min dua sampel (seperti dependent dan independent sample t-tests) konsep yang sama untuk membina sampling distribution of mean digunakan. Bezanya, bukan individu min skor (katakan ada 20 seperti contoh Tajuk 24) sebaliknya anda membina sampling distribution of differences between mean.

      Dengan cara yang sama, jika anda ambil 2 sampel berbeza (katakan na = 30 dan nb=30) dari populasi yang sama (N=2000), dan anda bandingkan min xa – xb. Ulangi 19 kali lagi. Jadi anda mempunyai 20 skor perbezaan (xa – xb) katakan xx1, xx2, xx3…xx20.  Dengan menganggap  xx1, xx2, xx3…xx20 sebagai 20 data individu, anda boleh  plotkan data ini dan anda akan dapati min-min ini (sebagai data individu) juga akan tertabur secara normal,  maka anda akan dapat graf normal yang dinamakan sampling distribution of differences between mean. Jika anda tukar 20 data ini sebagai data piawai atau skor z , anda juga akan dapati min = 0 dengan s.d antara +3 dan -3 sebagaimana z-distribution. Dengan ini anda boleh menggunakan taburan t untuk mencari nilai t kritikal dan membuat pengiraan untuk mendapatkan t obtain dalam pengujian hipotesis.

      Tajuk 28 – Kenapa dinamakan pengujian hipotesis?

      Anda dah tahu taburan-z dengan Central Limit Theorem bagi menghasilkan sampling distribution of mean dan taburan-t. Anda ingin bandingkan min sampel dengan min populasi maka anda bina hipotesis null: Ho = min sampel tidak berbeza dari min populasi.

      Bagi menguji samada min sampel yang dibandingkan dengan min populasi (single-sample t-test) berbeza secara signifikan (termasuk dalam kawsan kritikal) maka langkah pengiraan t obtain perlu dijalankan bagi dibandingkan dengan t kritikal. Jika t obtain > t kritikal (pada alfa 0.05) maka wujud perbezaan yang signifikan antara kedua-dua min skor bagi sampel dengan min populasi. Langkah pengiraan dan perbandingan ini dinamakan pengujian hipotesis.

      Tajuk 27 – Z-test atau t-test?

      Guna z-test bila anda ada mempunyai nilai min dan s.d bagi populasi. Dalam banyak keadaan, sukar untuk mendapatkan kedua-dua nilai ini. Sebab itu, konsep pembinaan taburan z digunakan bagi satu set data sampel yang tertabur secara normal yang menghasilkan taburan-t. Pengiraan skor z dan z obtain dalam tajuk yang lepas dibuat sedikit modifikasi bagi mengira skor t dan t obtain. Oleh kerana kajian menggunakan sampel maka t-test digunakan bukan z-test kerana anda mengambil min dan s.d sampel. Sampel dengan bilangan n > 30 boleh menggunakan taburan z. Taburan t digunakan bagi sample yang kecil. n <30.

      Apabila nilai min digunakan bagi membuat inferens pada populasi, maka pengiraan ini melibatkan estimation. Sebarang nilai yang melibatkan estimation bagi mewakili sesuatu nilai yang lain khususnya yang melibatkan  taburan normal (sampel ke populasi) mestilah melibatkan darjah kebebasan, df. 

      Tajuk 25 – Awas kawasan kritikal…dan konsep signifikan

      Dalam Tajuk 24, saya katakan apabila anda menguji hipotesis (katakan ujian-t) anda sebenarnya menggunakan graf normal yang terhasil dari sampling distribution of mean (min bagi sampel2) untuk membuat inferens kepada graf normal z-distribution (bagi populasi) iaitu anda menginferens dari sampel ke populasi.

      Bwh kawasan graf normal (skor z) bagi sampling distribution of mean, terdapat dua hujung graf yang mana nilai z skor adalah ekstrem dan jarang ditemui (wpun ada dalam taburan).  5% kawasan katakan hujung kanan graf dinamakan kawasan kritikal kerana sangat jarang menemui nilai min seperti yang berada dalam kawasan tersebut kerana nilai minnya ekstrem. Ini sama seperti anda menyebut aras signifikan (alfa = 0.05). Kawasan ini mempunyai nilai skor z = 1.65 (anda kena tahu ingat kuliah statistik anda). 

      Sekiranya anda mempunyai min sekumpulan pelajar yang diambil dari populasi yang sama (rujuk Tajuk 24), dan dapati skor z = 1.78 (dinamakan z obtain) adalah melebihi nilai 1.65, maka min ini termasuk dalam kawasan kritikal. Kawasan ini adalah kawasan yang anda boleh rumuskan bahawa min kumpulan tersebut sangat berbeza secara signifikan (atau cukup besar perbezaannya) dari min populasi yang normal. Ini menunjukkan ada sesuatu yang telah menyebabkan min sampel tersebut berbeza dari min populasi dari mana sampel tersebut diperolehi.

      Jika anda membuat kajian eksperimen terhadap sampel tersebut, maka dengan yakin (aras keyakinan 95%, aras signifikan 0.05) anda boleh katakan perbezaan tersebut adalah disebabkan oleh kajian anda.              

      Tajuk 24: Apa maksud inferens? Bila berlakunya inferens?

      Susah juga untuk jelaskan konsep statistik yang melibatkan rumus kerana apabila saya menaip dalam Word, rumus tersebut tidak muncul dalam blog ini. Jadi saya terpaksa guna “min” menggantikan symbol “x mew”. Mudah-mudah dapat membantu pemahaman anda.


      Inferens adalah membuat generalisasi sampel ke populasi. Bila perkara ini berlaku? Saya cuba ringkaskan konsepnya sahaja. Namun, anda kena faham asas statistik juga. 

      Katakan anda ada data skor Sains bagi populasi pelajar (N=2000)  yang tertabur secara normal.
      (i) Lukis graf normal dengan min skor Sains katakan,  min = 50, s.d = 5
      (ii) Tukar skor kepada skor piawai atau skor-z (ini dipelajari dalam kelas statistik dgn rumus) , maka anda akan dapat SATU graf normal dengan min = 0, s.d = 1
      (iii) Graf normal ini dinamakan graf taburan piawai atau z-distribution  yang mempunyai ciri-ciri (a) simetri, (b) min = 0, (c) s.d = 1 dan (d) julat s.d antara -3 dan +3

      Dengan cara yang sama, jika anda ambil 20 sampel dengan setiap satu sampel mempunyai n = 30 dari populasi yang sama di atas (N=2000), anda tentu mempunyai 20 min skor yang berbeza bagi setiap kumpulan, katakan min1, min2, min3, min4….min20 kerana wujudnya ralat persampelan (sampling error). Memanglah sebab mana mungkin min sampel sama dengan min populasi, mesti ada ralat. 

      Dengan menganggap  min1, min2, min3, min4….min20  yang berbeza ini sebagai 20 data individu, anda boleh  plotkan data ini dan anda akan dapati min-min ini (sebagai data individu) juga akan tertabur secara normal (ciri-ciri Central Limit Theorem), maka anda akan dapat juga graf normal yang dinamakan sampling distribution of mean bagi kumpulan 20 sampel tersebut. Jika anda tukar 20 data ini sebagai data piawai atau skor z (ada rumusnya), anda juga akan dapati min =0 dengan s.d antara +3 dan -3 sebagaimana z-distribution (populasi). Jadi anda boleh layan sampling distribution of mean ini sebagaimana graf taburan normal yang biasa apabila ditukar ke skor z.

      Ingat !! Apabila anda menguji hipotesis (macam ujian-t) menggunakan sampling distribution of mean, anda sebenarnya sedang membuat inferens kepada z-distribution iaitu dari sampel ke populasi!!

      Saturday, November 6, 2010

      Tajuk 23 – Ada byk rekabentuk eksperimental...mana nak pilih?

      Sikitpun salah... banyak pun salah... Kajian eksperimental umumnya terbahagi kepada dua iaitu (a) rekabentuk mudah (rekabentuk satu kumpulan, pasca ujian sahaja, rekabentuk dengan kumpulan kawalan dll) dan (b) rekabentuk kompleks (factorial, rekabentuk 4-kumpulan Solomon dll). Saya mudahkan bahawa pemilihan bergantung kepada tiga faktor seperti (i) tujuan kajian (ii) kekangan peruntukkan (masa/ kewangan) (iii) kajian lepas.

      Jika kajian anda peringkat sarjana, pilihlah rekabentuk mudah dan kompleks yang popular spt true experimental dengan rekabentuk “pre-test and posttest control group” atau rekabentuk kompleks factorial 2 x 2. Bagi PhD, anda perlu tambah variable dan hipotesis kajian.  Dengan kekangan masa dan kewangan, rekabentuk seperti 4-kumpulan Solomon wpun ada kelebihan tetapi sangat sukar dijalankan kerana ada 4 kumpulan yang perlu dikawal. Jika kajian lepas dalam bidang yang anda ingin kaji menggunakan rekabentuk komplek, anda tidak boleh memilih kajian dengan rekabentuk yang lebih mudah. Lakukan kajian sekurang2nya setara dengan rekabentuk kebnykkan kajian lepas dalam bidang tersebut.
        

      Related Posts Plugin for WordPress, Blogger...