Assalamualaikum wbt. Saya ingin bertanya. Saya juga dinasihatkan berkenaan beralih kepada ujian Mann Whitney jika tak boleh buat ujian t. Cuma concern saya, dimaklumkan oleh seorang guru yang saya kene kukuhkan pembuktian ujian Mann Whitney dengan buat "Compare Mean" (menggunakan SPSS).
Boleh Dr jelaskan hal ni? Terima kasih dan wassalam.
Anonymous
Respon:
Saya tak sure maksud guru tuan trsebut. Mungkin dia bermaksud compare mean antara kumpulan yang u dapat. Jika perbezaannya besar, maknanya boleh guna MW sebab berkemungkinan akan dapat juga perbezaan. Jika perbezaan min kecil, maka sukarlah nak dapat perbezaan (yg signifikan) jika guna MW sebab ia kurang power. Betul tak? Ini andaian sahaja. Malahan perbezaan min samada besar atau kecil BUKAN syarat guna t-test mahupun MW.
Bagi saya, itu bukan isunya. Bila U buat EDA (exploratory data analysis termasuk menyemak kenormalan atau mendapatkan nilai min) dan dapati data tidak normal, maka tidak timbul lagi nak "compare mean", anda sepatutnya terus cadangkan penggunaan MW, then baru analisis hasilnya. Inilah cara yang sistematik. Setuju ?
Wbgmanapun, saya akan jelaskan rasional guna Mann-Whitney (MW) TANPA perlu "compare mean" sebab ini TIDAK termasuk syarat dalam penggunaan baik t-test mahupun MW.
Bagi saya, itu bukan isunya. Bila U buat EDA (exploratory data analysis termasuk menyemak kenormalan atau mendapatkan nilai min) dan dapati data tidak normal, maka tidak timbul lagi nak "compare mean", anda sepatutnya terus cadangkan penggunaan MW, then baru analisis hasilnya. Inilah cara yang sistematik. Setuju ?
Wbgmanapun, saya akan jelaskan rasional guna Mann-Whitney (MW) TANPA perlu "compare mean" sebab ini TIDAK termasuk syarat dalam penggunaan baik t-test mahupun MW.
Tuan guna t-test utk compare mean dua kumpulan tak bersandar dengan syarat saiz sampel dan variance yang setara (equal) yang tertabur secara normal.
Tuan guna MW jika bandingkan median dua kumpulan tak bersandar tetapi bebas syarat.
Jika syarat tersebut dipenuhi, statistical power bagi t-test adalah tinggi berbanding ujian MW.
Tetapi jika syarat tidak dipenuhi, hasil dapatan t-test mungkin lebih tersasar BERBANDING ujian MW yang robust kepada syarat tersebut. Tambahan, ujian MW (yang guna median) tidak dipengaruhi oleh outlier atau taburan yang skewed berbanding dengan t-test (yang guna min). Pendek kata, ujian MW adalah lebih appropriate berbanding t-test bila anda dapati taburan tidak normal dan nilai skewness tinggi.
Jika tuan ada data berikut sebagai analogy:
Ujian parametric:
2,4,3,5,4,6,3,3 maka min = 3.2 (min menggambarkan data keseluruhan)
2,4,3,5,4,6,3,30 maka min =6.6 (min berubah dengan data extreme yang menjadikan taburan tidak normal atau skewed)
Ujian bukan parametric:
2,4,3,5,4,6,3,3 maka median = 4 (susun dulu ikut urutan)
2,4,3,5,4,6,3,30 maka median = 4 (median tidak berubah wpun ada data outlier /extreme iaitu 30)
Perhatikan bagaimana min 3.2 mewakili keseluruhan data dan lebih power kerana pengiraan min melibatkan setiap individu data. Malangnya nilai min ini berubah dengan ketara menjadi 6.6 APABILA TABURAN TIDAK NORMAL atau SKEWED.
Sementara itu, median kurang power kerana ia ditentukan selepas semua data disusun mengikut urutan kecil ke besar (ranking) dan hanya satu nombor penengah (median) dipilih tanpa melibatkan sebarang pengiraan. Namun begitu nilai median 4 konsisten berbanding nilai 6.6 yang terpesong jauh. Sebab itu jika data terpesong, tidak normal maka ujian bukan parametric diutamakan. Laporan anda LEBIH TEPAT yang menggambarkan taburan data jika anda laporkan median = 4 berbanding min = 6.6 !!
Jika U guna juga ujian parametrik, u akan dapat perbezaan 3.2 dan 6.6, walhal keduanya adalah setara. Perbezaan disebabkan data yang skewed, maka kesimpulan U SALAH ! Jika u guna bukan parametrik, kesimpulan u lebih tepat nilai 4 tidak berubah sebab ujian bukan parametrik adalah ROBUST kepada skewness.
Moga tuan dan pembaca lain akan lebih jelas....jgn blur2...
OT
Sementara itu, median kurang power kerana ia ditentukan selepas semua data disusun mengikut urutan kecil ke besar (ranking) dan hanya satu nombor penengah (median) dipilih tanpa melibatkan sebarang pengiraan. Namun begitu nilai median 4 konsisten berbanding nilai 6.6 yang terpesong jauh. Sebab itu jika data terpesong, tidak normal maka ujian bukan parametric diutamakan. Laporan anda LEBIH TEPAT yang menggambarkan taburan data jika anda laporkan median = 4 berbanding min = 6.6 !!
Moga tuan dan pembaca lain akan lebih jelas....jgn blur2...
Spek biar hitam, hati mau baik..... statistik jgn blurrr.......bro ! |
Terima kasih banyak2 dan wassalam.
ReplyDeleteThanks Dr OT...a very useful and crystal clear explanation! thumbs up to u!!
ReplyDelete