Sukar nak jelaskan konsep df ni, khususnya bagi pelajar sains sosial / pendidikan. Wbagaimanapun, cubalah fahami contoh berikut:
Konsep df tidak perlu dalam statistik deskriptif sebab anda mengira data mentah secara terus, spt mencari min atau mode satu set data mentah. Begitu juga, bila ada ada taburan populasi, anda gunakan data mentah bagi mengira min (parameter) bagi populasi tersebut. Konsep df hanya diperlukan apabila anda menggunakan data dari sampel katakan min sampel (statistik) bagi menganggar satu nilai katakan min populasi (parameter) bagi membuat inferen. Dalam bahasa mudah apabila melibatkan inferens, penggunaan data ini tidak secara terus, anda menggunakan nilai statistik untuk menganggar parameter, maka anda tidak bebas menggunakan data dari sampel tersebut, ada satu df yang perlu anda patuhi. Sebab itu bila anda semak taburan pupulasi (parameter) tiada df diperlukan. TETAPI bila anda semak taburan t, atau F atau chi square, anda perlu ambilkira df yang didasarkan kepada n dan bilangan parameter yang anda ingin buat inferen. Sebab itu ada df bagi jadual taburan tersebut.
Cuba perhatikan contoh berikut: Katakan anda ingin menganggar varians dalam pengiraan ketinggian seluruh populasi pelajar UPM, maka anda kena tahu min populasi pelajar UPM. Ingat - varians adalah pengiraan yang melibatkan perbezaan antara individu data dengan min, kemudian dikuasadua bagi mengatasi masalah nilai negatif hasil perbezaan tersebut. Oleh kerana anda tidak tahu min populasi ketinggian pelajar UPM (tak tahu sebab takkan mungkin dapat ukur ketinggian semua pelajar UPM), maka anda menganggar min tersebut daripada sampel (statistik) yang diambil secara rawak (sebab itu antara andaian ujian-t, sampel rawak dan tertabur secara normal).
Katakan anda mengukur ketinggian sampel dua pelajar UPM (n = 2) ,iaitu 4 dan 5 kaki (cukuplah dua sampel sbg contoh), maka anggaran anda bagi min populasi adalah:
Cuba perhatikan contoh berikut: Katakan anda ingin menganggar varians dalam pengiraan ketinggian seluruh populasi pelajar UPM, maka anda kena tahu min populasi pelajar UPM. Ingat - varians adalah pengiraan yang melibatkan perbezaan antara individu data dengan min, kemudian dikuasadua bagi mengatasi masalah nilai negatif hasil perbezaan tersebut. Oleh kerana anda tidak tahu min populasi ketinggian pelajar UPM (tak tahu sebab takkan mungkin dapat ukur ketinggian semua pelajar UPM), maka anda menganggar min tersebut daripada sampel (statistik) yang diambil secara rawak (sebab itu antara andaian ujian-t, sampel rawak dan tertabur secara normal).
Katakan anda mengukur ketinggian sampel dua pelajar UPM (n = 2) ,iaitu 4 dan 5 kaki (cukuplah dua sampel sbg contoh), maka anggaran anda bagi min populasi adalah:
Min populasi = (4+5)/2 = 4.5.
Dan jika anda kira dua anggaran varians ini dari dua sampel:
Anggaran 1 = (4-4.5)2 = 0.25 (anda guna min sample anggar varians populasi)
Anggaran 2 = (5-4.5)2 = 2.25
Anggaran 2 = (5-4.5)2 = 2.25
Adakah anggaran 1 dan 2 bersandar atau bebas antara satu sama lain? Tentulah bersandar sebab pengiraan 1 dan 2 saling berkait iaitu setiap nilai ketinggian menyumbang kepada pengiraan min populasi (4.5) bagi kedua2 pengiraan varians. Oleh itu, dua pengukuran yang melibatkan dua sampel ini saling bersandar, maka anda hanya ada satu darjah kebebasan sahaja dalam menentukan nilai varians populasi. Pening ke? Teruskan membaca....
Perkaitan antara bilangan observation (dalam kes ini bilangan sampel atau n) dengan bilangan parameter yang dikira, k adalah df = n – k . Dalam kes ini, k adalah 1 iaitu min populasi (parameter) yg dianggar dari min sampel. Ini kerana df adalah satu fungsi bagi bilangan observation atau bilangan sampel, n dan bilangan parameter, k yang dianggar. Dalam kes ini, df = n -1 kerana hanya ada 1 parameter yang dianggar. Dalam kes ini juga terdapat dua observation (4 dan 5), dan kita perlu menganggar satu parameter (min populasi). Maka, untuk menganggar varians seterusnya dengan satu min populasi yang dianggar, anda mempunyai df = n - k, atau df = 2 - 1 = 1.
Bagi mengurangkan kepeningan anda, sebagai analogi, sama seperti anda mempunyai 6 pelajar yang anda ingin letakkan dalam berbagai posisi sebagai satu pasukan bola tampar, maka anda hanya ada darjah kebebasan 5 sahaja untuk meletakkan pelajar dalam mana2 posisi, kerana pelajar yang terakhir iaitu pelajar ke 6 tiada pilihan untuk diletakkan dimana2 posisi. Dia terpaksa mengisi satu posisi terakhir yang tinggal. Dengan n = 6, dan k = 1 (iaitu posisi - menganggar posisi dalam permainan) maka df = n - k atau df = 6 -1 = 5.
Secara amnya, df = (bil observation atau data individu yang terlibat dalam estimation) – (bilangan parameter). Mungkin satu lagi cara memahami konsep df adalah dengan melibatkan, katakan empat nombor p,q,r,s (katakan mewakili empat data atau observation) yang setiap satunya mesti dikira bagi mendapatkan min 20 (katakan min mewakili parameter yang ingin dianggar), maka anda boleh menentukan dengan bebas tiga nombor sahaja secara rawak, sedangkan nombor ke empat tidak bebas atau tetap yang akan menjadikan min 20. Jadi df = n-1 = 4 – 1 = 3. Oleh kerana kita membuat anggaran atau inferens sampel ke populasi spt dalam t-test, F-test…. Chi-square….. kita memerlukan df.
Jika anda ada dua kumpulan pula katakan A dan B....untuk ditentukan posisi, k(AB) = 2 iaitu mencari posisi bagi dua pasukan berbeza dengan nA = 6 dan nB = 6 maka df = (nA + nB) - 2 atau df = n - k = 12 - 2 = 10.
Camner lagi nak diperjelaskan....?
Bagi mengurangkan kepeningan anda, sebagai analogi, sama seperti anda mempunyai 6 pelajar yang anda ingin letakkan dalam berbagai posisi sebagai satu pasukan bola tampar, maka anda hanya ada darjah kebebasan 5 sahaja untuk meletakkan pelajar dalam mana2 posisi, kerana pelajar yang terakhir iaitu pelajar ke 6 tiada pilihan untuk diletakkan dimana2 posisi. Dia terpaksa mengisi satu posisi terakhir yang tinggal. Dengan n = 6, dan k = 1 (iaitu posisi - menganggar posisi dalam permainan) maka df = n - k atau df = 6 -1 = 5.
Secara amnya, df = (bil observation atau data individu yang terlibat dalam estimation) – (bilangan parameter). Mungkin satu lagi cara memahami konsep df adalah dengan melibatkan, katakan empat nombor p,q,r,s (katakan mewakili empat data atau observation) yang setiap satunya mesti dikira bagi mendapatkan min 20 (katakan min mewakili parameter yang ingin dianggar), maka anda boleh menentukan dengan bebas tiga nombor sahaja secara rawak, sedangkan nombor ke empat tidak bebas atau tetap yang akan menjadikan min 20. Jadi df = n-1 = 4 – 1 = 3. Oleh kerana kita membuat anggaran atau inferens sampel ke populasi spt dalam t-test, F-test…. Chi-square….. kita memerlukan df.
Jika anda ada dua kumpulan pula katakan A dan B....untuk ditentukan posisi, k(AB) = 2 iaitu mencari posisi bagi dua pasukan berbeza dengan nA = 6 dan nB = 6 maka df = (nA + nB) - 2 atau df = n - k = 12 - 2 = 10.
Camner lagi nak diperjelaskan....?
Zahin ni ada df yang tinggi sebab tu bebas tidor kat mana2... |
No comments:
Post a Comment