Apakah Statistik Chi-Square?
A chi-square ( χ 2) Statistik adalah ujian yang mengukur bagaimana jangkaan berbanding dengan data sebenar (atau keputusan model) yang diperhatikan. Data yang digunakan untuk mengira statistik chi-square mestilah rawak, mentah, saling eksklusif, diambil dari pembolehubah bebas, dan diambil dari sampel yang cukup besar. Contohnya, keputusan melambungkan duit syiling sebanyak 100 kali memenuhi kriteria ini.
Ujian Chi-square sering digunakan dalam ujian hipotesis.
Formula untuk Chi-Square Is
χc2 = Σ (Oi-Ei) 2Endhere: c = darjah kebebasanO = nilai yang diperhatikan E = nilai yang dijangkakan \ begin {sejajar} & \ chi ^ 2_c = \ sum \ frac {(O_i - E_i) 2} {E_i} \ & \ textbf {where:} \ & c = \ text {degrees of freedom} \ & O = \ text {observed value (s)} \ & E = \ text { } \ \ end {aligned} χc2 = ΣEi (Oi -Ei) 2 di mana: c = darjah kebebasanO = nilai yang diperhatikan (s) E =
Apa Kata Statik Chi-Square Beritahu Anda?
Terdapat dua jenis utama ujian chi-square: ujian kemerdekaan, yang menanyakan persoalan hubungan, seperti, "Adakah terdapat hubungan antara jantina dan skor SAT?"; dan ujian kebaikan, yang meminta sesuatu seperti "Jika syiling dibuang 100 kali, adakah ia akan muncul 50 kali dan ekor 50 kali?"
Untuk ujian ini, darjah kebebasan digunakan untuk menentukan sama ada hipotesis nol tertentu boleh ditolak berdasarkan jumlah pembolehubah dan sampel dalam eksperimen.
Sebagai contoh, apabila mempertimbangkan pelajar dan pilihan kursus, saiz sampel 30 atau 40 pelajar mungkin tidak cukup besar untuk menjana data penting. Mendapatkan hasil yang sama atau serupa dari kajian menggunakan saiz sampel 400 atau 500 pelajar adalah lebih sah.
Dalam contoh lain, pertimbangkan untuk melemparkan duit syiling sebanyak 100 kali. Hasil yang diharapkan dari melemparkan duit syiling adil 100 kali ialah kepala akan muncul 50 kali dan ekor akan muncul 50 kali. Hasilnya sebenarnya ialah kepala naik 45 kali dan ekor naik 55 kali. Statistik chi-square menunjukkan sebarang percanggahan antara hasil yang diharapkan dan keputusan sebenar.
Contoh ujian Chi-Squared
Bayangkan satu tinjauan secara rawak diambil ke atas 2, 000 pengundi yang berlainan, kedua-dua lelaki dan perempuan. Orang yang bertindak balas diklasifikasikan oleh jantina mereka dan sama ada mereka adalah republikan, demokrat, atau bebas. Bayangkan grid dengan lajur berlabel republik, demokrat, dan bebas, dan dua baris yang dilabel lelaki dan perempuan. Anggapkan data daripada 2, 000 responden adalah seperti berikut:
Langkah pertama untuk mengira statistik kuadrat chi adalah untuk mencari frekuensi yang diharapkan. Ini dikira untuk setiap "sel" dalam grid. Oleh kerana terdapat dua kategori jantina dan tiga kategori pandangan politik, terdapat enam jumlah frekuensi yang diharapkan. Rumusan untuk frekuensi yang dijangkakan ialah:
E (r, c) = n (r) × c (r) nwhere: r = row in questionc = column in questionn = total corresponding \ begin {aligned} & E (r, c) = \ frac {n (r) kali c (r)} {n} \ & \ textbf {where:} \ & r = \ text {row in question} \ & c = \ text {column in question} \ & n = \ text { \\ \ end {aligned} E (r, c) = nn (r) × c (r) di mana: r = baris di questionc = lajur yang dipertanyakan = jumlah yang sepadan
Dalam contoh ini, frekuensi yang dijangka adalah:
- E (1, 1) = (900 x 800) / 2, 000 = 360E (1, 2) = (900 x 800) / 2, 000 = 360E (1, 3) = (200 x 800) / 2, 000 =) = (900 x 1, 200) / 2, 000 = 540E (2, 2) = (900 x 1, 200) / 2, 000 = 540E (2, 3) = (200 x 1, 200) / 2, 000 = 120
Seterusnya, ini digunakan nilai untuk mengira statistik kuadrat chi menggunakan formula berikut:
Chi-squared = Σ2E (r, c) dimana: O (r, c) = data yang diperhatikan untuk baris dan lajur yang diberikan \ begin {aligned} & \ text {Chi-squared} = \ sum \ frac {^ 2} {E (r, c)} \ & \ textbf {where:} \ & O (r, c) = \ text (data yang diperhatikan untuk baris dan lajur yang diberikan} \ \ ΣE (r, c) 2 di mana: O (r, c) = data yang diperhatikan untuk baris dan lajur yang diberikan
Dalam contoh ini, ungkapan untuk setiap nilai diperhatikan ialah:
- O (1, 1) = (400 - 360) 2/360 = 4.44O (1, 2) = (300 - 360) 2/360 = 10O (1, 3) = (100 - 80) 2/80 = (2, 1) = (500-540) 2/540 = 2.96O (2, 2) = (600-540) 2/540 = 6.67O (2, 3) = (100 - 120) 2/120 = 3.33
Statistik chi-kuadrat kemudian sama dengan jumlah nilai ini, atau 32.41. Kita boleh melihat jadual statistik chi-kuas untuk melihat, memandangkan darjah kebebasan dalam penubuhan kami, jika hasil itu secara statistiknya signifikan atau tidak.
