Apa itu Homoskedastik?
Homoskedastik (juga disebut "homoscedastic") merujuk kepada keadaan di mana varians dari sisa atau istilah kesilapan dalam model regresi adalah malar. Iaitu, istilah ralat tidak banyak berubah kerana nilai perubahan pemboleh ubah ramalan. Walau bagaimanapun, kekurangan homoskedasticity mungkin menunjukkan bahawa model regresi mungkin perlu memasukkan pemboleh ubah ramalan tambahan untuk menjelaskan prestasi pembolehubah yang bergantung.
Takeaways Utama
- Homoskedastisiti berlaku apabila variasi istilah ralat dalam model regresi adalah malar. Jika variasi istilah ralat homoskedastik, model itu jelas. Sekiranya terdapat terlalu banyak variasi, model itu tidak dapat ditentukan dengan baik. Menambah pemboleh ubah peramal tambahan boleh membantu menerangkan prestasi pembolehubah bergantung. Secara umum, heteroskedasticity berlaku apabila varians istilah ralat tidak konstan.
Bagaimana Kerja Homoskedastik
Homoskedastisiti adalah satu pemikiran pemodelan regresi linear. Sekiranya varians ralat di sekitar garis regresi berbeza-beza, model regresi mungkin kurang jelas. Sebaliknya homoskedasticity adalah heteroskedasticity sama seperti sebaliknya "homogen" adalah "heterogen." Heteroskedasticity (juga dieja "heteroscedasticity") merujuk kepada keadaan di mana varians istilah ralat dalam persamaan regresi tidak tetap.
Apabila mempertimbangkan bahawa varians adalah perbezaan diukur antara hasil yang diramalkan dan hasil sebenar sesuatu keadaan, menentukan homoskedasticity dapat membantu menentukan faktor mana yang perlu diselaraskan untuk ketepatannya.
Pertimbangan Khas
Model regresi mudah, atau persamaan, terdiri daripada empat istilah. Di sebelah kiri ialah pemboleh ubah bergantung. Ia mewakili fenomena model itu bertujuan untuk "menjelaskan." Di sebelah kanan adalah malar, pembolehubah prediktor, dan sebilangan, atau kesilapan, istilah. Istilah ralat menunjukkan jumlah variabiliti dalam pembolehubah bergantung yang tidak dijelaskan oleh pemboleh ubah ramalan.
Contoh Homoskedastik
Misalnya, anda ingin menerangkan skor ujian pelajar menggunakan jumlah masa setiap pelajar menghabiskan masa belajar. Dalam kes ini, skor ujian akan menjadi pemboleh ubah bergantung dan masa yang digunakan untuk belajar akan menjadi pemboleh ubah ramalan.
Istilah ralat akan menunjukkan jumlah varians dalam skor ujian yang tidak dijelaskan oleh jumlah masa belajar. Jika varians itu seragam, atau homoskedastik, maka itu akan mencadangkan model itu sebagai penjelasan yang mencukupi untuk prestasi ujian-menjelaskannya dari segi masa yang digunakan untuk belajar.
Tetapi varians mungkin heteroskedastic. Plot data istilah kesilapan mungkin menunjukkan sejumlah besar masa belajar berkoresponden dengan sangat tinggi dengan skor ujian tinggi tetapi skor ujian masa belajar rendah berubah secara meluas dan bahkan memasukkan beberapa markah yang sangat tinggi. Oleh itu, varians skor tidak akan dijelaskan dengan baik hanya oleh satu pemboleh ubah ramalan-jumlah belajar masa. Dalam kes ini, beberapa faktor lain mungkin di tempat kerja, dan model mungkin perlu dipertingkatkan untuk mengenal pasti atau mereka. Siasatan lanjut boleh mendedahkan bahawa sesetengah pelajar telah melihat jawapan ujian sebelum masa atau bahawa mereka sebelum ini telah mengambil ujian yang sama, dan oleh itu tidak perlu belajar untuk ujian ini.
Untuk memperbaiki model regresi, oleh itu, penyelidik akan menambah satu lagi pemboleh ubah penjelasan yang menunjukkan sama ada seorang pelajar telah melihat jawapan sebelum ujian. Model regresi kemudian akan mempunyai dua pemboleh ubah penjelasan-masa belajar dan sama ada pelajar mempunyai pengetahuan sebelumnya terhadap jawapannya. Dengan kedua-dua pembolehubah ini, lebih banyak varians dari skor ujian akan dijelaskan dan varians dari istilah ralat mungkin homoskedastik, menunjukkan bahawa model itu sudah jelas.
