Apa yang dimaksudkan dengan Winsorized?
Maksud winsorized ialah kaedah purata yang pada mulanya menggantikan nilai terkecil dan terbesar dengan pemerhatian yang paling dekat dengannya. Ini dilakukan untuk mengehadkan kesan nilai melampau yang tidak normal, atau mengatasi, pada pengiraan. Selepas menggantikan nilai-nilai, formula aritmetik digunakan untuk mengira nilai yang diasingkan.
Formula untuk Mean Winsorized
Ku Winsorized Mean = Nxn… xn + 1 + xn + 2… xn dimana: n = Bilangan datapoint terbesar dan terkecil untuk digantikan oleh pemerhatian
Winsorized bermakna dinyatakan dalam dua cara. Suatu "k n " winsorized bermakna merujuk kepada penggantian 'k' pemerhatian terkecil dan terbesar, di mana 'k' adalah integer. Maksud "X%" yang berlebihan melibatkan penggantian peratusan nilai yang diberikan dari kedua-dua hujung data.
Bagaimana Mengira Purata Winsorized
Maksud winsorized dikira dengan menggantikan titik data terkecil dan terbesar, kemudian menjumlahkan semua titik data dan membahagikan jumlahnya dengan jumlah titik data.
Apa yang dimaksudkan oleh Winsorized?
Maksud winsorized kurang sensitif terhadap outlier kerana ia dapat menggantikannya dengan nilai yang kurang ekstrem. Iaitu, ia kurang terdedah kepada garis besar berbanding min. Walau bagaimanapun, jika pengedaran mempunyai ekor lemak, kesan pengurangan nilai tertinggi dan terendah dalam pengedaran akan mempunyai sedikit pengaruh kerana bilangan kebolehubahan yang tinggi dalam angka pengedaran.
Takeaways Utama
- Kaedah purata yang termasuk menggantikan nilai-nilai terkecil dan paling besar dengan pemerhatian yang paling dekat kepada mereka. Sensitif terhadap kelebihan kerana ia boleh menggantikannya dengan nilai-nilai yang kurang ekstrim. Ia tidak seperti min yang berkurang, yang melibatkan menghapuskan titik data walaupun hasilnya dua cenderung dekat.
Contoh Cara Menggunakan Winsorized Mean
Satu dapat mengira purata kesilapan untuk set data berikut: 1, 5, 7, 8, 9, 10, 14. Dalam contoh ini, kita mengandaikan bahawa min yang diasingkan berada dalam urutan pertama, kita menggantikan nilai-nilai terkecil dan terbesar dengan mereka pemerhatian yang terdekat.
Dataset kini muncul seperti berikut: 5, 5, 7, 8, 9, 10, 10. Mengambil purata aritmetik set baru menghasilkan purata minus 7.7, atau (5 + 5 + 7 + 8 + 9 + 10 + 10) dibahagikan dengan 7.
Atau pertimbangkan 20% winsorized yang mengambil 10% dan 10% di bawah dan menggantikannya dengan nilai terdekat mereka yang terdekat. Kami akan memenangi set data berikut: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Kedua mata data terkecil dan terbesar, atau 10%, akan digantikan dengan nilai terdekat mereka yang terdekat. Oleh itu, set data yang baru ialah: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Winsorized min adalah 33.9, atau jumlah data (678) dibahagikan dengan jumlah titik data (20).
Perbezaan Antara Minyak Winsorized Mean dan Trimmed
Maksud winsorized termasuk memodifikasikan titik data, manakala min yang berkurang melibatkan penghapusan titik data. Ia adalah perkara biasa bagi maksud yang minima dan berkurang menjadi dekat.
Had Penggunaan Purata Winsorized
Satu kelemahan utama untuk cara yang telah ditakrifkan ialah mereka memperkenalkan kecenderungan ke dalam set data. Diberikan, set data sangat kurang berat sebelah selepas pengubahsuaian daripada jika penyokong terlantar.
Ketahui Lebih Lanjut Mengenai Mean Winsorized
Untuk wawasan berkaitan, mengenai perbezaan antara pengiraan min utama.
