Apakah jumlah kuadrat?
Jumlah kuadrat adalah teknik statistik yang digunakan dalam analisis regresi untuk menentukan penyebaran mata data. Dalam analisis regresi, matlamatnya adalah untuk menentukan sejauh mana siri data boleh dipasang pada fungsi yang mungkin membantu menjelaskan bagaimana siri data dihasilkan. Jumlah kuadrat digunakan sebagai cara matematik untuk mencari fungsi yang paling sesuai (berbeza sekurang-kurangnya) dari data.
Formula untuk Jumlah Kuadang Adakah
Ku Untuk set X of n items: Jumlah kuadrat = i = 0Σn (Xi -X) 2where: Xi = Item ith dalam setX = Maksud semua item dalam set (Xi -X) = Penyimpangan setiap item dari min
Jumlah kuadrat juga dikenali sebagai variasi.
Apakah Jumlah Kuantiti Beritahu Anda?
Jumlah kuadrat adalah ukuran sisihan dari min. Dalam statistik, min ialah purata satu set nombor dan merupakan ukuran kecenderungan utama yang paling biasa digunakan. Maksud aritmetik hanya dikira dengan merumuskan nilai dalam set data dan membahagikan dengan bilangan nilai.
Katakan harga penutupan Microsoft (MSFT) dalam lima hari terakhir adalah 74.01, 74.77, 73.94, 73.61, dan 73.40 dalam dolar AS. Jumlah keseluruhan harga adalah $ 369.73 dan harga purata atau purata buku teks akan menjadi $ 369.73 / 5 = $ 73.95.
Tetapi mengetahui maksud ukuran pengukuran tidak selalu cukup. Kadang-kadang, adalah berguna untuk mengetahui berapa banyak variasi yang ada dalam satu set ukuran. Berapa jauhnya nilai-nilai individu dari min boleh memberi gambaran tentang bagaimana pemerhatian atau nilai-nilai adalah untuk model regresi yang dibuat.
Contohnya, jika seorang penganalisis ingin mengetahui sama ada harga saham MSFT bergerak seiring dengan harga Apple (AAPL), dia boleh menyenaraikan set pemerhatian untuk proses kedua-dua saham untuk tempoh tertentu, katakan 1, 2, atau 10 tahun dan membuat model linear dengan setiap pemerhatian atau pengukuran yang direkodkan. Jika hubungan antara kedua-dua pembolehubah (iaitu, harga AAPL dan harga MSFT) bukanlah garis lurus, maka terdapat variasi dalam set data yang perlu diteliti.
Dalam statistik, jika garis dalam model linear yang dibuat tidak melewati semua pengukuran nilai, maka beberapa variabiliti yang telah diperhatikan dalam harga saham tidak dapat dijelaskan. Jumlah kuadrat digunakan untuk mengira sama ada hubungan linear wujud di antara dua pemboleh ubah, dan sebarang kebolehubahan yang tidak dapat dijelaskan disebut sebagai jumlah sisa kotak.
Jumlah kuadrat adalah jumlah kuadrat variasi, di mana variasi ditakrifkan sebagai penyebaran antara setiap nilai individu dan min. Untuk menentukan jumlah petak, jarak antara setiap titik data dan garisan paling sesuai dikehendaki dan kemudian disimpulkan. Barisan terbaik patut meminimumkan nilai ini.
Bagaimana Menghitung Jumlah Kuadrat
Kini anda dapat melihat mengapa pengukuran dipanggil jumlah penyimpangan kuasa dua atau jumlah kuadrat untuk pendek. Menggunakan contoh MSFT kami di atas, jumlah kuadrat boleh dikira sebagai:
- SS = (74.01 - 73.95) 2 + (74.77 - 73.95) 2 + (73.94 - 73.95) 2 + (73.61 - 73.95) 2 + (73.40 - 73.95) 0.01) 2 + (-0.34) 2 + (-0.55) 2 SS = 1.0942
Menambah jumlah penyimpangan sahaja tanpa mengkuadratkan akan menghasilkan bilangan yang sama atau hampir kepada sifar kerana penyimpangan negatif akan hampir mengimbangi penyimpangan positif. Untuk mendapatkan nombor yang lebih realistik, jumlah penyelewengan mesti dikehendaki. Jumlah kotak akan selalu menjadi nombor positif kerana kuadrat mana-mana nombor, sama ada positif atau negatif, sentiasa positif.
Contoh Bagaimana Menggunakan Jumlah Kuadrat
Berdasarkan hasil perhitungan MSFT, jumlah kuadrat yang tinggi menunjukkan bahawa kebanyakan nilai lebih jauh dari mean, dan karenanya, terdapat variabilitas yang besar dalam data. Jumlah kuadrat yang rendah merujuk kepada kebolehubahan yang rendah dalam set pemerhatian.
Dalam contoh di atas, 1.0942 menunjukkan bahawa kebolehubahan dalam harga saham MSFT dalam tempoh lima hari terakhir adalah sangat rendah dan pelabur mencari untuk melabur dalam stok yang dicirikan oleh kestabilan harga dan turun naik yang rendah mungkin memilih MSFT.
Takeaways Utama
- Jumlah kuadrat mengukur sisihan titik data jauh dari nilai min. Keputusan jumlah kuadrat yang lebih tinggi menunjukkan tahap kebolehubahan yang besar dalam set data, sementara hasil yang lebih rendah menunjukkan bahawa data itu berbeza-beza dari nilai min.
Batasan Menggunakan Jumlah Kuadrat
Membuat keputusan pelaburan mengenai saham yang dibeli memerlukan lebih banyak pemerhatian daripada yang disenaraikan di sini. Seorang penganalisis mungkin perlu bekerja dengan bertahun-tahun data untuk mengetahui dengan kepastian yang lebih tinggi betapa tinggi atau rendah kebolehubahan sesuatu aset. Oleh kerana lebih banyak titik data ditambahkan ke set, jumlah kotak menjadi lebih besar kerana nilai-nilai akan lebih tersebar.
Pengukuran variasi yang paling banyak digunakan adalah sisihan dan varians standard. Walau bagaimanapun, untuk mengira salah satu daripada dua metrik, jumlah kuadrat harus dikira dahulu. Varians adalah purata jumlah kuadrat (iaitu jumlah kuadrat dibahagikan dengan bilangan pemerhatian). Penyimpangan piawai adalah akar kuadrat dari varians.
Terdapat dua kaedah analisis regresi yang menggunakan jumlah kuadrat: kaedah kuadrat paling tidak linear dan kaedah kuadrat non-linear paling tidak. Kaedah kuadrat-kurangnya merujuk kepada fakta bahawa fungsi regresi meminimumkan jumlah kuadrat dari varians dari titik data sebenar. Dengan cara ini, adalah mungkin untuk menarik satu fungsi yang memberikan statistik yang paling sesuai untuk data. Perhatikan bahawa fungsi regresi boleh sama ada linear (garis lurus) atau bukan linear (garis lengkung).
