Apakah Regresi Stepwise?
Analisis regresi adalah pendekatan statistik yang digunakan secara meluas untuk mencari hubungan antara pembolehubah. Idea ini adalah untuk mengumpulkan maklumat yang relevan untuk membuat keputusan yang lebih baik dan merupakan amalan biasa dalam dunia pelaburan. Regresi stepwise adalah pembinaan berulang-langkah dari model regresi yang melibatkan pemilihan bebas pembolehubah secara automatik. Ketersediaan pakej perisian statistik membuat regresi stepwise mungkin, walaupun dalam model dengan beratus-ratus variabel.
Jenis Regresi Stepwise
Matlamat asas regresi stepwise adalah, melalui satu siri ujian (ujian F, ujian t) untuk mencari satu set pembolehubah bebas yang mempengaruhi pembolehubah bergantung. Ini dilakukan dengan komputer melalui lelaran, yang merupakan proses untuk mencapai hasil atau keputusan dengan melalui pusingan berulang atau kitaran analisis. Mengendalikan ujian secara automatik dengan bantuan daripada pakej perisian statistik mempunyai kelebihan menjimatkan masa untuk individu.
Takeaways Utama
- Analisis regresi adalah pendekatan statistik yang bertujuan untuk memahami dan mengukur hubungan antara pembolehubah bebas dan bergantung. Regresi jangka masa adalah kaedah yang mengkaji kepentingan statistik setiap pembolehubah bebas dalam model. Pendekatan pemilihan ke hadapan menambah pembolehubah dan kemudian ujian untuk kepentingan statistik Kaedah penghapusan ke belakang bermula dengan model yang dimuatkan dengan banyak pembolehubah dan kemudian menghilangkan satu pembolehubah untuk menguji kepentingannya berbanding dengan keseluruhan hasil. Regresi sesudah mempunyai banyak kritikan, kerana pendekatan itu sesuai dengan data menjadi model untuk mencapai hasil yang diinginkan.
Regresi stepwise boleh dicapai sama ada dengan mencuba satu pemboleh ubah bebas pada suatu masa dan termasuk dalam model regresi jika ia secara statistik ketara atau dengan memasukkan semua pemboleh ubah bebas yang berpotensi dalam model dan menghapuskan mereka yang tidak signifikan secara statistik. Sesetengah menggunakan kombinasi kedua-dua kaedah dan oleh itu terdapat tiga pendekatan untuk regresi stepwise:
- Pemilihan ke hadapan bermula dengan tiada pemboleh ubah dalam model, menguji setiap pemboleh ubah seperti yang ditambahkan pada model, kemudian menyimpannya yang dianggap paling signifikan secara statistik-mengulangi proses tersebut sehingga hasilnya optimal. Penghapusan ke belakang bermula dengan satu set pembolehubah bebas, memotong satu demi satu, kemudian menguji untuk melihat jika pembolehubah yang dibuang secara signifikan secara statistik. Penghapusan arah adalah kombinasi dari dua kaedah pertama yang menguji pemboleh ubah yang harus disertakan atau dikecualikan.
Contoh regresi stepwise menggunakan kaedah penghapusan ke belakang akan menjadi percubaan untuk memahami penggunaan tenaga di kilang menggunakan pemboleh ubah seperti peralatan yang dijalankan masa, umur peralatan, saiz kakitangan, suhu di luar, dan masa tahun. Model ini merangkumi semua pembolehubah-maka setiap satu akan dikeluarkan, satu demi satu, untuk menentukan yang paling penting secara statistik. Pada akhirnya, model itu mungkin menunjukkan bahawa masa tahun dan suhu adalah yang paling penting, mungkin mencadangkan penggunaan tenaga puncak di kilang adalah apabila penggunaan penghawa dingin berada pada tahap tertinggi.
Had Regresi Stepwise
Analisis regresi, baik linear dan multivariat, digunakan secara meluas dalam dunia pelaburan hari ini. Idea ini sering mencari corak yang wujud pada masa lalu yang mungkin juga berulang pada masa depan. Contohnya, regresi linear yang sederhana, mungkin melihat nisbah harga dan pendapatan dan pulangan saham selama bertahun-tahun untuk menentukan sama ada saham dengan nisbah P / E yang rendah (variabel bebas) menawarkan pulangan yang lebih tinggi (pemboleh ubah bergantung). Masalah dengan pendekatan ini adalah bahawa keadaan pasaran sering berubah dan hubungan yang diadakan pada masa lalu tidak semestinya berlaku pada masa kini atau masa depan.
Sementara itu, proses regresi stepwise mempunyai banyak pengkritik dan ada juga panggilan untuk berhenti menggunakan kaedah sama sekali. Para ahli statistik mencatatkan beberapa kelemahan kepada pendekatan, termasuk keputusan yang salah, kecenderungan yang wujud dalam proses itu sendiri, dan keperluan untuk kuasa pengkomputeran yang penting untuk membangunkan model regresi kompleks melalui lelaran.
