Apa yang Berlebihan?
Overfitting adalah kesalahan pemodelan yang terjadi apabila fungsi terlalu dekat dengan set data mata yang terbatas. Model overfitting biasanya mengambil bentuk membuat model yang terlalu rumit untuk menjelaskan idiosyncrasies dalam data yang sedang dipelajari.
Pada kenyataannya, data yang sering dikaji mempunyai sedikit kesilapan atau bunyi rawak di dalamnya. Oleh itu, cuba membuat model menyesuaikan terlalu dekat dengan data yang sedikit tidak tepat boleh menjangkiti model dengan kesilapan yang besar dan mengurangkan kuasa ramalannya.
Takeaways Utama
- Overfitting adalah kesalahan pemodelan yang terjadi apabila fungsi terlalu dekat dengan set data data yang terbatas. Profesional keuangan harus selalu menyadari bahaya dari overfitting model berdasarkan data terbatas.
Memahami Berlebihan
Sebagai contoh, masalah biasa ialah menggunakan algoritma komputer untuk mencari pangkalan data luas data pasaran sejarah untuk mencari corak. Memandangkan kajian yang cukup, sering kali mungkin untuk membangunkan teorem rumit yang kelihatannya meramalkan perkara-perkara seperti pulangan dalam pasaran saham dengan ketepatan yang dekat.
Walau bagaimanapun, apabila digunakan untuk data di luar sampel, teorem tersebut mungkin akan membuktikan bahawa hanya model yang berlebihan kepada apa yang sesungguhnya berlaku hanya kejadian. Dalam semua kes, adalah penting untuk menguji model terhadap data yang berada di luar sampel yang digunakan untuk membangunkannya.
Profesional kewangan mesti sentiasa mengetahui tentang bahaya yang melampaui model berdasarkan data terhad.
