Apakah Dilema Banduan?
Dilema tahanan adalah paradoks dalam analisis keputusan di mana dua individu yang bertindak atas kepentingan diri mereka sendiri tidak menghasilkan hasil yang optimal. Dilema khas orang awam dibentuk sedemikian rupa sehingga kedua belah pihak memilih untuk melindungi diri mereka dengan mengorbankan peserta lain. Akibatnya, kedua-dua peserta mendapati diri mereka dalam keadaan yang lebih buruk daripada jika mereka telah bekerjasama antara satu sama lain dalam proses membuat keputusan. Dilema tahanan adalah salah satu konsep yang paling terkenal dalam teori permainan moden.
Takeaways Utama
- Dilema seorang tahanan adalah situasi di mana pembuat keputusan individu selalu mempunyai insentif untuk memilih dengan cara yang menghasilkan hasil yang kurang daripada hasil optimum bagi individu sebagai satu kumpulan. Dilema yang terjadi di penjara berlaku dalam banyak aspek ekonomi. Orang ramai telah membangunkan banyak kaedah untuk mengatasi dilemma banduan untuk memilih keputusan kolektif yang lebih baik walaupun terdapat insentif individu yang tidak baik.
Dilema Banduan
Memahami Dilema Banduan
Dilema tahanan membentangkan situasi di mana dua pihak, terpisah dan tidak dapat berkomunikasi, mesti setiap memilih antara bekerja sama dengan yang lain atau tidak. Ganjaran tertinggi bagi setiap pihak berlaku apabila kedua-dua pihak memilih untuk bekerjasama.
Dilema tawanan klasik seperti ini: dua ahli kumpulan samseng perompak, Dave dan Henry, telah ditangkap dan sedang diinterogasi di bilik berasingan. Pihak berkuasa tidak mempunyai saksi lain, dan hanya boleh membuktikan kes terhadap mereka jika mereka dapat meyakinkan sekurang-kurangnya salah seorang perompak untuk mengkhianati rakannya dan memberi kesaksian kepada jenayah itu. Setiap perompak bank berhadapan dengan pilihan untuk bekerjasama dengan rakannya dan tetap diam atau cacat dari geng dan memberi keterangan kepada pihak pendakwa. Sekiranya mereka berdua bekerjasama dan berdiam diri, maka pihak berkuasa hanya akan dapat mensabitkan mereka dengan tuduhan yang lebih rendah untuk menjatuhkan, yang bermaksud satu tahun penjara setiap satu (1 tahun untuk Dave + 1 tahun untuk Henry = 2 tahun penjara total masa). Sekiranya seseorang memberi kesaksian dan yang lain tidak, maka orang yang bersaksi akan bebas dan yang lain akan mendapat tiga tahun (0 tahun bagi orang yang cacat + 3 untuk yang disabitkan = 3 tahun total). Walau bagaimanapun jika kedua-duanya bersaksi terhadap yang lain, masing-masing akan mendapat dua tahun penjara kerana sebahagiannya bertanggungjawab atas rompakan itu (2 tahun untuk Dave + 2 tahun untuk Henry = 4 tahun penjara).
Dalam kes ini, setiap perompak sentiasa mempunyai insentif untuk kecacatan, tanpa mengira pilihan yang dibuat oleh pihak lain. Dari sudut pandang Dave, jika Henry tetap diam, maka Dave sama ada boleh bekerjasama dengan Henry dan melakukan penjara setahun, atau kecacatan dan bebas. Jelas sekali dia akan lebih baik mengkhianati Henry dan seluruh anggota kumpulan dalam kes ini. Sebaliknya, jika Henry membaling dan memberi keterangan terhadap Dave, pilihan Dave menjadi sama dengan senyap dan melakukan tiga tahun atau bercakap dan melakukan penjara dua tahun. Sekali lagi, jelas, dia lebih suka melakukan dua tahun lebih tiga.
Dalam kedua-dua kes, sama ada Henry bekerjasama dengan Dave atau kecacatan kepada pendakwaan, Dave akan menjadi lebih baik jika dia sendiri cacat dan memberi keterangan. Sekarang, sejak Henry menghadapi set pilihan yang sama, dia juga akan menjadi lebih baik daripada kecacatan. Paradoks dilema tahanan adalah ini: kedua-dua perompak boleh meminimumkan jumlah masa penjara bahawa kedua-duanya akan hanya dilakukan jika mereka berdua bekerjasama (2 tahun keseluruhan), tetapi insentif yang mereka hadapi secara berasingan akan sentiasa mendorong mereka masing-masing untuk cacat dan akhirnya melakukan jumlah penjara maksimum antara kedua-dua mereka (4 tahun total).
Contoh-contoh Dilema Banduan
Ekonomi penuh dengan contoh dilemma tahanan dengan dapat mempunyai hasil yang sama baiknya atau berbahaya kepada ekonomi dan masyarakat secara keseluruhan. Benang biasa adalah situasi di mana insentif yang dihadapi oleh setiap pembuat keputusan individu yang memilih untuk memilih akan mendorong mereka masing-masing untuk bersikap dengan cara yang menjadikan mereka semua bersama-sama lebih teruk, sementara secara individu mengelakkan pilihan yang akan menjadikan mereka semua secara kolektif lebih baik jika semua boleh beberapa entah bagaimana memilih secara kolektif.
Salah satu contohnya adalah tragedi dari komun. Ia mungkin dalam kelebihan kolektif semua orang untuk memulihara dan melabur semula dalam penyebaran sumber semula jadi kolam renang supaya dapat terus memakannya, tetapi setiap individu sentiasa mempunyai insentif untuk sebaliknya boleh mengambil sebanyak mungkin secepat mungkin, yang mana kemudian memusnahkan sumber. Mencari beberapa cara untuk bekerjasama dengan jelas akan menjadikan semua orang lebih baik di sini.
Sebaliknya, tingkah laku kartel juga boleh dianggap dilema tahanan. Semua ahli kartel secara kolektif boleh memperkayakan diri mereka dengan mengehadkan output untuk mengekalkan harga yang masing-masing mendapat cukup tinggi untuk menampung sewa ekonomi daripada pengguna, tetapi setiap ahli kartel secara individu mempunyai insentif untuk menipu pada kartel dan meningkatkan output untuk menangkap sewa dari ahli kartel yang lain. Dari segi kebajikan masyarakat keseluruhan bahawa kartel itu beroperasi, ini adalah contoh bagaimana dilema seseorang yang memecahkan kartel itu kadang-kadang boleh menjadikan masyarakat lebih baik secara keseluruhan.
Melarikan diri dari Dilema Prisoner
Dari masa ke masa, orang telah menyelesaikan pelbagai penyelesaian untuk dilemma banduan untuk mengatasi insentif individu yang memihak kepada kebaikan bersama.
Pertama, dalam dunia sebenar kebanyakan interaksi manusia dan ekonomi diulang lebih dari sekali. Dilema seorang tahanan benar biasanya dimainkan hanya satu kali atau ia diklasifikasikan sebagai dilemma tahanan dilanjutkan. Di dalam dilema tahanan yang dilewatkan, para pemain boleh memilih strategi yang memberi ganjaran kepada kerjasamanya atau menghukum penindasan dari masa ke masa. Dengan berkali-kali berinteraksi dengan individu yang sama, kita bahkan boleh dengan sengaja berpindah dari dilema seorang tahanan yang satu masa ke dilema tahanan yang berulang.
Kedua, orang telah membangunkan strategi institusi formal untuk mengubah insentif yang dihadapi oleh pembuat keputusan individu. Tindakan kolektif untuk menguatkuasakan tingkah laku koperatif melalui reputasi, peraturan, undang-undang, demokrasi atau lain-lain membuat keputusan kolektif, dan hukuman sosial yang jelas untuk pembelotan mengubah banyak dilemma tahanan terhadap hasil koperasi yang lebih menguntungkan.
Akhirnya, sesetengah orang dan kumpulan orang telah mengembangkan kecenderungan psikologi dan tingkah laku dari masa ke masa seperti kepercayaan yang lebih tinggi di antara satu sama lain, orientasi masa depan jangka panjang dalam interaksi berulang, dan kecenderungan terhadap timbal balik tingkah laku positif atau hubungan negatif terhadap kelakuan yang cacat. Kecenderungan ini mungkin berubah melalui pemilihan semulajadi dalam masyarakat dari masa ke masa, atau pemilihan kumpulan dalam pelbagai persaingan yang berlainan. Sebenarnya mereka mengetuai kumpulan individu untuk "secara tidak sengaja" memilih hasil yang sebenarnya adalah yang paling menguntungkan bagi mereka semua bersama-sama.
Menyusun bersama, ketiga-tiga faktor ini (dilema yang dilaporkan, institusi formal yang memecahkan dilemma tahanan, dan kecenderungan tingkah laku yang menjejaskan pilihan individu yang "rasional" dalam dilemma tahanan) membantu menyelesaikan banyak dilemma tahanan yang akan kita hadapi.
