Pemprosesan Bahasa Semula Jadi (NLP) adalah bidang kecerdasan buatan yang membolehkan komputer menganalisis dan memahami bahasa manusia. Ia digubal untuk membina perisian yang menjana dan memahami bahasa semulajadi supaya pengguna dapat melakukan perbualan semula jadi dengan komputernya dan bukan melalui pengaturcaraan atau bahasa buatan seperti Java atau C.
Pecahan Bahasa Semulajadi (NLP)
Pemprosesan Bahasa Asli (NLP) adalah satu langkah dalam misi yang lebih besar untuk sektor teknologi - iaitu menggunakan kecerdasan buatan (AI) untuk mempermudahkan cara kerja dunia. Dunia digital telah terbukti menjadi penukar permainan untuk banyak syarikat sebagai penduduk semakin pintar teknologi mencari cara baru berinteraksi dalam talian antara satu sama lain dan dengan syarikat. Media sosial telah mentakrifkan makna komuniti; cryptocurrency telah mengubah norma pembayaran digital; e-dagang telah mewujudkan makna baru bagi keselesaan perkataan, dan penyimpanan awan telah memperkenalkan satu lagi tahap pengekalan data kepada orang ramai.
Melalui AI, bidang seperti pembelajaran mesin dan pembelajaran mendalam membuka mata kepada dunia dengan segala kemungkinan. Pembelajaran mesin semakin digunakan dalam analisis data untuk memahami data besar. Ia juga digunakan untuk program chatbots untuk mensimulasikan perbualan manusia dengan pelanggan. Walau bagaimanapun, aplikasi pembelajaran komputer ke hadapan ini tidak mungkin dilakukan tanpa penambahbaikan Pemprosesan Bahasa Asli (NLP).
Bagaimana NLP Sebenarnya Berfungsi?
NLP menggabungkan AI dengan linguistik komputasi dan sains komputer untuk memproses bahasa atau bahasa manusia dan ucapan. Proses ini boleh dibahagikan kepada tiga bahagian. Tugas pertama NLP adalah untuk memahami bahasa semula jadi yang diterima oleh komputer. Komputer menggunakan model statistik terbina dalam untuk melaksanakan rutin pengiktirafan ucapan yang menukarkan bahasa semula jadi kepada bahasa pengaturcaraan. Ia melakukan ini dengan memecahkan ucapan baru-baru ini ia mendengar unit-unit kecil, dan kemudian membandingkan unit-unit ini kepada unit sebelumnya dari ucapan sebelumnya. Hasil atau hasil dalam format teks secara statistik menentukan kata-kata dan ayat-ayat yang paling mungkin dikatakan. Tugas pertama ini dipanggil proses ucapan-ke-teks.
Tugas seterusnya dipanggil penandaan bahagian-of-speech (POS) atau disambiguasi kategori perkataan. Proses ini mengenal pasti kata-kata dalam bentuk tatabahasa mereka sebagai kata nama, kata kerja, kata sifat, tegang masa lampau, dan sebagainya menggunakan satu set peraturan leksikon yang dikodkan ke dalam komputer. Selepas kedua-dua proses ini, komputer mungkin kini memahami makna ucapan yang dibuat.
Langkah ketiga yang diambil oleh NLP adalah penukaran teks-ke-ucapan. Pada peringkat ini, bahasa pengaturcaraan komputer ditukar kepada format yang boleh didengar atau teks untuk pengguna. Sembang berita berita kewangan, contohnya, yang dipersoalkan seperti "Bagaimana Google lakukan hari ini?" Kemungkinan akan mengimbas tapak pembiayaan dalam talian untuk stok Google, dan mungkin memutuskan untuk memilih hanya maklumat seperti harga dan volum sebagai balasannya.
Percubaan NLP untuk menjadikan komputer pintar dengan membuat manusia percaya bahawa mereka berinteraksi dengan manusia lain. Ujian Turing, yang dicadangkan oleh Alan Turing pada tahun 1950, menyatakan bahawa komputer boleh menjadi pintar sepenuhnya jika ia boleh berfikir dan membuat perbualan seperti manusia tanpa manusia mengetahui dia sedang bercakap dengan mesin. Setakat ini, hanya satu komputer yang telah lulus ujian itu - chatbot dengan persona seorang lelaki berusia 13 tahun. Ini bukan untuk mengatakan bahawa mesin pintar adalah mustahil untuk membina, tetapi ia menggariskan kesukaran yang wujud dalam membuat komputer berfikir atau bercakap seperti manusia. Oleh kerana kata-kata boleh digunakan dalam konteks yang berbeza, dan mesin tidak mempunyai pengalaman hidup sebenar yang dimiliki oleh manusia untuk menyampaikan dan menerangkan entiti dalam kata-kata, mungkin diperlukan beberapa saat sebelum dunia dapat sepenuhnya menghapus bahasa pengaturcaraan komputer.
