Nasional Mondial Ekonomi Megapolitan Olahraga Rona The Alun-Alun Kupas Splash Wisata Perspektif Wawancara Edisi Weekend Foto Video Infografis
Kecerdasan Buatan

Bias Bahasa Dorong Jepang Ciptakan Teknologi ChatGPT Versi Sendiri

Foto : AFP/ Richard A. Brooks
A   A   A   Pengaturan Font

"LLM publik saat ini, seperti ChatGPT, unggul dalam bahasa Inggris, namun sering kali gagal dalam bahasa Jepang karena perbedaan dalam sistem alfabet, keterbatasan data, dan faktor lainnya," kata Keisuke Sakaguchi, peneliti di Universitas Tohoku di Jepang yang berspesialisasi dalam bahasa pengolahan dikutip dari Scientific American.

LLM biasanya menggunakan sejumlah besar data dari sumber yang tersedia untuk umum untuk mempelajari pola ucapan dan prosa alami. Mereka dilatih untuk memprediksi kata berikutnya berdasarkan kata-kata sebelumnya dalam sebuah teks. Sebagian besar teks yang digunakan untuk melatih model ChatGPT sebelumnya GPT-3 yang berbahasa Inggris.

Kemampuan ChatGPT yang menakutkan untuk melakukan percakapan seperti manusia, telah membuat para peneliti senang sekaligus prihatin. Beberapa orang melihatnya sebagai alat yang berpotensi menghemat tenaga kerja, yang lain khawatir bahwa hal itu dapat digunakan untuk mengarang makalah atau data ilmiah.

Di Jepang, terdapat kekhawatiran bahwa sistem AI yang dilatih pada kumpulan data dalam bahasa lain tidak dapat memahami seluk-beluk bahasa dan budaya Jepang karena struktur kalimat dalam bahasa Jepang sangat berbeda dengan bahasa Inggris. Oleh karena itu ChatGPT harus menerjemahkan query bahasa Jepang ke bahasa Inggris, menemukan jawabannya, lalu menerjemahkan responsnya kembali ke bahasa Jepang.

Meskipun bahasa Inggris hanya memiliki 26 huruf, tulisan Jepang terdiri dari dua set yang terdiri dari 48 karakter dasar, ditambah 2.136 karakter Tiongkok atau kanji yang biasa digunakan. Kebanyakan kanji memiliki dua pengucapan atau lebih, dan ada sekitar 50.000 kanji yang jarang digunakan.
Halaman Selanjutnya....


Redaktur : Ilham Sudrajat
Penulis : Haryo Brono

Komentar

Komentar
()

Top