Ini Wajib Ditiru Indonesia! India Luncurkan Aplikasi ‘AI’ untuk Selamatkan Banyak Bahasa Suku Sebelum Punah
📅 Selasa, 07 Okt 2025, 19:30 WIB | Oleh: Tim RedaksiHilangnya bahasa telah menjadi masalah yang semakin besar di India. Hal ini disebabkan oleh berbagai faktor, termasuk kurangnya dukungan pemerintah, pendidikan dasar yang tidak memadai dalam bahasa lokal, dan pergeseran penutur ke bahasa dominan seperti bahasa Hindi untuk tujuan ekonomi dan lainnya.
Adi Vaani berharap dapat membantu membalikkan tren ini. Selama lebih dari setahun, empat lembaga pendidikan teknik terkemuka di India, termasuk IIIT Hyderabad, telah bekerja sama dengan lembaga penelitian suku dan pakar bahasa lokal seperti Potai untuk menciptakan kumpulan data guna melatih model bahasa AI di balik Adi Vaani.
IIIT Hyderabad, yang mengembangkan fitur Santali dari Adi Vaani, berkolaborasi dengan para penerjemah Santali di Negara Bagian Odisha bagian timur, yang menerjemahkan sekitar 100.000 kalimat Hindi ke dalam bahasa mereka. Sebanyak 100.000 kalimat lainnya dalam bahasa Santali diambil dari sumber daring yang tersedia secara bebas.
Lembaga tersebut, yang memiliki latar belakang luas dalam mengembangkan sistem penerjemahan mesin untuk bahasa-bahasa India seperti Hindi dan Telugu, menggunakan korpus Santali yang berisi sekitar 2 juta kata untuk mengembangkan model bahasa awal fitur Santali milik Adi Vaani.
Sebaiknya Anda baca juga:
Hal ini disempurnakan lebih lanjut melalui masukan dari para penerjemah.
"Ini seperti bayi yang belajar bahasa," ujar Profesor Mamidi kepada The Straits Times edisi Selasa (7/10). "Anda harus membangun dan kemudian memberikan lebih banyak data untuk menyempurnakannya," imbuh dia.
Upaya serupa telah dilakukan di luar negeri. Di New Zealand misalnya, organisasi media amal Te Hiku Media telah mengembangkan perangkat AI yang dapat mentranskripsi Te Reo Māori, bahasa asli negara tersebut, memberikan umpan balik pelafalan, dan mengubah teks menjadi ucapan.
Sebaiknya Anda baca juga:
Berbeda dengan bahasa-bahasa utama India seperti Hindi atau Bengali yang telah dikuasai dengan relatif baik oleh model pembelajaran mesin, bahasa-bahasa suku yang menjadi target Adi Vaani adalah “bahasa-bahasa yang membutuhkan sumber daya rendah”.
Ini adalah bahasa dengan data digital, sumber daya linguistik, dan alat komputasi yang tidak memadai – semuanya penting untuk mengembangkan aplikasi pemrosesan bahasa alami dan model pembelajaran mesin.
Sebagai bagian dari upaya membangun ekosistem teknologi yang beragam dan inklusif yang mengakomodasi keragaman bahasa India, pemerintah meluncurkan proyek Bhashini pada tahun 2022 untuk mengembangkan set data guna melatih model AI untuk bahasa-bahasa India, termasuk bahasa-bahasa dengan sumber daya terbatas. Bhashini sejauh ini telah membangun model AI dan layanan penerjemahan dalam lebih dari 22 bahasa.
Layanan seperti ChatGPT mengklaim menawarkan terjemahan bahasa Santali dan Mundari yang terbatas, tetapi hasilnya penuh dengan ketidakakuratan.
Dr Pushpak Bhattacharyya , seorang profesor di Institut Teknologi India Bombay yang berkontribusi pada proyek Bhashini, mengatakan kepada Straits Times bahwa keragaman budaya dan bahasa India tidak tercakup oleh model bahasa yang besar.
“Jadi, kami harus membangun model fondasi kami sendiri atau mengambil model bahasa yang besar dan membuatnya peka terhadap budaya India,” ujar dia.
Website kami bergantung pada iklan untuk terus dapat menghadirkan jurnalisme berkualitas.
Dukung kami dengan mengijinkan iklan tampil di browser anda.
- Klik ikon AdBlock pada area ekstensi browser (di bagian pojok kanan atas).
- Lalu klik pilihan untuk menonaktifkan atau pilihan "Don't run on this website / on this page".
Setelah itu Refresh / Muat Ulang halaman ini.
Komentar (0)
Belum ada komentar.
Silakan login via Google untuk dapat memberi komentar!