Ini Wajib Ditiru Indonesia! India Luncurkan Aplikasi ‘AI’ untuk Selamatkan Banyak Bahasa Suku Sebelum Punah
Selasa, 07 Okt 2025, 19:30 WIBNEW DELHI â Selama lebih dari satu dekade, Sugdu Potai dengan cekatan mengajar bahasa Gondi di sebuah sekolah dasar negeri di India Tengah. Namun selama setahun terakhir, kemampuan pria berusia 50 tahun ini dalam bahasa Dravida, yang dituturkan oleh sekitar tiga juta orang di berbagai wilayah India, telah diuji.
Ia harus menerjemahkan kalimat-kalimat Hindi yang rumit dan mencari padanan kata dalam bahasa Gondi untuk kata-kata seperti âdisiplinâ dan âpengaturanâ, yang sekarang lebih umum diungkapkan oleh penutur bahasa Gondi dalam bahasa Hindi.
Karena tidak memiliki kamus lengkap, ia harus menggali ingatannya dalam-dalam dan bahkan bertanya kepada tetua masyarakat tentang padanan kata dalam bahasa Gondi .
âItu menantang dan sangat berbeda dengan mengajar anak-anak,â kata Potai.
Upayanya merupakan bagian dari inisiatif pemerintah yang inovatif untuk menggunakan kecerdasan buatan (AI) guna melindungi dan mempromosikan bahasa suku di India â yang banyak di antaranya terancam punah oleh bahasa-bahasa dominan â sekaligus membantu penutur bahasa suku agar dapat terhubung lebih baik dengan dunia daring yang lebih luas.
India adalah salah satu negara dengan keragaman bahasa tertinggi di dunia, dengan lebih dari 2.800 bahasa dan dialek. Namun, negara ini telah kehilangan sekitar 250 bahasa sejak tahun 1961. Para ahli khawatir bahwa sebanyak 400 bahasaâsebagian besar dituturkan oleh kelompok marginal dan sukuâdapat punah dalam beberapa dekade.
Pada 1 September, Kementerian Urusan Suku meluncurkan versi beta Adi Vaani, platform penerjemahan berbasis AI pertama di India untuk bahasa-bahasa suku, guna memastikan masa depan linguistik yang lebih beragam bagi negara tersebut. Saat ini, platform ini menawarkan penerjemahan teks dan ucapan secara real-time antara bahasa Hindi, Inggris, dan empat bahasa suku: Santali, Bhili, Mundari, dan Gondi.
Meskipun bahasa-bahasa ini dituturkan oleh jutaan orang di berbagai wilayah di negara ini, termasuk di India bagian tengah dan timur, bahasa-bahasa ini masih sangat kurang terwakili secara daring. Layanan serupa untuk Kui dan Garo juga sedang dikembangkan.
Layanan Adi Vaani saat ini tersedia di situs webnya dan di aplikasinya yang dapat diunduh di Google Play. Alat penerjemahan waktu nyata ini diharapkan dapat membantu masyarakat suku mengakses pengetahuan daring dalam bahasa mereka sendiri dengan lebih baik dan menjadi peserta yang lebih setara dalam ekonomi digital negara yang sedang berkembang.
Meskipun terjemahan Adi Vaani masih perlu banyak ditingkatkan, platform tersebut telah disambut sebagai langkah awal yang penting dalam merevitalisasi bahasa-bahasa terpinggirkan di negara tersebut untuk menghadapi dunia yang semakin digital.
Adi Vaani berharap dapat mempermudah masyarakat suku untuk mengakses layanan pemerintah, termasuk perawatan kesehatan, dalam bahasa mereka sendiri, dan untuk mendukung pembelajaran berbasis bahasa ibu di sekolah dengan membantu membuat buku pelajaran dwibahasa dan sumber daya digital.
âDaripada memaksa mereka belajar bahasa Hindi atau Inggris, kami ingin berkomunikasi dengan mereka dalam bahasa mereka sendiri,â kata Profesor Radhika Mamidi, ahli bahasa komputasional dari Institut Teknologi Informasi Internasional (IIIT) Hyderabad, salah satu dari beberapa mitra yang menciptakan Adi Vaani.
Tujuan utama lainnya adalah pelestarian budaya. Perangkat AI seperti Adi Vaani dapat terbukti bermanfaat dalam transkripsi sekaligus penerjemahan kekayaan khazanah cerita rakyat suku, yang sebagian besar masih ada dalam bentuk lisan, sehingga memastikan semua itu terdokumentasikan untuk generasi mendatang.
Atasi Kepunahan
Hilangnya bahasa telah menjadi masalah yang semakin besar di India. Hal ini disebabkan oleh berbagai faktor, termasuk kurangnya dukungan pemerintah, pendidikan dasar yang tidak memadai dalam bahasa lokal, dan pergeseran penutur ke bahasa dominan seperti bahasa Hindi untuk tujuan ekonomi dan lainnya.
Adi Vaani berharap dapat membantu membalikkan tren ini. Selama lebih dari setahun, empat lembaga pendidikan teknik terkemuka di India, termasuk IIIT Hyderabad, telah bekerja sama dengan lembaga penelitian suku dan pakar bahasa lokal seperti Potai untuk menciptakan kumpulan data guna melatih model bahasa AI di balik Adi Vaani.
IIIT Hyderabad, yang mengembangkan fitur Santali dari Adi Vaani, berkolaborasi dengan para penerjemah Santali di Negara Bagian Odisha bagian timur, yang menerjemahkan sekitar 100.000 kalimat Hindi ke dalam bahasa mereka. Sebanyak 100.000 kalimat lainnya dalam bahasa Santali diambil dari sumber daring yang tersedia secara bebas.
Lembaga tersebut, yang memiliki latar belakang luas dalam mengembangkan sistem penerjemahan mesin untuk bahasa-bahasa India seperti Hindi dan Telugu, menggunakan korpus Santali yang berisi sekitar 2 juta kata untuk mengembangkan model bahasa awal fitur Santali milik Adi Vaani.
Hal ini disempurnakan lebih lanjut melalui masukan dari para penerjemah.
"Ini seperti bayi yang belajar bahasa," ujar Profesor Mamidi kepada The Straits Times edisi Selasa (7/10). "Anda harus membangun dan kemudian memberikan lebih banyak data untuk menyempurnakannya," imbuh dia.
Upaya serupa telah dilakukan di luar negeri. Di New Zealand misalnya, organisasi media amal Te Hiku Media telah mengembangkan perangkat AI yang dapat mentranskripsi Te Reo MÄori, bahasa asli negara tersebut, memberikan umpan balik pelafalan, dan mengubah teks menjadi ucapan.
Berbeda dengan bahasa-bahasa utama India seperti Hindi atau Bengali yang telah dikuasai dengan relatif baik oleh model pembelajaran mesin, bahasa-bahasa suku yang menjadi target Adi Vaani adalah âbahasa-bahasa yang membutuhkan sumber daya rendahâ.
Ini adalah bahasa dengan data digital, sumber daya linguistik, dan alat komputasi yang tidak memadai â semuanya penting untuk mengembangkan aplikasi pemrosesan bahasa alami dan model pembelajaran mesin.
Sebagai bagian dari upaya membangun ekosistem teknologi yang beragam dan inklusif yang mengakomodasi keragaman bahasa India, pemerintah meluncurkan proyek Bhashini pada tahun 2022 untuk mengembangkan set data guna melatih model AI untuk bahasa-bahasa India, termasuk bahasa-bahasa dengan sumber daya terbatas. Bhashini sejauh ini telah membangun model AI dan layanan penerjemahan dalam lebih dari 22 bahasa.
Layanan seperti ChatGPT mengklaim menawarkan terjemahan bahasa Santali dan Mundari yang terbatas, tetapi hasilnya penuh dengan ketidakakuratan.
Dr Pushpak Bhattacharyya , seorang profesor di Institut Teknologi India Bombay yang berkontribusi pada proyek Bhashini, mengatakan kepada Straits Times bahwa keragaman budaya dan bahasa India tidak tercakup oleh model bahasa yang besar.
âJadi, kami harus membangun model fondasi kami sendiri atau mengambil model bahasa yang besar dan membuatnya peka terhadap budaya India,â ujar dia.
Namun, ini bukanlah tugas yang mudah , terutama untuk bahasa dengan sumber daya terbatas yang seringkali membutuhkan penerjemah dan pakar teknologi untuk membuat kumpulan data besar yang dapat digunakan dari awal dan terus menyempurnakannya. Tidak mengherankan, Adi Vaani masih dalam tahap pengembangan, dengan versi yang menghasilkan terjemahan yang lebih akurat diharapkan hadir dalam beberapa bulan mendatang.
Gayatri Netam, direktur bersama Institut Penelitian dan Pelatihan Suku Chhattisgarh, yang turut mengembangkan fitur Gondi dari Adi Vaani, mengatakan akurasinya dalam bahasa tersebut masih rendah. "Masih banyak pekerjaan yang harus diselesaikan," ungkap dia.
Adi Vaani juga harus menggabungkan keragaman linguistik dari empat bahasa suku yang saat ini dicakupnya. Misalnya bahasa Gondi dan Santali dituturkan di berbagai negara bagian, di mana keduanya telah bertransformasi menjadi bentuk ujaran yang sangat berbeda di bawah pengaruh bahasa lokal yang dominan. Namun, platform ini saat ini hanya didasarkan pada satu varian terpilih dari bahasa-bahasa tersebut.
Profesor Udaya Narayana Singh, seorang ahli bahasa dan mantan direktur Institut Bahasa India Pusat yang dikelola pemerintah mencatat bahwa intervensi manusia ahli yang signifikan diperlukan untuk membuat kumpulan data yang dapat digunakan untuk bahasa yang lebih kecil di India sebelum AI dapat secara berarti membantu melindungi bahasa-bahasa terpinggirkan di India.
Sensus tahun 2011 mencatat sebanyak 2.843 bahasa ibu yang dirasionalisasi, termasuk ratusan bahasa yang dituturkan oleh beberapa ribu orang masing-masing.
"Sejumlah besar bahasa ibu di India dituturkan oleh kurang dari 5.000 orang, dan mereka tidak memiliki dokumentasi linguistik sebelumnya, data rekaman, atau materi pemerintah yang diterjemahkan," kata Profesor Singh, seraya menekankan bahwa kurangnya sumber daya ini menimbulkan tantangan yang hampir tidak dapat diatasi untuk mengembangkan teknologi bahasa yang digerakkan oleh AI.
Kemajuan linguistik komputasional juga harus berjalan beriringan dengan penguatan antropologi linguistik, katanya, sehingga India dapat melatih spesialis untuk mendokumentasikan dan menganalisis bahasa-bahasa terpinggirkannya melalui survei linguistik baru.
Dan bukan hanya AI saja yang perlu dimanfaatkan . Bapak Hercules Singh Munda, yang meluncurkan TriLingo, sebuah platform pembelajaran bahasa untuk bahasa-bahasa suku pada tahun 2021, mengatakan kepada Straits Times bahwa teknologi yang lebih sederhana pun belum sepenuhnya dimanfaatkan dalam upaya melindungi bahasa dan budaya suku.
Misalnya, Encyclopaedia Mundarica multi-volume â sebuah karya lengkap yang mendokumentasikan bahasa dan budaya masyarakat Munda â hanya dapat diakses daring dalam versi pindaian, bukan format digital yang mudah digunakan.
"Saya tidak bisa begitu saja menekan Ctrl + F dan mengetik 'mango' untuk menemukannya, dan itu membuatnya tidak bisa digunakan. Tidak ada gunanya sama sekali," kata Munda, seorang penutur asli bahasa Mundari.
Mundari adalah bahasa Austroasiatik yang dituturkan oleh lebih dari 1,5 juta suku Munda di Negara Bagian Jharkhand, Odisha, dan Benggala Barat di India timur, serta di beberapa wilayah Bangladesh.
Yang lebih penting, melindungi bahasa-bahasa terpinggirkan juga mengharuskan pemerintah pusat maupun negara bagian untuk memberikan kontribusi sumber daya yang lebih besar untuk memastikan bahasa-bahasa ini diajarkan di sekolah-sekolah, sesuatu yang sejauh ini gagal mendapatkan perhatian di seluruh negeri.
Dr Ajit Munda, asisten profesor di Ram Lakhan Singh Yadav College di Ranchi, Negara Bagian Jharkhand, menyambut baik upaya seperti yang dilakukan Adi Vaani, di mana ia berkontribusi sebagai pakar bahasa Mundari. Namun, ia mengatakan pemerintah juga harus memastikan bahasa-bahasa daerah Jharkhand diajarkan di sekolah-sekolah di negara bagian tersebut.
âJika kita mampu menanamkan rasa peduli terhadap pentingnya bahasa ibu sejak kecil, maka mereka pasti tidak akan meninggalkannya di kemudian hari,â pungkas Dr Munda. ST/I-1
- India
- Kecerdasan Buatan
- bahasa daerah
- Bahasa Ibu
- Aplikasi Bahasa Ibu
Redaktur: Ilham Sudrajat
Penulis: Berbagai Sumber, Ilham Sudrajat
Berita Terkait:
-
Menko PM Sebut Sekolah Rakyat Jadi Strategi Putus Rantai Kemiskinan
-
Jatim Siapkan Distribusi Air ke-222 Desa Rawan untuk Hadapi El Nino,
-
Pelatihan Penyembelihan Hewan Kurban di Magelang
-
Nurlaela, Guru SD di Jakarta Timur, Jadi Korban Tabrakan Kereta Bekasi Timur
-
Rayakan Hari Tari Sedunia, 1.500 Penari Angkat Karya Kolosal Aku Kipas
-
Trump Perpanjang Gencatan Senjata, Iran Disebut Alami Keruntuhan Finansial
-
East Ventures: Transformasi Digital Indonesia Harus Berujung pada Nilai Ekonomi Nyata
PT. Berita Nusantara
© Copyright 2017 - 2026 Koran Jakarta ®
All rights reserved.