Nasional Mondial Ekonomi Megapolitan Olahraga Rona The Alun-Alun Kupas Splash Wisata Perspektif Wawancara Edisi Weekend Foto Video Infografis

Microsoft Kembangkan Generator Ucapan AI yang Sangat Mirip Suara Manusia hingga Tidak Berani Merilisnya

Foto : Istimewa

VALL-E 2 adalah generator text-to-speech (TTS) yang dapat mereproduksi suara pembicara manusia hanya dengan beberapa detik audio.

A   A   A   Pengaturan Font

Terlepas dari kemampuannya, Microsoft tidak akan merilis VALL-E 2 ke publik karena potensi risiko penyalahgunaan. Hal ini bertepatan dengan meningkatnya kekhawatiran seputar kloning suara dan teknologi deepfake. Perusahaan AI lain seperti OpenAI telah menerapkan batasan serupa pada teknologi suara mereka.

"VALL-E 2 murni proyek penelitian. Saat ini, kami tidak memiliki rencana untuk memasukkan VALL-E 2 ke dalam produk atau memperluas akses ke publik," tulis para peneliti dalam postingan blog. "

Ini mungkin membawa risiko potensial dalam penyalahgunaan model, seperti memalsukan identifikasi suara atau meniru identitas pembicara tertentu."

Meskipun demikian, mereka berpendapat bahwa teknologi ucapan AI dapat diterapkan secara praktis di masa depan. "VALL-E 2 dapat mensintesis ucapan yang mempertahankan identitas pembicara dan dapat digunakan untuk pembelajaran pendidikan, hiburan, jurnalistik, konten yang ditulis sendiri, fitur aksesibilitas, sistem respons suara interaktif, terjemahan, chatbot, dan sebagainya," tambah para peneliti.

"Jika model tersebut digeneralisasikan ke pembicara yang tidak terlihat di dunia nyata, model tersebut harus menyertakan protokol untuk memastikan bahwa pembicara menyetujui penggunaan suaranya dan model deteksi ucapan yang disintesis."
Halaman Selanjutnya....


Redaktur : Selocahyo Basoeki Utomo S
Penulis : Selocahyo Basoeki Utomo S

Komentar

Komentar
()

Top