Nasional Mondial Ekonomi Megapolitan Olahraga Rona The Alun-Alun Kupas Splash Wisata Perspektif Wawancara Edisi Weekend Foto Video Infografis

Microsoft Kembangkan Generator Ucapan AI yang Sangat Mirip Suara Manusia hingga Tidak Berani Merilisnya

Foto : Istimewa

VALL-E 2 adalah generator text-to-speech (TTS) yang dapat mereproduksi suara pembicara manusia hanya dengan beberapa detik audio.

A   A   A   Pengaturan Font

REDMOND - Perusahaan teknologi dari Amerika Serikat, Microsoft, baru-baru ini mengembangkan generator ucapan kecerdasan buatan atau artificial intelligence
(AI) baru, yang sangat canggih sehingga belum dapat dirilis ke publik.

Dikutip dari Live Science, VALL-E 2 adalah generator text-to-speech (TTS) yang dapat mereproduksi suara pembicara manusia hanya dengan beberapa detik audio.

"VALL-E 2 mampu menghasilkan "ucapan yang akurat dan alami dengan suara yang sama persis dengan suara pembicara aslinya, sebanding dengan kinerja manusia," kata eneliti Microsoft dalam sebuah makalah yang muncul pada 17 Juni di server pra-cetak arXiv.

Dengan kata lain, generator suara AI yang baru cukup meyakinkan untuk disalahartikan sebagai orang sungguhan, setidaknya menurut penciptanya.

"VALL-E 2 adalah kemajuan terbaru dalam model bahasa codec saraf yang menandai tonggak sejarah dalam sintesis text-to-speech (TTS) zero-shot, yang mencapai paritas manusia untuk pertama kalinya," tulis para peneliti dalam makalah tersebut.
Halaman Selanjutnya....


Redaktur : Selocahyo Basoeki Utomo S
Penulis : Selocahyo Basoeki Utomo S

Komentar

Komentar
()

Top