TEMPO.CO, Jakarta - Meta telah mengumumkan bahwa mereka akan merilis model AI yang dapat menerjemahkan dan menyalin ucapan hingga 100 bahasa. Model tersebut dapat berguna untuk mengkomunikasikan dan memahami informasi dalam bahasa yang tidak diketahui orang.
“Hari ini kami merilis SeamlessM4T, model AI multimodal baru yang memungkinkan orang-orang yang berbicara dalam berbagai bahasa berkomunikasi dengan lebih efektif,” kata CEO Meta Mark Zuckerberg dalam sebuah postingan di Channel Instagram-nya seperti dikutip dari Gadgets Now.
Zuckerberg mengatakan bahwa model AI itu dapat melakukan terjemahan ucapan-ke-teks, teks-ke-ucapan, ucapan-ke-ucapan, terjemahan teks-ke-teks, dan pengenalan suara hingga 100 bahasa. Perusahaan berencana untuk mengintegrasikan model AI dalam terjemahan dan transkripsi ke Facebook, Instagram, WhatsApp, Messenger, dan Threads.
Cara kerja model AI SeamlessM4T
Menurut Meta, model penerjemah ini mendukung pengenalan ucapan hingga 100 bahasa, namun jumlah tersebut lebih sedikit jika menyangkut terjemahan teks-ke-ucapan. Berikut detail kemampuan model AI tersebut:
- Pengenalan ucapan untuk hampir 100 bahasa
- Terjemahan ucapan-ke-teks untuk hampir 100 bahasa masukan dan keluaran
- Terjemahan ucapan-ke-ucapan, mendukung hampir 100 bahasa masukan dan 36 bahasa keluaran (termasuk bahasa Inggris).
- Terjemahan teks-ke-teks untuk hampir 100 bahasa
- Terjemahan teks-ke-ucapan, mendukung hampir 100 bahasa masukan dan 35 bahasa keluaran (termasuk bahasa Inggris).
"Kami merilis secara publik SeamlessM4T di bawah lisensi penelitian untuk memungkinkan peneliti dan pengembang mengembangkan karya ini. Kami juga merilis metadata SeamlessAlign, kumpulan data terjemahan multimodal terbuka terbesar hingga saat ini, total 270.000 jam ucapan dan penyelarasan teks," kata perusahaan itu.
Menurut Meta, SeamlessM4T dibangun berdasarkan kemajuan sebelumnya dalam bidang ini seperti No Language Left Behind (NLLB), model terjemahan mesin teks-ke-teks yang mendukung 200 bahasa, yang diintegrasikan ke dalam Wikipedia sebagai salah satu penyedia terjemahan.
Perusahaan juga membagikan demo Universal Speech Translator, yang merupakan sistem terjemahan ucapan-ke-ucapan langsung pertama untuk bahasa Hokkien, sebuah bahasa yang tidak memiliki sistem penulisan yang banyak digunakan.
Meta juga segera meluncurkan Massively Multilingual Speech yang menyediakan pengenalan ucapan, identifikasi bahasa, dan teknologi sintesis ucapan di lebih dari 1,100 bahasa.
Pilihan editor: Meta akan Luncurkan Threads Versi Web, Ini Detailnya