Electronics

Pengubah Suara Menjadi Teks Ini Lebih Akurat Berkat AI

Published

6 years ago

09/01/2020

Toshiba berhasil mengembangkan teknologi pengubah suara menjadi teks—yang amat dibutuhkan banyak industri.

Singapura, TechnoBusiness ● Meski beberapa perusahaan teknologi sudah mencoba mengembangkan aplikasi pengubah suara menjadi teks (voice to text), termasuk Google, nyatanya proses transkrip pidato masih dilakukan secara manual.

Sebab, aplikasi-aplikasi pengubah suara menjadi teks yang sudah ada saat ini belum mampu bekerja secara instan dan akurat. Bahkan, ada aplikasi yang mampu mengubah suara menjadi teks tapi tidak bisa sekaligus untuk merekam.

Nah, baru-baru ini Toshiba berhasil mengembangkan teknologi pengubah suara menjadi teks yang dinamakan Instant Voice to Text berbasis kecerdasan buatan (Artificial Intelligence/AI).

Teknologi Toshiba itu, dari hasil uji coba dalam kegiatan perkuliahan sebagai verifikasi, mampu mengubah suara menjadi teks dengan tingkat keakuratan hingga 85%.

Toshiba akan berupaya memperbaiki teknologi pengubah suara menjadi teks tersebut menjadi sepenuhnya akurat. Sehingga amat berguna bagi personal maupun perusahaan di berbagai industri.

Taira Ashikawa, Head of Research Media AI Laboratory Toshiba Corporate R&D Center, mengungkapkan bahwa proyek pengembangan teknologi pengubah suara menjadi teks itu sebenarnya sudah dimulai sejak 2015.

Simak berita-berita kami dalam bentuk video di kanal TechnoBusiness TV. Jangan lupa berikan atensi Anda dengan “like, comment, share, dan subscribe“.

[nextpage]

Saat itu, kata Taira, niatnya ingin membantu orang-orang yang memiliki gangguan pendengaran agar dapat mengakses dan menginput informasi secara mudah.

Toshiba pun melibatkan karyawan dengan gangguan pendengaran untuk menguji dan memberi masukan.

Hasilnya, teknologi pengubah suara menjadi teks Toshiba bukan hanya akurat, tapi juga sanggup mendeteksi jeda (filler) dan keragu-raguan (hesitation marker) saat berbicara.

Dengan memanfaatkan model yang kian populer seperti Long Short-Term Memory dan Connectionist Temporal Classification, AI diajari untuk mengenal keunikan dalam percakapan.

Keunikan dalam percakapan itu, “Seperti jeda dan keragu-raguan yang hanya dimiliki manusia,” kata Hiroshi Fujimura, Lead Researcher Media AI Laboratory Toshiba Corporate R&D Center.

Menyadari bahwa potensi penggunaan teknologi pengubah suara menjadi berbasis AI amat penting bagi industri ke depan, Toshiba akan terus menyempurnakannya.

Jika sudah mumpuni, Toshiba akan mengintegrasikan teknologi tersebut ke dalam operasional pabriknya. Hal itu akan membantu operator dalam melakukan pemeliharaan dan inpeksi langsung.●

—Michael A. Kheilton, TechnoBusiness/PRN ● Foto: Toshiba

Simak berita-berita kami dalam bentuk video di kanal TechnoBusiness TV. Jangan lupa berikan atensi Anda dengan “like, comment, share, dan subscribe“.

Up Next

Sambut Imlek, Sharp Gelar Sharp Lovers Day Double Hoki

Don't Miss

Wow, Penjualan TV TCL di Indonesia Naik 55%

TechnoBusiness

Pengubah Suara Menjadi Teks Ini Lebih Akurat Berkat AI

You may like