Connect with us

Electronics

Pengubah Suara Menjadi Teks Ini Lebih Akurat Berkat AI

Published

on

Toshiba berhasil mengembangkan teknologi pengubah suara menjadi teks—yang amat dibutuhkan banyak industri.

Singapura, TechnoBusiness ● Meski beberapa perusahaan teknologi sudah mencoba mengembangkan aplikasi pengubah suara menjadi teks (voice to text), termasuk Google, nyatanya proses transkrip pidato masih dilakukan secara manual.

Baca Juga: Rachel Barger jadi Presiden SAP Asia Tenggara

Sebab, aplikasi-aplikasi pengubah suara menjadi teks yang sudah ada saat ini belum mampu bekerja secara instan dan akurat. Bahkan, ada aplikasi yang mampu mengubah suara menjadi teks tapi tidak bisa sekaligus untuk merekam.

Advertisement

Nah, baru-baru ini Toshiba berhasil mengembangkan teknologi pengubah suara menjadi teks yang dinamakan Instant Voice to Text berbasis kecerdasan buatan (Artificial Intelligence/AI).

Baca Juga: 5 Pemimpin Pasar Printer Format Besar Global 2019

Teknologi Toshiba itu, dari hasil uji coba dalam kegiatan perkuliahan sebagai verifikasi, mampu mengubah suara menjadi teks dengan tingkat keakuratan hingga 85%.

Toshiba akan berupaya memperbaiki teknologi pengubah suara menjadi teks tersebut menjadi sepenuhnya akurat. Sehingga amat berguna bagi personal maupun perusahaan di berbagai industri.

Taira Ashikawa, Head of Research Media AI Laboratory Toshiba Corporate R&D Center, mengungkapkan bahwa proyek pengembangan teknologi pengubah suara menjadi teks itu sebenarnya sudah dimulai sejak 2015.

Advertisement

 

Simak berita-berita kami dalam bentuk video di kanal TechnoBusiness TVJangan lupa berikan atensi Anda dengan “like, comment, share, dan subscribe“.

[nextpage]

Saat itu, kata Taira, niatnya ingin membantu orang-orang yang memiliki gangguan pendengaran agar dapat mengakses dan menginput informasi secara mudah.

Advertisement

Baca Juga: 7 Faktor Pendorong Menjamurnya Kedai Kopi Kekinian

Toshiba pun melibatkan karyawan dengan gangguan pendengaran untuk menguji dan memberi masukan.

Hasilnya, teknologi pengubah suara menjadi teks Toshiba bukan hanya akurat, tapi juga sanggup mendeteksi jeda (filler) dan keragu-raguan (hesitation marker) saat berbicara.

Dengan memanfaatkan model yang kian populer seperti Long Short-Term Memory dan Connectionist Temporal Classification, AI diajari untuk mengenal keunikan dalam percakapan.

Baca Juga: 10 Merek Teknologi Paling Bernilai Sejagat 2019

Advertisement

Keunikan dalam percakapan itu, “Seperti jeda dan keragu-raguan yang hanya dimiliki manusia,” kata Hiroshi Fujimura, Lead Researcher Media AI Laboratory Toshiba Corporate R&D Center.

Menyadari bahwa potensi penggunaan teknologi pengubah suara menjadi berbasis AI amat penting bagi industri ke depan, Toshiba akan terus menyempurnakannya.

Jika sudah mumpuni, Toshiba akan mengintegrasikan teknologi tersebut ke dalam operasional pabriknya. Hal itu akan membantu operator dalam melakukan pemeliharaan dan inpeksi langsung.

—Michael A. Kheilton, TechnoBusiness/PRN ● Foto: Toshiba

 

Advertisement

Simak berita-berita kami dalam bentuk video di kanal TechnoBusiness TVJangan lupa berikan atensi Anda dengan “like, comment, share, dan subscribe“.

Continue Reading
Advertisement