The VODER:1939, Alat Pertama Didunia Yang Bisa Berbicara

THE VODER: 1939

Pada kenyataannya suara di navigator GPS mobil, Google asistent di android, dan respons otomatis yang kita dengarkan saat telepon dialihkan bukanlah suara nyata. Dengan kata lain, tidak ada database besar dari kata-kata yang diucapkan yang diambil komputer dan menyatukannya untuk membuat kalimat.

Mereka dihasilkan dengan cepat oleh komputer, namun mereka terdengar sangat alami, seperti suara manusia pada umumnya, sehingga lebih sering mereka sama sekali tidak dapat dibedakan dari suara orang yang sebenarnya.

Suara manusia jauh lebih rumit, dan bervariasi, semua suara manusia tidak ada yang terdengar sama. Ditambah lagi berbagai infleksi dan emosi, tekanan pada suku kata, aksen, maka akan menghasilkan suara yang berbeda pula. Sebuah alat yang meniru suara manusia berbicara sama sekali tidak mudah. Ini merupakan pencapaian yang cukup luar biasa bisa terjadi.

Salah satu upaya paling awal untuk menghasilkan suara manusia sintetis dilakukan lebih dari dua ratus tahun yang lalu, yaitu pada tahun 1779, oleh Profesor Rusia bernama Christian Kratzenstein.

Kratzenstein membangun sebuah alat yang terdiri dari sejumlah buluh bergetar yang secara akustik mirip dengan saluran vokal manusia. Perangkatnya dapat menghasilkan lima vokal panjang secara artifisial.

Beberapa tahun kemudian, pada 1791, seorang penemu di Wina bernama Wolfgang von Kempelen membangun mesin yang lebih terperinci dengan model berbagai organ manusia yang memungkinkan berbicara. Mesin memiliki sepasang bellow untuk mensimulasikan paru-paru, buluh bergetar untuk bertindak sebagai pita suara, tabung kulit untuk saluran suara, dua lubang hidung, lidah dari kulit.

Baca juga:

Dengan memanipulasi bentuk tabung kulit dan posisi lidah dan bibir, von Kempelen mampu menghasilkan konsonan serta vokal. Hampir setengah abad kemudian, Charles Wheatstone membuat versi mesin von Kempelen yang lebih baik yang bisa melafalkan sebagian besar bunyi konsonan dan bahkan beberapa kata penuh.

Perangkat pertama yang dianggap sebagai "speech synthesizer" yang terbaik adalah VODER (Voice Operating Demonstrator) yang dikembangkan oleh Homer Dudley dari Bell Labs pada 1930-an. Ini adalah mesin yang agak rumit dengan empat belas kunci seperti piano, batang yang dikendalikan oleh pergelangan tangan, dan pedal kaki yang dapat dimanipulasi oleh operator dan menyebabkan mesin itu berbicara. Terdengar sangat robot, seperti "orang asing yang berbicara di bawah air", seperti yang dijelaskan oleh Lisa Guernsey dari New York Times.

Bahkan, "suara robot" yang sering kita dengar di film-film fiksi ilmiah lama dan drama televisi mungkin berasal dari VODER. "Begitu suara mesin yang sebenarnya telah memasuki kesadaran publik, tempat dan bentuknya dalam penggambaran fiksi tidak akan pernah sama," tulis Ben Fino-Radin dari Rhizome. "Setelah hari itu pada tahun 1939, kami tahu secara khusus bagaimana suara mesin yang tidak manusiawi seharusnya terdengar."

Situs web whatisthevoder.com, menjelaskan cara kerja VODER

Seorang operator akan memilih satu dari dua suara dasar dengan menggunakan bar pergelangan tangan: nada dengung dan suara mendesis. Nada buzz adalah blok bangunan untuk suara vokal dan jenis hidung. Suara mendesis adalah blok bangunan untuk suara-suara yang terkait dengan konsonan.

Suara-suara ini kemudian melewati bank filter yang dipilih oleh pengguna dengan memilih tombol yang sesuai pada keyboard. Suara-suara ini digabungkan dan dikirim melalui pengeras suara. Untuk suara yang tidak dapat direplikasi oleh suara mendengung atau mendesis, seperti "p", "d", "j", dan "ch", filter tambahan dapat dipilih.

Kata-kata yang berbeda dapat digabungkan ke dalam kalimat yang berbeda berdasarkan manipulasi tombol dan suara. Kita bahkan dapat menambahkan ekspresi dan nada yang berbeda (dikontrol oleh pedal kaki) berdasarkan jenis pertanyaan yang ditanyakan.

Helen Harper, yang merupakan operator utama VODER selama demonstrasi di New York World's Fair 1939, memberi kita gambaran betapa sulitnya menguasai alat itu.

"Misalnya," kita mendengar Ny. Harper berbicara dalam sebuah video, "dalam menghasilkan kata 'konsentrasi' pada VODER, saya harus membentuk tiga belas suara yang berbeda secara berurutan dan membuat lima gerakan naik dan turun dari bar pergelangan tangan dan memvariasikan posisi pedal kaki dari tiga hingga lima kali sesuai dengan ekspresi apa yang saya inginkan pada VODER untuk memberikan kata. Dan tentu saja, semua ini harus dilakukan dengan waktu yang tepat. ”

Butuh m setahun bagi Harper untuk mempraktikkanny sebelum dia belajar mengoperasikan mesin dengan presisi. Sebanyak tiga ratus anak perempuan menjalani pelatihan untuk menjadi operator, tetapi hanya kurang dari tiga puluh yang memiliki keterampilan yang tersebut.

Operator yang terampil seperti Ny. Harper dapat membuat VODER berbicara dalam bahasa apa pun, bahkan menangis atau mendengus. Dia bahkan dapat membuatnya bernyanyi, seperti yang ditunjukkan dalam video berikut.

Demonstrasi Voder oleh Bell Labs pada 1939 di New York World's Fair.

The VODER:1939, Alat Pertama Didunia Yang Bisa Berbicara

THE VODER: 1939

Posting Komentar

Formulir Kontak