Speech Recognation

Speech Recognation adalah suatu sistem mengidentifikasi seseorang dari suaranya. Voice Recognition/Verivication mengidentifikasi siapa yang berbicara, sedangkan Speech Recognition karena mengidentifikasi apa yang diucapkannya.
Hardware yang dibutuhkan adalah :

  1. SoundCard, merupakan alat yang ditambahkan dalam suatu Komputer yang fungsinya sebagai input   dan output suara untuk mengubah sinyal elektrik, menjadi analog maupun menjadi digital.
  2. Microphone, Alat untuk mengubah suara yang melewati udara, air dari benda orang menjadi sinyal elektrik.
  3. Processor/Komputer, Dalam proses suara digital menterjemahkan gelombang suara menjadi suatu simbol biasanya menjadi suatu nomor biner yang dapat diproses lagi. Saat pengunaan menggunakan mikrofon, soundcard berkualitas baik, sehingga akan mengurangi noise yang disebabkan karena terganggu sinyal monitor, pci slots.
  4. Software pendukung Speech dan Voice Recognition, misal yang bersifat Freeware

 

Prinsip Kerja:

Speaker recognition menggunakan fitur akustik ucapan yang ditemukan berbeda pada setiap orang. Ciri akustik tersebut disebabkan adanya perbedaan anatomi (seperti bentuk mulut dan tenggorokan) dan kebiasaan yang berbeda seperti (penekanan dan gaya bahasa). Perbedaan yang khas tersebut disebut “voiceprints“ yang menjadi suatu metode biometric.
Skema Utama Speech Recognition, terdapat 4 langkah utama dalam sistem pengenalan suara :

  1. Penerimaan  data input.
  2. Ekstraksi, yaitu penyimpanan data masukan sekaligus pembuatan database untuk template.
  3. Pembandingan/pencocokan, yaitu tahap pencocokan data baru dengan data suara (pencocokan tata bahasa) pada template.
  4. Validasi identitas pengguna.

Secara umum, speech recognizer memproses sinyal suara yang masuk dan menyimpannya dalam bentuk digital. Hasil proses digitalisasi tersebut kemudian dikonversi dalam bentuk spektrum suara yang akan dianalisa dengan membandingkan dengan template suara pada database sistem. Sebelumnya, data suara masukan dipilah-pilah dan diproses satu per satu berdasarkan urutannya. Pemilahan ini dilakukan agar proses analisis dapat dilakukan secara paralel.

Speech recognition merupakan salah satu jenis biometric recognition,yaitu proses komputer mengenali apa yang diucapkan seseorang berdasarkan intonasi suara yang dikonversi ke dalam bentuk digital print.

Pengenalan pola suara adalah salah satu aplikasi yang berkembang saat ini. Sistem ini mengijinkan kita untuk berkomunikasi antara manusia dengan memasukkan data ke komputer. Salah satu fungsinya adalah untuk meningkatkan efisiensi industri manufaktur, mengontrol mesin dengan berbicara pada mesin itu. Algoritma yang diimplementasikan untuk masalah pengenalan suara ini adalah algoritma divide and conquer. Proses awalnya adalah mengkonversi data spektrum suara ke dalam bentuk digital dan mengubah dalam bentuk diskrit.

 

Original Post by Selly Margaretha

 

Referensi:

http://en.wikipedia.org/wiki/Speech_recognition

http://triyadi.com/kecerdasan-buatan-artificial-intelegence/23-speech-recognition.html

http://cslu.cse.ogi.edu/HLTsurvey/ch1node4.html

http://www.sani4president.co.cc/2008/12/summary-of-apacheorg.html

2 Responses

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s

%d bloggers like this: