TOPIK :
KOMPUTER HIBRYD
JUDUL : ROBOTIK
NAMA : PUTRA BELA RAMA
NIM
: 13.230.0043
KELOMPOK : 2
BAB I
1. 1. PENDAHULUAN
Abstrak - Proses pengolahan sinyal wicara (speech
recognition) telah berkembang pesat sehingga dapat digunakan untuk berbagai
aplikasi begitu juga teknologi wireless jaringan komputer. Berawal dari
teknologi tersebut maka timbulah ide untuk mengembangkan proses pengolahan
sinyal wicara menjadi suatu aplikasi untuk mengendalikan robot dengan wi-fi.
Proses pengenalan wicara ini
menggunakan metode HMM yaitu pengenalan suara berdasarkan statistik. HTK tool merupakan
software yang menggunakan metode HMM dan dapat melakukan pengenalan suara
dengan baik. Pengiriman hasil pengenalan HTK menggunakan pemrogramman socket
berbasis client-server.
Dari
hasil penggabungan tersebut, penelitian ini sudah dapat melakukan proses
pengiriman perintah suara yang dikenali HTK hingga di terima oleh robot sebagai
server dengan baik. Sehingga dapat digunakan untuk membuat aplikasi-aplikasi
kontrol yang lain.
2. LATAR
BELAKANG
Teknologi pengenalan wicara saat
ini telah mengalami perkembangan yang cukup pesat. Banyak aplikasi-aplikasi
yang telah di hasilkan seiring dengan metode dan proses dari pengenalan wicara
tersebut. Dari perkembangan teknologi pengolahan sinyal suara ini munculah ide
untuk membuat aplikasi yang dapat digunakan untuk mengendalikan robot. Dalam speech recognition terdapat beberapa
permasalahan yang sering muncul dan berbeda untuk setiap permasalahannya
misalnya kecepatan pengenalannya, ketepatan pengenalannya, dll. Saat ini telah terdapat HTK (Hidden
Markov Model Toolkit) yaitu suatu tool atau perangkat lunak yang mudah
digunakan untuk membangun dan memanipulasi HMM (Hidden Markov Model)[9].
HMM sendiri merupakan suatu sistem yang memodelkan
simbol kedalam suatu mesin finite state (keadaan yang terbatas), sehingga diketahui simbol apa
yang dapat mewakili sebuah parameter vektor dari sebuah kata yang dimasukkan
kedalam mesin dan diestimasi berulang-ulang hingga dihasilkan parameter
observasi dengan mean dan kovarian yang konvergen untuk setiap statenya[3].
Dengan tool ini maka pembuatan sistem pengenalan sinyal suara manusia dapat
lebih bagus dan rapi (untuk setiap kata dari orang yang berbeda dan logat dari
orang yang berbeda pula).
Melihat data diatas maka kita dapat membuat suatu
sistem akses kontrol pada robot PDA dengan menggunakan suara manusia yang dapat
membedakan antara manusia yang satu dengan yang lain. Dimana data tersebut
dapat juga dilewatkan melalui jaringan komputer karena untuk keperluan
mobilitas robot PDA sendiri maka robot harus dapat dikontol secara jarak jauh
dan wireless.
BAB II
1. PERMASALAHAN
Untuk membuat suatu sistem pengolahan sinyal suara
yang dapat memberikan akses kontrol pada robot PDA diperlukan beberapa hal
antara lain :
1.
Bagaimana
mengolah sinyal suara sendiri menggunakan metode HMM sehingga dari suara
dirubah dalam bentuk text.
2.
Bagaimana membuat
suatu sistem yang rapi dan dapat digunakan dengan mudah oleh user.
3.
Bagaimana mengirimkan
paket data text ke robot PDA melalui jaringan komputer baik wire maupun
wireless
2. PENYELESAIAN
Pembuatan Program.
Setelah semua keperluan untuk program telah di install
selanjutnya pembuatan program untuk menggenerate sinyal input dengan data yang telah
dimasukaan dalam database dimana dalam proses ini kita membuat script otomatis
untuk melakukan analisis dan training databases.
- Perangkat-perangkat yang digunakan dalam tahap
data preparation atau analisis[4]
·
HParse
·
HSGen
·
HSLab
·
HCopy
- Perangkat-perangkat yang digunakan dalam tahap
training[4]
·
HCompV
·
HRest
·
HInit
- Perangkat-perangkat yang digunakan dalam tahap
testing[4]
·
Hvite
- Perangkat-perangkat yang digunakan dalam tahap
analysis[4]
·
HResults
Pengambilan
database.
Untuk memperoleh kualitas
pengenalan suara yang baik diperlukan database suara yang banyak dengan gaya
dan logat yang berbeda, dengan database yang besar kita akan dapat menentukan
kata yang diinputkan dan kemudian akan diumpankan ke dictionary untuk
mengetahui jenis kata yang diucapkan[6].
Langkah-langkah pembuatan
databases suara :
- Pembuatan Struktur Direktori
- Perekaman data
Menghubungkan
dengan robot PDA.
Setelah sinyal suara yang
dinputkan dapat dikenali dengan baik oleh sistem selanjutnya data text yang
dihasilkan akan dikirim ke robot PDA dengan menggunakan socket programming baik
menggunakan wire maupun wireless. Dimana data yang dikirimkan di rubah dalam
bentuk standart agar memudahkan sistem kontrol yang lain yaitu :
·
Maju = 2
·
Mundur = 8
·
Kanan = 6
·
Kiri = 4
·
Stop = 5
PENGUJIAN
Pengujian ini dilakukan pada PC dengan spesifikasi
sebagi berikut :
Tabel 1 Spesifikasi Perangkat yang digunakan
NO
|
DESKRIPSI
|
SPESIFIKASI
|
1
|
Processor
model
|
Intel(R)
Pentium(R) 4 CPU 3.00 GHz
|
2
|
Memory
|
512 MB
DDRAM
|
3
|
HDD
|
40GB,
7200rpm
|
4
|
Sound Card
|
Creative Sound Blaster Live 5.1
|
5
|
Microphone
|
Sony
F-V620
|
6
|
Power
|
400W
|
7
|
Operating
System
|
Linux/GNU
Debian
|
8
|
Kernel
|
2.6.18-2-686
|
Analisa yang dilakukan adalah melakukan pengujian
terhadap sistem dengan 2 databases yaitu untuk dependent dan independent
speaker.
Tabel 2 Database suara dependent
No
|
Suara
|
Jumlah Pengucapan
|
1
|
Kanan
|
15 kali
|
2
|
Kiri
|
15 kali
|
3
|
Maju
|
15 kali
|
4
|
Mundur
|
15 kali
|
5
|
Stop
|
15 kali
|
Tabel 3 Database suara independent
No
|
Suara
|
Jumlah Pengucapan
|
|
Laki-laki
|
Perempuan
|
||
1
|
Kanan
|
25 kali
|
23 kali
|
2
|
Kiri
|
25 kali
|
23 kali
|
3
|
Maju
|
25 kali
|
23 kali
|
4
|
Mundur
|
25 kali
|
23 kali
|
5
|
Stop
|
25 kali
|
23 kali
|
Proses pengujian yang
dilakukan adalah sbb :
Gambar
8 Pengujian Sistem
Kondisi yang digunakan untuk melakukan perekaman adalah ditempat kedap suara dan untuk melakukan proses pengenalan adalah di tempat yang tenang dengan suara yang santai tanpa tekanan
1.1
Dependent
Speaker
Dilakukan pengujian untuk setiap perintah dengan 10 kali
pengucapan dan dengan databases suara 1 orang laki-laki, menghasilkan data
pengujian sbb:
Gambar 9 Grafik akurasi dengan perintah
Gambar 10 Grafik waktu dengan perintah
1.2
Independent
Speaker
Dilakukan pengujian untuk setiap perintah dengan 10 kali
pengucapan lalu dengan databases suara 25 laki-laki dan 23 perempuan
mengasilkan data pengujian sbb:
Gambar 11 Grafik akurasi dengan perintah
Gambar 12 Grafik waktu dengan perintah
Untuk rata-rata waktu pengenalan yang diperoleh adalah
3.5 detik, hal ini di karenakan proses pada kongfigurasi, kata akan mulai
dianalisis setelah system mendapat input dari microphone namun proses analisis
ini memakan waktu yang lama, proses ini dikarenakan adanya WARNING dimana
sinyal mulai disampling baik sebelum diberikan input ataupun sesudah diberikan
input, pada saat belum diberikan input maka sistem akan mendeteksi bahwa level
yang dimasukkan adalah 0 sehingga proses sampling tidak terjadi, dan kemudian
setelah ada sinyal yang dimasukkan baru dimulai proses sampling pada sinyal,
dari proses sampling ini kemudian sinyal akan di analisis untuk diambil
parameternya. Dari parameter inilah yang diambil dan dibandingkan dengan
parameter yang terdapat pada model untuk dicari parameter model yang mana yang
paling mendekati, baru kemudian setelah didapatkan kemudian dicocokkan dengan
kata yang terdapat pada dictionary
sehingga didapatkan outputan dilayar.
Dan untuk akurasi kata bisa diperbaiki dengan menambah
jumlah databases suara serta kualitas database perekaman yang dilakukan pada
proses analisis dan training.
1.3
Pengujian
speech recognition dengan Robot PDA
Analisa dan pengujian ini dilakukan dengan memberikan
perintah terhadap robot sebanyak 20 kali secara acak untuk kelima perintah yang
telah di tentukan dengan metode independent speaker :
Tabel 4 Pengujian metode Independent speaker
dengan robot PDA
No
|
Perintah
|
Gerak Robot
|
Waktu
|
1
|
Kanan
|
Stop
|
7
|
2
|
Maju
|
Maju
|
4
|
3
|
Kiri
|
Kiri
|
5
|
4
|
Mundur
|
Mundur
|
5
|
5
|
Kanan
|
Stop
|
8
|
6
|
Kiri
|
Stop
|
6
|
7
|
Mundur
|
Mundur
|
5
|
8
|
Maju
|
Maju
|
5
|
9
|
Stop
|
Stop
|
4
|
10
|
Maju
|
Maju
|
4
|
11
|
Kiri
|
Kiri
|
5
|
12
|
Mundur
|
Mundur
|
4
|
13
|
Stop
|
Stop
|
5
|
14
|
Mundur
|
Mundur
|
4
|
15
|
Kanan
|
Stop
|
7
|
16
|
Maju
|
Maju
|
4
|
17
|
Kiri
|
Kiri
|
5
|
18
|
Mundur
|
Stop
|
8
|
19
|
Maju
|
Maju
|
5
|
20
|
Stop
|
Stop
|
5
|
BAB III
KESIMPULAN
- Dalam HTK setiap kata yang akan di kenali harus di
rekam dalam dan dilabeli, selanjutnya dianalisis dan dilakukan proses
training baru kemudian di masukkan dictionary untuk dilakukan proses
pengenalan.
- Untuk membuat pengenalan suara yang kecil seperti
judul proyek akhir ini (small vocabulary) ukuran vektor yang digunakan
dalam endcoding tidak terlalu banyak mempengaruhi hasil pengenalan
suaranya.
- Untuk perekaman database dan jumlah yang berbeda
dapat mempengaruhi hasil pengenalan dari HTK.
- Dengan perekaman database yang dilakukan kali ini
selalu terdapat satu kata yang tidak dapat dikenali dengan baik karena
belum dapat membuat model yang sesuai dengan suara tersebut.
- Hasil dari pengenalan offline (dari file yang
digunakan dalam database) sangat mempengaruhi hasil pengenalan langsung.
- Untuk mengintegrasikan dengan pemrogramman socket
dapat dilakukan dengan mengambil dari file penampung data output dari HTK.
2.REFERENSI
1.Wahyudin
Aziz, ”Pemanfaatan Galatea Untuk Pembangunan Karakter Hidup Sub: Speech
Recognition Modul”, Tugas Akhir EEPIS – ITS , 2006.
[1]
Eko Briliian
Bhakti, ” Aplikasi Pengenalan Suara
Untuk Login Pada Sistem Operasi Linux Dengan HTK Tools Sub Judul : Membangun Sistem Pengenalan
Suara”, Tugas Akhir EEPIS-ITS, 2004
[2]
Microsoft Corporation, Cambridge University Engineering Department, HTK Book (2001-2005). htkbook.pdf
[3]
Nicolas Moreau, “Htk-basic-tutorial.pdf”, Microsoft Corporation, Cambridge University Engineering Department,
2002
[4] B. T. Tan and M. Fu. “coustic-phonetic analysis of the
speech signals”. Internal report. Department of Electrical and Computer
Engineering, University of Newcastle, Australia, 1994.
[5] Arry Akhmad Arman, ”Teknologi Pemrosesan Bahasa Alami sebagai Teknologi
Kunci untuk Meningkatkan Cara Interaksi antara Manusia dengan Mesin”. Fakultas Teknologi Industri – ITB, 23
Agustus 2004
[6] Brian
Hall, “Beej’s Guide to Network Programming Using Internet Sockets” 1995-2001
[7]
Sams Publishing, “Sams Teach Yourself Shell
Programming in 24 Hours”.
http://htk.eng.cam.ac.uk/ Juni 2007.
Posting Komentar