TOPIK            : KOMPUTER HIBRYD
JUDUL           : ROBOTIK

NAMA           : PUTRA BELA RAMA
NIM               : 13.230.0043
KELOMPOK   : 2

BAB I
1.      1. PENDAHULUAN
Abstrak - Proses pengolahan sinyal wicara (speech recognition) telah berkembang pesat sehingga dapat digunakan untuk berbagai aplikasi begitu juga teknologi wireless jaringan komputer. Berawal dari teknologi tersebut maka timbulah ide untuk mengembangkan proses pengolahan sinyal wicara menjadi suatu aplikasi untuk mengendalikan robot dengan wi-fi.
            Proses pengenalan wicara ini menggunakan metode HMM yaitu pengenalan suara berdasarkan statistik. HTK tool merupakan software yang menggunakan metode HMM dan dapat melakukan pengenalan suara dengan baik. Pengiriman hasil pengenalan HTK menggunakan pemrogramman socket berbasis client-server.
                Dari hasil penggabungan tersebut, penelitian ini sudah dapat melakukan proses pengiriman perintah suara yang dikenali HTK hingga di terima oleh robot sebagai server dengan baik. Sehingga dapat digunakan untuk membuat aplikasi-aplikasi kontrol yang lain.


2.      LATAR BELAKANG
             Teknologi pengenalan wicara saat ini telah mengalami perkembangan yang cukup pesat. Banyak aplikasi-aplikasi yang telah di hasilkan seiring dengan metode dan proses dari pengenalan wicara tersebut. Dari perkembangan teknologi pengolahan sinyal suara ini munculah ide untuk membuat aplikasi yang dapat digunakan untuk mengendalikan robot. Dalam speech recognition terdapat beberapa permasalahan yang sering muncul dan berbeda untuk setiap permasalahannya misalnya kecepatan pengenalannya, ketepatan pengenalannya, dll. Saat ini telah terdapat HTK (Hidden Markov Model Toolkit) yaitu suatu tool atau perangkat lunak yang mudah digunakan untuk membangun dan memanipulasi HMM (Hidden Markov Model)[9].
HMM sendiri merupakan suatu sistem yang memodelkan simbol kedalam suatu mesin finite state (keadaan yang terbatas), sehingga diketahui simbol apa yang dapat mewakili sebuah parameter vektor dari sebuah kata yang dimasukkan kedalam mesin dan diestimasi berulang-ulang hingga dihasilkan parameter observasi dengan mean dan kovarian yang konvergen untuk setiap statenya[3]. Dengan tool ini maka pembuatan sistem pengenalan sinyal suara manusia dapat lebih bagus dan rapi (untuk setiap kata dari orang yang berbeda dan logat dari orang yang berbeda pula).
Melihat data diatas maka kita dapat membuat suatu sistem akses kontrol pada robot PDA dengan menggunakan suara manusia yang dapat membedakan antara manusia yang satu dengan yang lain. Dimana data tersebut dapat juga dilewatkan melalui jaringan komputer karena untuk keperluan mobilitas robot PDA sendiri maka robot harus dapat dikontol secara jarak jauh dan wireless.


BAB II
1.      PERMASALAHAN
       Untuk membuat suatu sistem pengolahan sinyal suara yang dapat memberikan akses kontrol pada robot PDA diperlukan beberapa hal antara lain :
1.       Bagaimana mengolah sinyal suara sendiri menggunakan metode HMM sehingga dari suara dirubah dalam bentuk text.
2.       Bagaimana membuat suatu sistem yang rapi dan dapat digunakan dengan mudah oleh user.

3.       Bagaimana mengirimkan paket data text ke robot PDA melalui jaringan komputer baik wire maupun wireless

  2.  PENYELESAIAN


Pembuatan Program.

   Setelah semua keperluan untuk program telah di install selanjutnya pembuatan program untuk   menggenerate sinyal input dengan data yang telah dimasukaan dalam database dimana dalam proses ini kita membuat script otomatis untuk melakukan analisis dan training databases.
  1. Perangkat-perangkat yang digunakan dalam tahap data preparation atau analisis[4]
·         HParse
·         HSGen
·         HSLab
·         HCopy
  1. Perangkat-perangkat yang digunakan dalam tahap training[4]
·         HCompV
·         HRest
·         HInit               
  1. Perangkat-perangkat yang digunakan dalam tahap testing[4]
·         Hvite
  1. Perangkat-perangkat yang digunakan dalam tahap analysis[4]
·         HResults

Pengambilan database.

Untuk memperoleh kualitas pengenalan suara yang baik diperlukan database suara yang banyak dengan gaya dan logat yang berbeda, dengan database yang besar kita akan dapat menentukan kata yang diinputkan dan kemudian akan diumpankan ke dictionary untuk mengetahui jenis kata yang diucapkan[6].
Langkah-langkah pembuatan databases suara :
  • Pembuatan Struktur Direktori
  • Perekaman data

Menghubungkan dengan robot PDA.

Setelah sinyal suara yang dinputkan dapat dikenali dengan baik oleh sistem selanjutnya data text yang dihasilkan akan dikirim ke robot PDA dengan menggunakan socket programming baik menggunakan wire maupun wireless. Dimana data yang dikirimkan di rubah dalam bentuk standart agar memudahkan sistem kontrol yang lain yaitu :
·         Maju = 2
·         Mundur = 8
·         Kanan = 6
·         Kiri = 4
·         Stop = 5

PENGUJIAN

Pengujian ini dilakukan pada PC dengan spesifikasi sebagi berikut :

Tabel 1 Spesifikasi Perangkat yang digunakan
NO
DESKRIPSI
SPESIFIKASI
1
Processor model
Intel(R) Pentium(R) 4 CPU 3.00 GHz
2
Memory
512 MB DDRAM
3
HDD
40GB, 7200rpm
4
Sound Card
Creative Sound Blaster Live 5.1
5
Microphone
Sony F-V620
6
Power
400W
7
Operating System
Linux/GNU Debian
8
Kernel
2.6.18-2-686

Analisa yang dilakukan adalah melakukan pengujian terhadap sistem dengan 2 databases yaitu untuk dependent dan independent speaker.

Tabel 2 Database suara dependent
No
Suara
Jumlah Pengucapan
1
Kanan
15 kali
2
Kiri
15 kali
3
Maju
15 kali
4
Mundur
15 kali
5
Stop
15 kali

Tabel 3 Database suara independent
No
Suara
Jumlah Pengucapan
Laki-laki
Perempuan
1
Kanan
25 kali
23 kali
2
Kiri
25 kali
23 kali
3
Maju
25 kali
23 kali
4
Mundur
25 kali
23 kali
5
Stop
25 kali
23 kali

Proses pengujian yang dilakukan adalah sbb :

DSC01159
Gambar 8 Pengujian Sistem

Kondisi yang digunakan untuk melakukan perekaman adalah ditempat kedap suara dan untuk melakukan proses pengenalan adalah di tempat yang tenang dengan suara yang santai tanpa tekanan

1.1           Dependent Speaker

Dilakukan pengujian untuk setiap perintah dengan 10 kali pengucapan dan dengan databases suara 1 orang laki-laki, menghasilkan data pengujian sbb:
Gambar 9 Grafik akurasi dengan perintah
Gambar 10 Grafik waktu dengan perintah

1.2           Independent Speaker

Dilakukan pengujian untuk setiap perintah dengan 10 kali pengucapan lalu dengan databases suara 25 laki-laki dan 23 perempuan mengasilkan data pengujian sbb:
Gambar 11 Grafik akurasi dengan perintah
Gambar 12 Grafik waktu dengan perintah

Untuk rata-rata waktu pengenalan yang diperoleh adalah 3.5 detik, hal ini di karenakan proses pada kongfigurasi, kata akan mulai dianalisis setelah system mendapat input dari microphone namun proses analisis ini memakan waktu yang lama, proses ini dikarenakan adanya WARNING dimana sinyal mulai disampling baik sebelum diberikan input ataupun sesudah diberikan input, pada saat belum diberikan input maka sistem akan mendeteksi bahwa level yang dimasukkan adalah 0 sehingga proses sampling tidak terjadi, dan kemudian setelah ada sinyal yang dimasukkan baru dimulai proses sampling pada sinyal, dari proses sampling ini kemudian sinyal akan di analisis untuk diambil parameternya. Dari parameter inilah yang diambil dan dibandingkan dengan parameter yang terdapat pada model untuk dicari parameter model yang mana yang paling mendekati, baru kemudian setelah didapatkan kemudian dicocokkan dengan kata yang terdapat pada dictionary sehingga didapatkan outputan dilayar.
Dan untuk akurasi kata bisa diperbaiki dengan menambah jumlah databases suara serta kualitas database perekaman yang dilakukan pada proses analisis dan training.

1.3           Pengujian speech recognition dengan Robot PDA

Analisa dan pengujian ini dilakukan dengan memberikan perintah terhadap robot sebanyak 20 kali secara acak untuk kelima perintah yang telah di tentukan dengan metode independent speaker :

Tabel 4 Pengujian metode Independent speaker dengan robot PDA
No
Perintah
Gerak Robot
Waktu
1
Kanan
Stop
7
2
Maju
Maju
4
3
Kiri
Kiri
5
4
Mundur
Mundur
5
5
Kanan
Stop
8
6
Kiri
Stop
6
7
Mundur
Mundur
5
8
Maju
Maju
5
9
Stop
Stop
4
10
Maju
Maju
4
11
Kiri
Kiri
5
12
Mundur
Mundur
4
13
Stop
Stop
5
14
Mundur
Mundur
4
15
Kanan
Stop
7
16
Maju
Maju
4
17
Kiri
Kiri
5
18
Mundur
Stop
8
19
Maju
Maju
5
20
Stop
Stop
5

BAB III

KESIMPULAN

  1. Dalam HTK setiap kata yang akan di kenali harus di rekam dalam dan dilabeli, selanjutnya dianalisis dan dilakukan proses training baru kemudian di masukkan dictionary untuk dilakukan proses pengenalan.
  2. Untuk membuat pengenalan suara yang kecil seperti judul proyek akhir ini (small vocabulary) ukuran vektor yang digunakan dalam endcoding tidak terlalu banyak mempengaruhi hasil pengenalan suaranya.
  3. Untuk perekaman database dan jumlah yang berbeda dapat mempengaruhi hasil pengenalan dari HTK.
  4. Dengan perekaman database yang dilakukan kali ini selalu terdapat satu kata yang tidak dapat dikenali dengan baik karena belum dapat membuat model yang sesuai dengan suara tersebut.
  5. Hasil dari pengenalan offline (dari file yang digunakan dalam database) sangat mempengaruhi hasil pengenalan langsung.
  6. Untuk mengintegrasikan dengan pemrogramman socket dapat dilakukan dengan mengambil dari file penampung data output dari HTK.

2.REFERENSI

 
       1.Wahyudin Aziz, ”Pemanfaatan Galatea Untuk Pembangunan Karakter Hidup Sub: Speech Recognition       Modul”, Tugas Akhir EEPIS – ITS , 2006.
[1]     Eko Briliian Bhakti, ” Aplikasi Pengenalan Suara Untuk Login Pada Sistem Operasi Linux Dengan HTK Tools  Sub Judul : Membangun Sistem Pengenalan Suara”, Tugas Akhir EEPIS-ITS, 2004
[2]     Microsoft Corporation, Cambridge University Engineering Department, HTK Book (2001-2005). htkbook.pdf
[3]     Nicolas Moreau, “Htk-basic-tutorial.pdf”, Microsoft Corporation, Cambridge University Engineering Department, 2002
[4]     B. T. Tan and M. Fu. “coustic-phonetic analysis of the speech signals”. Internal report. Department of Electrical and Computer Engineering, University of Newcastle, Australia, 1994.
[5]   Arry Akhmad Arman, ”Teknologi Pemrosesan Bahasa Alami sebagai Teknologi Kunci untuk Meningkatkan Cara Interaksi antara Manusia dengan Mesin”. Fakultas Teknologi Industri – ITB, 23 Agustus 2004
[6]   Brian Hall, “Beej’s Guide to Network Programming Using Internet Sockets” 1995-2001
[7]     Sams Publishing, “Sams Teach Yourself Shell Programming in 24 Hours”.
http://htk.eng.cam.ac.uk/ Juni 2007.

0 komentar

Posting Komentar

Arsip Blog

Follower