PARADIGMA BARU PENDIDIKAN MATEMATIKA DAN APLIKASI ONLINE INTERNET PEMBELAJARAN 31 | P a g e Klasifikasi Sinyal EEG Menggunakan Metode Fuzzy C-Means Clustering (FCM) Dan Adaptive Neighborhood Modified Backpropagation (ANMBP) Dian Candra Rini Novitasari Jurusan Matematika Universitas Islam Negeri Sunan Ampel, Surabaya. Email: diancrini@uinsby.ac.id Abstrak Instrumen EEG (electroencephalography) merupakan suatu instrumen yang digunakan sebagai perekam aktivitas otak dengan memperlihatkan gelombang otak. Prinsip kerja EEG adalah dengan mendeteksi perubahan muatan secara tiba- tiba dari sel neuron yang ditandai dengan adanya interictal spike-and-wave pada hasil EEG (electroencephalogram). Terdapat suatu data set sinyal EEG, direkam pada sukarelawan normal dan epilepsi. Pada penelitian ini dengan menggunakan data tersebut akan dilakukan suatu sistem klasifikasi sinyal EEG dengan berdasar pada kondisi normal dan epilepsi. Klasifikasi sinyal EEG menggunakan Metode Adaptive Neighborhood Base Modified Backpropagation (ANMBP). Hasil ekstraksi fitur dari sinyal EEG dengan menggunakan metode Fuzzy C-Means (FCM) Clustering, dimana proses awalnya melalui dekomposisi wavelet menggunakan Discrete Wavelet Transform (DWT) dengan level 2 didapatkan 3 koefisien wavelet kemudian pada masing masing koefisien tersebut di clustering menggunakan FCM dengan 2 cluster sehingga menghasilkan 6 fitur yang akan menjadi vektor fitur. Dari vektor fitur tersebut digunakan sebagai inputan untuk dilakukan proses klasifikasi dengan menggunakan metode ANMBP. Hasil sistem sementara didapatkan recognition rate sebesar 74.37%. Kata kunci: EEG, Wavelet, FCM, Backpropagation, Modified. Abstract EEG (electroencephalography) is an instrument used to records brain activity and shows some brain waves. The working principle is to detect changes in EEG sudden charge of neuron cells characterized by interictal spike-and-wave on the EEG. There is a data set of EEG signals, recorded from normal volunteers and epilepsy. By using the data, we will build classification of EEG signals system and the classification system based on the EEG signals, normal and epilepsy conditions. Classification of EEG signals is using Adaptive Neighborhood Base Modified Backpropagation (ANMBP) method. The result of EEG signals feature extraction, using Fuzzy C-Means (FCM) Clustering. Using wavelet decomposition level 2 and using FCM with 2 cluster each sub-band of wavelet coefficients then the probability distribution of each cluster in each sub-band is calculated. The result of probability distribution in each cluster of each sub-band is the feature vectors and will be inputed to the classification process by using ANMBP. The temporary result system gives the accuracy of 74.37%. Keywords: EEG, Wavelet, FCM, Backpropagation, Modified. 32 | P a g e 1. Pendahuluan Penyakit epilepsi adalah penyakit yang dapat terjadi pada siapun walaupun dari garis keturunan tidak ada yang pernah mengalami epilepsi ini. Akan tetapi penyakit epilepsi tidak dapat menular. Epilepsi ini merupakan sebuah gangguan yang terjadi di sistem syaraf otak manusia yang disebabkan adanya aktifitas kelompok sel neuron yang terlalu berlebihan hingga akhirnya terjadi berbagai reaksi pada penderitanya. Epilepsi dapat terjadi karena lepasnya muatan listrik yang berlebihan dan mendadak pada otak sehingga penerimaan serta pengiriman impuls dari otak ke bagian-bagian lain dalam tubuh terganggu [10]. Untuk mendiagnosis penyakit epilepsi menggunakan pemeriksaan EEG. Karena instrumen electroencephalogram (EEG) dapat digunakan untuk perekaman yang menunjukkan aktivitas listrik otak, hal tersebut dapat memberikan suatu pengetahuan mengenai gangguan aktivitas otak. Dalam konteks ini, rekaman EEG diukur dalam interval bebas kejang dari pasien epilepsi dianggap sebagai komponen penting untuk proses diagnosis atau prediksi [2][6]. Meskipun terjadinya serangan epilepsi tampaknya tidak terduga [7], lebih banyak upaya yang difokuskan pada pengembangan model komputasi untuk deteksi otomatis debit epilepsi, yang kemudian dapat digunakan untuk memprediksi terjadinya kejang [2][3]. Banyak sistem diagnosis yang digunakan untuk mengklasifikasikan sinyal EEG untuk mengklasifikasikan antara epilepsi dengan kondisi normal [6][7][8]. Adaptive Neighborhood Base Modified Backpropagation (ANMBP), merupakan suatu metode klasifikasi yang sangat handal [1][9]. ANMBP ini memodifikasi metode backpropagation, dengan menggabungkan error linier dan non linier, adaptif learning rate serta neighborhood pada backpropagation. Pada penelitian kali ini, akan dibuat suatu sistem klasifikasi, dimana menggabungkan antara Discrete Wavelete Transform (DWT), Fuzzy C-Means Clustering (FCM), dan Perhitungan Probabilitas sebagai proses ekstraksi fiturnya, dan menggunakan ANMBP sebagai metode klasifikasinya. Diharapkan dengan menggabungkan beberapa metode tersebut dapat menghasilkan sistem klasifikasi yang handal yaitu membedakan kondisi normal atau epilepsi dengan menggunakan data EEG. 2. Data Data sinyal EEG digital dapat diperoleh dari database yang tersedia di Universitas Bonn yang tersedia secara online dan dibuat oleh Dr. Ralph Andrzejak dari Pusat Epilepsi di Universitas Bonn, Jerman dan dapat di download atau di unduh dari link berikut: (http://epileptologie.bonn.de/cms/front_conten t.php?idcat=193&lang=3&changelang=3). Selain itu, data sinyal EEG dalam bentuk digital dapat diperoleh di http://sccn.ucsd.edu/~arno/fam2data/publicly_ available_EEG_data.html. Data sinyal EEG dari Universitas Bonn terdiri atas lima kelas dataset yaitu A, B, C, D, dan E. Tiap dataset berisi 100 segmen EEG saluran tunggal dengan durasi selama 23.6 detik. Setiap segmen dipilih dan dipotong dari rekaman EEG multichannel secara kontinyu setelah inspeksi artefak secara visual, misalnya gerakan mata atau aktivitas otot. Sebelum dilakukan proses ektraksi fitur, sebelumnya dilakukan untuk preprocessing terhadap data yang akan digunakan dalam penelitian ini. Proses preprocessing pertama adalah memecah data menjadi segmen-segmen dengan ukuran 256 data dari 2 data set sinyal EEG, yaitu set A dan set E. Dari masing- masing kelas data, terdiri dari 100 segmen data dengan panjang masing-masing data 4097. Data tiap segmen sebanyak 4097 tersebut kemudian dilakukan windowing (pemotongan) dengan panjang 256. Hasil pemotongan sinyal didapatkan data yang lebih kecil sebanyak 4097/256 = 16 segmen. Jumlah segmen data keseluruhan yang diperoleh dari pemotongan sinyal EEG set A dan set E didapatkan data sebanyak 2x100x16 = 3200 segmen data (ket: 2 merupakan kelas dari set A dan set E, 100 adalah jumlah masing-masing data awalnya, 16 merupakan segmen per 1 data awal). Jadi 3200 segmen data inilah yang nanti akan digunakan sebagai data training dan data testing. 33 | P a g e 3. Metodologi Metode yang diterapkan dalam penelitian ini, dapat dilihat pada gambar flowchart pada gambar 1. Gambar 1. Diagram alur sistem proses klasifikasi sinyal EEG 3.1 Ekstraksi Fitur Proses ektraksi fitur yang pertama dilakukan dengan menggunakan metode Discrete Wavelet Transform (DWT), dimana proses awalnya DWT menguraikan sinyal ke dalam sub-band dengan menggunakan low-pass filtering dan high-pass filtering dari domain waktu sinyal. Low-pass filtering menghasilkan aproksimasi dan high-pass filtering menghasilkan koefisien detil. Dimana pada level selanjutnya dekomposisi dilakukan dengan menggunakan aproksimasi pada level sebelumnya. Pada penelitian ini tipe wavelet yang digunakan adalah Daubechies Wavelet order 2 (db2), hal tersebut didapatkan dari hasil penelitian sebelumnya. Secara garis besar, dekomposisi membagi panjang data menjadi 2, yaitu berdasarkan low- pass filtering dan high-pass filtering. Dilakukan permisalan data mempunyai panjang 256, didekomposisikan pada level 1 berdasarkan low- pass filtering menghasilkan panjang data 128 yang di sebut aproksimasi 1 (A1) dan berdasarkan high-pass filtering menghasilkan panjang data 128 yang di sebut detil 1 (D1). Untuk melakukan dekomposisi pada level 2 maka menggunakan aproksimasi 1 dengan panjang 128, didekomposisikan low-pass filtering menghasilkan panjang data 64 yang di sebut aproksimasi 2 (A2) dan berdasarkan low- pass filtering menghasilkan panjang data 64 yang disebut detil 2 (A2). Gambar 2. Proses Dekomposisi sinyal EEG Untuk proses selanjutnya, dilakukan clustering pada masing-masing koefisien wavelet menggunakan FCM dengan 2 cluster, jadi aproksimasi 2 dibagi ke dalam 2 cluster, detil 2 dibagi ke dalam 2 cluster, dan detil 1 dibagi ke dalam 2 cluster. FCM menggunakan fungsi keanggotaan untuk mencari kesamaan antara kumpulan data dengan center, menggunaan fungsi objektif dan mempartisi data masuk kedalam kluster-kluster hingga optimasi dari fungsi objektif tercapai. Dari hasil clustering menggunakan FCM ini didapatkan 6 buah cluster, selanjutnya masing- masing cluster dihitung nilai probabilitasnya. Proses ektraksi fitur yang terakhir yaitu perhitungan probabilitas dari masing-masing cluster, karena aproksimasi 2 dari proses FCM menghasilkan 2 cluster, untuk perhitungan probabilitasnya dimisalkan P1 dan P2, P1 didapatkan dari jumlah koefisien wavelet yang masuk ke cluster 1 dibagi dengan panjang data aproksimasi 2 dan P2 didapatkan dari jumlah koefisien wavelet yang masuk ke cluster 2 dibagi dengan panjang data aproksimasi 2. Untuk detil 2, dari proses FCM menghasilkan 2 cluster untuk perhitungan probabilitasnya dimisalkan P3 dan P4, P3 didapatkan dari jumlah koefisien wavelet yang masuk ke cluster 1 dibagi dengan panjang data detil 2 dan P2 didapatkan dari jumlah koefisien wavelet yang masuk ke cluster 2 dibagi dengan panjang data detil 2. Hal tersebut juga berlaku untuk detil 1, dimana menghasilkan dua nilai probabilitas Sinyal EEG Discrete Wavelete Transform Fuzzy C-Means Clustering (FCM) Adaptive Neighborhood Modified Backpropagation(ANMBP) Hasil Klasifikasi 34 | P a g e dimisalkan P5 dan P6, P5 didapatkan dari jumlah koefisien wavelet yang masuk ke cluster 1 dibagi dengan panjang data detil 1 dan P6 didapatkan dari jumlah koefisien wavelet yang masuk ke cluster 2 dibagi dengan panjang data detil 1. Proses ekstraksi fitur secara keseluruhan dapat dilihat pada gambar berikut ini: Gambar 3. Contoh hasil ektraksi fitur 3.2 Klasifikasi Untuk klasifikasi metode yang digunakan adalah metode Adaptive Neighborhood Modified Backpropagation (ANMBP). Metode tersebut merupakan pengembangan dari metode backpropagation yaitu dengan menggabungkan dari penjumlahan error linier dan error non linier menggunakan adaptive parameter learning dan terdapat struktur neighborhood pada hidden layer. Untuk mencari nilai net/jaringan digunakan rumus berikut: 1 1    s i n i s ji s j ywu (1) s ju s j y e uf s j     )1( 1 )( (2) Dengan n menunjukkan jumlah neuron dan s ij w adalah bobot dari neuron ke i dari layer (s-1) ke neuron ke j dari layer s. Untuk menghitung error (E) yang didapatkan dari penjumlahan dari kuadrat error linier dan non linier yang dihasilkan dari output.      n j n j s j s jp eeE 1 1 2 2 2 1 )( 2 1 )( 2 1  (3) dimana λ adalah learning rate, error non-linier di simbolkan dengan e1 dan error linier disimbolkan dengan e2 yang diperoleh rumus: s j s j s j yde  1 (4) s j s j s j ulde  2 (5) )( 1 s j s j dfld   (6) Simbol d adalah output yang diinginkan dan y adalah output yang dihasilkan dari sistem. Sehingga perubahan bobot pada layer output menjadi seperti rumus berikut: ji s ji W E w     (7) 1 21 21              s i s js ji s j s j s js j s ji s ji s js js ji s js j s ji ye W u u y ew W u e W y ew   1 2 1' 1 )(   s i s j s i s j s j s ji yeyufew  (8) Error linier dan non linier pada hidden layer (L) adalah: 111 1 ' 1 )( 1      L rj L ir L r n r L j weufe L ( 9) 11 2 1 1 2 1 ))(      L rj L r n r L j L j weufe L (10) Sehingga perubahan bobot pada hidden layer adalah : 1 2 '1 1 )(   L i L j L j L i L j L ji yeufyew  (11) Parameter learning μ dan μλ diganti dengan parameter adaptive η’ dan μ’       2 1 1' 2 1' ||)(|| |||| j s ij j eyuf e (12)       2 1 1' 2 1' ||)(|| |||| j s ij j eyuf e (13) Dimana μ, λ adalah konstanta dengan nilai kecil positif dan ε konstanta dengan nilai kecil positif untuk menjamin adanya ketidakstabilan ketika error menuju 0. Sehingga perubahan bobot yang terjadi pada layer output dan hidden layer menjadi : 35 | P a g e 1 2 '1' 1 ' )(   s i s j s i s j s j s ji yeyufew  (14) 1 2 '1' 1 ' )(   L i L j L i L j L j L ji yeyufew  (15) )()()1( twtwtw  (19) Perubahan bobot hanya dilakukan pada bobot di node-node layer hidden dan node layer output yang merupakan neighborhood dari neuron-neuron yang terpilih di layer hidden. Neighborhood terlihat seperti gambar 4, dimana diilustrasikan dengan garis putus-putus. Gambar 4. Struktur jaringan dengan neighborhood 4. Pembahasan Hasil Dari proses ektraksi fitur yang menghasilkan 6 fitur yang kemudian dijadikan satu menjadi vektor fitur digunakan sebagai inputan pada klasifikasi menggunakan ANMBP. Contoh hasil ektraksi fitur dengan level dekomposisi waveletnya 2 dan klaster pada FCM ditentukan sebanyak 2 dapat dilihat pada gambar 5. Gambar 5. Tabel Contoh Hasil Ekstraksi Fitur Setelah didapatkan hasil ekstraksi fitur, vektor fitur tersebut yang digunakan sebagai masukkan / inputan pada proses klasifikasi menggunakan ANMBP. Untuk hasil klasifikasi menggunakan ANMBP strukturnya dibuat seperti gambar 6. Gambar 6. Jaringan ANMBP yang dibangun Dengan menggunakan jaringan diatas, tidak mutlak menggunakan keseluruhan jaringan, karena bersifat adaptif maka tergantung generate dari parameter yang digunakan, sehingga garis putus-putus diatas, menunjukkan contoh bahwa ada beberapa net yang tidak dipakai. Untuk training (pelatihan) dan testing (pengujian), maka diambil sampel secara random dari 3200 data set. Untuk kelas normal (set A) jumlah data setnya 1600, diambil 70% secara random, begitu pula dengan data set untuk kelas epilepsi (set E) yaitu sejumlah 1120 data set, sehingga total yang digunakan sebagai data training yaitu 2240. Selain data training, atau sisa 30% dari data set digunakan sebagai data testing (pengujian) yaitu sebanyak 960 data set. Struktur jaringan adalah input sejumlah 6 didapatkan dari hasil ekstraksi fitur, hidden layer menggunakan satu layer dengan 8 node, Fungsi aktivasi yang digunakan adalah sigmoid biner. Untuk mencapai hasil yang optimal perlu diperhatikan pemilihan nilai konstanta μ, λ (learning rate) dan ε pada adaptif learning rate. Pemilihan nilai ini dilakukan secara heuristik. Pada penelitian ini nilai konstanta μ = 0.3, λ = 0.000001, dan ε =0.1 serta bias = 0.5. Dengan menggunakan parameter tersebut 36 | P a g e hasil satu kali training dan satu kali testing (uji data), dengan menggunakan parameter uji recognition rate berikut. Recognition rate = , didapatkan yang teruji benar adalah 714 dari 960 data, sehingga didapatkan akurasi sebesar 74.37%. 5. Kesimpulan Dari sistem yang telah dibuat penulis masih jauh dari sempuna, dimana hasil recognition rate nya masih cukup rendah dibandingkan dua penelitian sebelumnya yaitu sebesar 74.37%. Pada penelitian sebelumnya bahkan ANMBP mampu sampai melebihi 90% untuk recognition rate-nya. Untuk penelitian selanjutnya perlu dilakukan uji coba dalam beberapa hal, antara lain: 1. Penggunakan jumlah level dekomposisi wavelet. 2. Penggunaan jumlah kluster, untuk metode FCM. 3. Parameter-parameter yang digunakan pada jaringan adaptive neighborhood base modified backpropagation (ANMBP) seperti jumlah hidden layer, learning rate, dan lain sebagainya. Penelitian ini masih jauh dari kata sempurna, karena masih dilakukan satu kali training dan satu kali testing (pengujian) maka akan terus dilakukan pengujian data dengan menggunakan parameter-parameter yang ada baik pada proses ektraksi fitur maupun klasifikasi yang ada. Referensi [1]Werdiningsih, Indah. Tranformasi Wavelet dan Adaptive Neighborhood Base Modified Backpropagation (ANMBP) untuk Klasifikasi Data Mamogram.Jurnal SCAN vol IX no 2. 2014. [2] Adeli H, Zhou Z, Dadmehr N.”Analysis of EEG records in an epileptic patient using wavelet transform”. J Neurosci Methods; 123(1):69–87. Elsivier Science Ltd. 2003. [3] Elif Derya Übeylï.”Least squares support vector machine employing model-based methods coefficients for analysis of EEG signals”, Expert Systems with Applications 37, 233–239. Elsivier Science Ltd. 2010. [4] Hekim, M., & Orhan, U.“Subtractive approach to fuzzy c-means clustering method”. Journal of ITU-D, 10(1). 2011. [5] Orhan, U., Hekim, M., & Ozer, M. “Epileptic Seizure Detection Using Probability Distribution Based On Equal Frequency Discretization”. Journal of Medical Systems. doi :10.1007/s10916-011- 9689-y. Springler Ltd. 2011. [6] Subasi, A. EEG signal classification using wavelet feature extraction and a mixture of expert model. Expert Systems with Applications, 32, 1084–1093. 2007. [7] Subasi, A., & Ercelebi, E. Classification of EEG signals using neural network and logistic regression. Computer Methods and Programs in Biomedicine, 78, 87–99. Elsivier Science Ltd. 2005. [8] Novitasari, Dian Candra Rini., Klasifikasi Sinyal EEG Menggunakan Metode Fuzzy C- Means (FCM) Clustering dan Adaptive Neuro Fuzzy Inference System (ANFIS). Undergraduate Thesis, Department of Information Technology, Faculty of Information Technology, Institut Teknologi Sepuluh Nopember, Indonesia, 2013 [9] Werdiningsih, Indah. Sistem Diagnosis Kanker Payudara Menggunakan Wavelete Transform dan Modified Backpropagation Pada Data Mamogram. Undergraduate Thesis, Department of Information Technology, Faculty of Information Technology, Institut Teknologi Sepuluh Nopember, Indonesia, 2011 [10] Penyakit Epilepsi. http://penyakitepilepsi.com/. Diakses tanggal 17 Agustus 2015.