Microsoft Word - 47.TD Benny S - Pendeteksian Bagian Tubuh Manusia untuk Filter Pornografi dengan Metode Viola- ok.docx 482 ComTech Vol.3 No. 1 Juni 2012: 482-489 PENDETEKSIAN BAGIAN TUBUH MANUSIA UNTUK FILTER PORNOGRAFI DENGAN METODE VIOLA-JONES Benny Senjaya1; Alexander A S Gunawan2; Jerry Pratama Hakim2 1Industrial Engineering, Faculty of Engineering, Binus University Jln. K. H Syahdan No 9, Palmerah, Jakarta Barat 11480 bsenjaya@gmail.com 2Mathematics Department, School of Computer Science, Binus University Jln. K. H Syahdan No 9, Palmerah, Jakarta Barat 11480 aagung@binus.edu; jerry_pratama_mail@yahoo.co.id ABSTRACT Information Technology does help people to get information promptly anytime and anywhere. Unfortunately, the information gathered from the Internet does not always come out positive. Some information can be destructive, such as porn images. To mitigate this problem, the study aims to create a desktop application that could detect parts of human body which can be expanded in the future to become an image filter application for pornography. The detection methodology in this study is Viola-Jones method which provides a complete framework for extracting and recognizing image features. A combination of Viola-Jones method with Haar-like features, integral image, boosting algorithm, and cascade classifier provide a robust detector for the application. First, several parts of the human body are chosen to be detected as the data training using the Viola-Jones method. Then, another set of images (similar body parts but different images) are run through the application to be recognized. The result shows 86.25% of successful detection. The failures are identified and show that the inputted data are completely different with the data training. . Keywords: detection, human body, Viola-Jones method, Haar-like features, boosting algorithm ABSTRAK Perkembangan teknologi informasi yang sangat pesat mengakibatkan mudahnya untuk memperoleh informasi kapanpun dan di manapun. Sayangnya tidak hanya informasi positif, informasi yang merusak pun mudah diperoleh melalui media Internet, seperti image yang memiliki unsur pornografi. Untuk mengatasi masalah tersebut dikembangkan suatu program desktop pendeteksian bagian tubuh manusia yang nantinya dapat dikembangkan menjadi suatu sistem filter pornografi untuk image. Pendeteksian dilakukan menggunakan metode Viola-Jones, yang menawarkan suatu kerangka untuk mengekstrak fitur image dan kemudian mengenali image tersebut. Metode Viola-Jones menggabungkan fitur Haar-like, integral image, algoritma boosting, dan cascade classifier untuk menjadi sebuah metode detektor unggul. Langkah pertama adalah melatih data yang berkaitan dengan tubuh manusia dengan metode Viola-Jones. Setelah itu dilakukan pengujian terhadap program, dan diperoleh hasil bahwa program aplikasi ini dapat mendeteksi objek dalam beberapa bagian tubuh dengan tingkat keberhasilan 86,25%. Beberapa kegagalan dalam pendeteksian disebabkan karena posisi objek yang tidak sesuai dengan image yang dilatih. Kata kunci: deteksi, tubuh manusia, metode Viola-Jones, fitur Haar-like, algoritma boosting Pendeteksian Bagian Tubuh… (Benny Senjaya; dkk) 483 PENDAHULUAN Perkembangan teknologi informasi yang sangat pesat mengakibatkan mudahnya untuk memperoleh suatu informasi. Namun sayangnya tidak hanya informasi positif saja yang mudah diperoleh, informasi negatif pun mudah diperoleh melalui media Internet. Salah satunya adalah image yang memiliki unsur pornografi. Kata pornografi itu sendiri menurut Kamus Besar Bahasa Indonesia (Pusat Bahasa, 2008) memiliki arti yaitu penggambaran tingkah laku secara erotis dengan image atau tulisan untuk membangkitkan nafsu birahi. Tingkat pornografi di Indonesia sudah mencapai tingkat yang membahayakan, hal ini dapat dilihat dengan banyaknya berita yang terkait dengan pornografi pada media cetak seperti Kompas (Anna, 2011 & Suprihadi, 2008) dan Pos Kota (2012). Di lain pihak, tubuh manusia merupakan salah satu objek pendeteksian yang sedang populer, hal ini dapat dibuktikan dengan banyaknya jurnal penelitian mengenai perancangan program pendeteksian tubuh manusia seperti Syamsiar et al. (2009) dan Nugroho & Harjoko (2005). Oleh karena itu sangat penting untuk mengembangkan suatu program aplikasi untuk filter pornografi berdasarkan penelitian-penelitian yang telah ada. Hal ini dibutuhkan agar image yang dianggap porno bisa langsung dideteksi dan disensor. Dalam sistem pendeteksian bagian tubuh yang dibuat dengan metode Viola Jones (Arihutomo, 2010) sebagai input adalah sembarang image digital. Pengguna dapat menentukan bagian tubuh apa yang dicari dari image digital tersebut. Untuk penelitian ini tidak digunakan bagian-bagian tubuh yang bersifat seksual karena masalah sensitivitas data, tetapi diwakilkan dengan menggunakan bagian tubuh yang umum seperti wajah, mata, hidung, telinga, tubuh bagian atas, dan tangan. Aplikasi ini juga ke depannya dapat bermanfaat untuk pengembangan filter pornografi image baik secara online ataupun offline. METODE Digital Image Digital image (citra digital) menurut Gonzalez & Woods (2007) adalah image kontinu yang sudah didiskritkan baik secara spasial, maupun atribut yang lain seperti warna dan kecerahan. Digital image dianggap sebagai matriks dengan ukuran m×n, di mana baris dan kolom menunjukkan posisi pixel nya. Image berwarna menggunakan metode RGB. Dalam metode ini, warna memiliki tiga buah kombinasi angka yaitu R, G dan B, yang masing-masing menentukan proporsi warna merah, hijau, dan biru. Pengolahan image merupakan dasar dari pendeteksian objek. Dengan kualitas image yang baik, pendeteksian suatu objek akan lebih mudah dilakukan. Fitur Haar-like dan Haar Classifier Ekstraksi fitur (Barczak et al., 2007) merupakan tahap paling awal yang diperlukan dalam pendeteksian objek dengan menggunakan metode Viola-Jones. Penggunaan fitur ini dilakukan karena pemrosesan fitur berlangsung lebih cepat dibandingkan pemrosesan image per pixel. Dalam metode Viola-Jones digunakan fitur Haarlike yang diinspirasi oleh Wavelet Haar. Wavelet Haar merupakan gelombang bujur sangkar yang mempunyai satu interval tinggi dan satu interval rendah. Dalam penelitian ini digunakan 14 (empat belas) jenis fitur Haar-like, yang dapat dilihat pada Gambar 1. 484 L dengan digunaka Classifie of Casc memban didapat s learning Haar Cl merupak berisikan urutan a Classifie Integra I Image a kirinya. dan y ≤ atas sam keterang = D dihitung integral lokasi 2 persegi p G Langkah sel algoritma b an adalah Ad er setelah dil ade. Sehing ngun sebuah suatu keputu g, yaitu mem lassifier mem kan data yan n objek yang algoritmanya er of Cascade al Image Integral ima dalah sebuah Sebagai con b. Menurut V mpai kiri dari gan: = integral im original im Dengan ilust dengan men image pada adalah A+B panjang D da Gambar 1. Fitu lanjutnya da oosting untu daptive Boos lengkapi tekn gga dapat di boosted reje usan untuk m mbutuhkan da mbutuhkan d ng berisikan g akan tidak a setelah eks e. age merupak h image yan ntoh, pixel (a Viola & Jon x,y, perhitun age mage trasi pada Ga nggunakan e a lokasi 1, a B, nilai pada apat dihitung ur Haar-like ( lam metode uk mempelaj ting atau Ada nik untuk me isimpulkan b ection casca menentukan d ata training dua data set objek yang k dideteksi. traksi fitur H kan tahap ke ng nilai tiap a,b) memilik nes (2011), in ngannya dap ambar 2, perh empat referen adalah penju lokasi 3 ada g sebagai: (4+ (Lienhart, Kur Viola-Jones ajari fitur da daBoost. Seca empercepat k bahwa Haar ade, yang aka data positif. H untuk dapat yaitu data p g akan didete Selanjutnya Haar-like, y dua yang di pixel nya m ki nilai akum ntegral imag at dicari den hitungan jum nsi yaitu inte umlahan dari alah A+C, da +1)-(2+3). ComTec ranove, & Pis s adalah me alam suatu i ara singkat a komputasi ya r Classifier an membuan Haar Classifi mendeteksi positif dan d eksi, dan da akan dijaba aitu mengen ilakukan dala merupakan ak mulatif untuk ge pada lokas ngan menggu mlah dari pix egral image d i pixel dalam an pada loka ch Vol.3 No.   sarevsky, 2002 enggabungka image. Algo lgoritma ini aitu integral merupakan ng data train fier merupaka i objek-objek data negatif, ata negatif m arkan secara nai integral i am metode kumulasi dar semua pixel si x,y, berisik unakan rumus xel dalam per di lokasi 1, 2 m persegi pa asi 4 adalah A 1 Juni 2012: 2). an fitur Haa oritma boost disebut seba image dan C suatu meto ning negatif, an metode su k tertentu. U di mana da merupakan d a singkat ber image, Adab Viola-Jones. ri nilai pixel l (x,y) di ma kan jumlah p s berikut: rsegi panjang 2, 3, dan 4. N anjang A. N A+B+C+D. 482-489 r-like ini ing yang agai Haar Classifier ode yang sehingga upervised Untuk itu, ata positif data yang rdasarkan boost dan . Integral atas dan ana x ≤ a pixel dari g D dapat Nilai dari Nilai pada Sehingga Pendete AdaBo A Robert S AdaBoo beberapa pembeda menggun dianggap D adalah a Diberika negatif d Inisialisa Ulangi s Cocokka Atur nil sehingga Output d Cascad mengkom kecepata daerah-d like yang dengan bertingk eksian Bagian oost AdaBoost m Schapire (19 st berfungsi a fitur seder a yang tingg nakan nilai d p sebagai fitu Dari banyak lgoritma Gen an N contoh dan positif. asi bobot sebanyak an regresi fu lai a dari Classifie de of Class Cascade of mbinasikan an dari prose daerah dalam g paling sed fitur Haar-li kat. Gambar 3 an Tubuh… (B Gambar 2. erupakan sin 95). AdaBoo i untuk me rhana saja. A gi. Hal ini di dari fitur ters ur terbaik. k variasi alg ntle Adaboos gambar ungsi er sifier f Classifier pengklasifik es pendeteks m image yang derhana untu ike yang leb 3 di bawah in Benny Senjay . Perhitungan ngkatan dari ost ini merup engkonstruks AdaBoost be ilakukan den sebut. Fitur goritma Ada st. Berikut al dengan meto merupakan kasian dalam sian dapat m g berpeluang uk proses aw bih komplek ni adalah alu ya; dkk) integral imag Adaptive Bo pakan tahap si fitur yan erfungsi untu ngan mengev yang memili aBoost, algo lgoritma Gen di man ode kuadrat da n tahap tera m sebuah str meningkat ya g saja. Hal in walnya dan p ks. Jadi dalam ur kerja dari k ge (Viola & Jo oosing, difor ketiga dalam ng kompleks uk mencari valuasi setiap iki batas terb ritma yang ntle AdaBoos na terkecil berb an lakukan akhir dalam ruktur casca aitu dengan ni dilakukan d ada hasilnya m metode V klasifikasi be ones, 2001). rmulasikan o m metode Vi s, dengan h fitur-fitur ya p fitur terhad besar antara diterapkan st (Kuranov e u bobot dari normalisasi m metode V ade atau Ca cara memus dengan meng a baru dilaku Viola-Jones d ertingkat ters leh Yoav Fr iola-Jones. A hanya meng ang memilik dap data latih objek dan n dalam pene et al., 2002): untuk masin ke deng ulang untu Viola-Jones. ascade of C atkan perhat ggunakan fit ukan proses digunakan k sebut. 485 reund dan Algoritma ggunakan ki tingkat h dengan non-objek elitian ini : ng contoh gan bobot uk bobot Dengan Classifier, tian pada tur Haar- ekstraksi klasifikasi 486 window sebanyak pembelaj pohon k semua ta pertama, terhadap tingkat d Jones (2 di mana: = ting = jum = ting kesalaha lebih tin deteksi classifier Menurut mempen (1) juml threshold D sample i untuk m misalnya negatif d pelatihan dari pera G Struktur cas nya dalah d k mungkin d ajaran Adabo keputusan, pe ahap sebelum , dan begitu p tingkat det deteksi dari 011) formula : gkat deteksi d mlah classifie gkat deteksi d Selain itu d an yang dibu nggi mengha yang lebih rs dengan ti t Viola & ngaruhi kecep lah dari taha d dari setiap Data trainin image negati melakukan H a INRIA Dat diambil mela n dengan me angkat lunak Gambar 3. Alu scade menc data negatif. dan secepat m oost pada clas engklasifikas mnya. Akiba u selanjutny teksi yang l suatu casca a untuk meng dari cascade er dari classifie dalam setiap uat oleh fitur silkan classif rendah. Sed ngkat kesala Jones (2011 patan dan ti apan classifi tahapan. H ng yang beru f. Data traini Haar training taset, Caltech alui search e etode Viola-J k pendeteksia ur kerja klasif erminkan fa Dengan dem mungkin di l ssifier di set sian selanjutn atnya, classif ya. Sehingga lebih tinggi. de classifier ghitung hal t ed classifier er ke p tahapan te Haar-like be ifiers dengan dangkan keb ahan positif 1), dapat di ngkat akuras ier; (2) juml HASIL DA upa image i ing untuk sa g yang dipe h Dataset, at engine seban Jones dalam an bagian tub fikasi bertingk akta bahwa mikian, struk level yang se iap struktur c nya dilatih m ifier kedua m a classifiers Untuk itu r, menurut p tersebut adal erdapat nilai erdasarkan a n tingkat kes balikannya t yang lebih t i ambil kes si dalam pen lah dari feat AN PEMB ini dibagi m mple image eroleh dari taupun IIT D nyak 200 sam format berk buh manusia ComTec kat (Dzulkama dalam setia ktur ini berg esuai. Semen cascade (Vio menggunakan menghadapi yang lebih dibutuhkan penelitian yan lah: threshold y algoritma Ada salahan posit thresholds y tinggi dan tin simpulan, ba ndeteksian, f ture yaitu BAHASAN menjadi dua positif dalam beberapa da Delhi Dataset mple. Dari d as xml. Gam yang kemba ch Vol.3 No. ain et al., 2011 ap image, m guna untuk m ntara itu data ola & Jones, n data-data y tugas yang dalam mem suatu rumu ng telah dila yang dihitun aboost nya. N tif yang lebih yang lebih r ngkat deteks ahwa terdap faktor-faktor untuk setia N yaitu: samp m program ap atabase imag t. Sedangkan data training mbar 4 beriku angkan. 1 Juni 2012: 1). mayoritas da menolak dat a positif akan 2001). Miri yang sudah lebih sulit d miliki kores us untuk me akukan oleh ng agar mem Nilai thresho h sedikit, da rendah meng si yang lebih pat tiga fak r tersebut an ap tahapan k le image po plikasi ini dib ge di berba n untuk samp g ini didapatk ut ini adalah 482-489 alam sub ta negatif n memicu ip dengan melewati dari yang spondensi enghitung Viola & minimasi olds yang an tingkat ghasilkan h banyak. ktor yang ntara lain: ke…; (3) ositif dan butuhkan agai situs ple image kan hasil tampilan Pendeteksian Bagian Tubuh… (Benny Senjaya; dkk) 487 Gambar 4. Perangkat lunak pendeteksian bagian tubuh manusia. Selanjutnya data uji sample image positif dikumpulkan secara manual dengan memotret objek menggunakan kamera handphone dengan resolusi 5 mega pixel, dengan jarak 10-30 cm untuk wajah, mata, hidung, telinga kiri dan kanan, tangan dan jarak 100 cm untuk tubuh bagian atas. Hal ini dilakukan agar dapat menangkap objek yang akan dideteksi dengan cukup jelas. Data uji yang digunakan sebanyak 80 sampel image positif dari sepuluh orang. Dalam pengambilan data uji ini perlu di perhatikan beberapa hal meliputi: pencahayaan, jarak pengambilan image, dan kualitas kamera. Hasil yang diperoleh untuk pendeteksian kepada sepuluh orang dengan inisial A-J adalah (Tabel 1). Tabel 1 Hasil Percobaan terhadap Sepuluh Orang Nama Wajah Mata Hidung Tubuh Bagian atas Tangan Tegak ( ) Tangan Miring ( ) Telinga Kiri Telinga Kanan A b b b g b b b b B b b b b b g b g C b b b b g b b b D b g b b b b b b E b b b b b g g b F b b b b b b b b G b b b b b b b b H b b b g g b g b I b b b b g b b b J b b b b b b b b dengan keterangan sebagai berikut: b = berhasil dideteksi g = gagal atau tidak terdeteksi Berdasarkan hasil percobaan tersebut, maka keakuratan program ini adalah: Presentase 100% 86.25% Dari perhitungan di atas, dapat dilihat keakuratan program ini adalah 86.25%. Secara otomatis dapat diperoleh tingkat kegagalan program ini adalah 100% - 86.25% = 13.75%. Dari analisis yang dilakukan, kegagalan pendeteksian terjadi disebabkan oleh dua hal, yaitu data training yang kurang banyak dan kurang beragam dan posisi objek yang hendak dideteksi tidak sesuai dengan yang ada dalam data training. 488 ComTech Vol.3 No. 1 Juni 2012: 482-489 PENUTUP Program pendeteksian bagian tubuh manusia menggunakan metode Viola-Jones mampu menampilkan hasil pendeteksian yang baik, dan dapat digunakan untuk mendeteksi bagian tubuh lain untuk filter pornografi apabila dilakukan training untuk bagian tubuh yang dianggap tabu. Tingkat keakuratan dalam keseluruhan pendeteksian dalam penelitian ini mencapai 86.25%. Beberapa saran yang dapat diajukan untuk pengembangan program aplikasi ini bagi penelitian selanjutnya adalah: (1) tingkat keakuratan pendeteksian dapat lebih ditingkatkan lagi dengan menambah jumlah data training saat membuat berkas haarcascade untuk suatu bagian tubuh; (2) data yang digunakan dalam program ini berupa image sehingga masih dapat dikembangkan dengan menggunakan data real time; (3) program pendeteksian ini dapat dikembangkan untuk mendeteksi bagian tubuh yang lain sehingga ke depannya dapat menjadi filter pornografi yang nyata. DAFTAR PUSTAKA Anna, Lusia Kus. (2011). Kekerasan Seksual Dipengaruhi Film Porno. Diakses Januari 2012, dari http://nasional.kompas.com/read/2011/01/03/13040246 Arihutomo, M. (2010). Rancangan Bangun Sistem Penjejakan Objek Menggunakan Metode Viola Jones Untuk Aplikasi Eyebot. Proyek akhir. Institut Teknologi Sepuluh Nopember, Surabaya. Diakses dari http://www.eepis-its.edu/uploadta/downloadmk.php?id=1151 Barczak, Andre Luis Chautard. (2007). Feature-Based Rapid Object Detection: From Feature Extraction To Parallelisation. Tesis tidak diterbitkan. Massey University, Auckland, New Zealand. Diakses dari http://mro.massey.ac.nz/bitstream/handle/10179/742/02whole.pdf?sequence=1. Dzulkamain, A. D., Dewantara, B. S., & Besari, A. A. (2011). Pengendalian Robot Lengan Beroda dengan Kamera Untuk Pengambilan Obyek. ITS, Surabaya. Freund, Y., & Schapire, R. (2001). The Boosting Approach to Machine Learning An Overview. Diakses dari http://www.cs.princeton.edu/~schapire/uncompress-papers.cgi/msri.ps. Gonzalez , R.C. & Woods , R.E. (2007). Digital Image Processing (3rd Edition). New Jersey: Prentice Hall. http://www.poskotanews.com/2012/01/19/perawan-siswi-sma-rp-700-ribu/ Kuranov, A., Lienhart, Rainer, & Pisarevsky, V. (2002.). An Empirical Analysis of Boosting Algorithms for Rapid Objects with an Extended Set of Haar-like Features. Intel Technical Report MRL-TR-July 02-01. Lienhart, R., Kuranove, A., & Pisarevsky, V. (2002). Empirical analysis of detection cascades of boosted classifiers for rapid object detection. IEEE ICIP 2002, 1, 900-903. Nugroho, S., & Harjoko, A. (2005). Penerapan Jaringan Syaraf Tiruan untuk Mendeteksi Posisi Wajah Manusia pada Citra Digtal. Program Pascasarjana Ilmu Komputer, Universitas Gadjah Mada, Yogyakarta . Pornografi. (2008). Dalam Kamus Besar Bahasa Indonesia. Jakarta: Gramedia Pustaka Utama. Pendeteksian Bagian Tubuh… (Benny Senjaya; dkk) 489 Pos Kota. (2012, Januari). Diakses Januari 2012 dari http://www.poskotanews.com/2012/01/19/korban-trafficking-dari-warga-miskin/; Suprihadi, M. (2008). Terlibat Pornografi Anak, 121 Pria Ditangkap. Diakses dari http://nasional.kompas.com/read/2008/10/01/19491236/terlibat.pornografi.anak.121.pria.ditan gkap Syamsiar, T. F., Eru Puspita, S., & Budi Nur Iman, S. (2009). Identifikasi Scan Iris Mata Menggunakan Metode JST Propagasi Balik Untuk Aplikasi Sistem Pengamanan Brankas. Viola, P., & Jones, M. (2001). Robust real-time object detection. Second International Workshop on Statistical and Computational Theories of Vision – Modeling, Learning, Computing, and Sampling. Vancouver, Canada.