1a Sampul Depan PENDEKATAN CART UNTUK MENDAPATKAN FAKTOR YANG MEMPENGARUHI TERJANGKITNYA PENYAKIT DEMAM TIFOID DI ACEH UTARA Muhammad Sjahid Akbar1, Dina Yuanita2, dan Sri Harini3 1,2Jurusan Statistika ITS 3Jurusan Matematika, UIN Malulana Malik Ibrahim Malang e-mail: sri_harini21@yahoo.com ABSTRACT Typhoid fever is a disease caused by Salmonella typhi bacteria. It is attack the digestive tract. Typhoid fever caused by poor sanitation and personal hygiene is not good. According to the Basic Health Research in 2007 showed that the prevalence of typhoid fever in Indonesia of 1.6%. NAD Province is hight typhoid fever prevalence(2,96 %). Because Having traced the biggest contributor was derived from NAD. Therefore, the research conducted to find factors that influence the outbreak of typhoid fever in NAD. research using the CART Method. The results of the analysis indicate that the main factor causing typhoid fever was drinking water reservoirs. The other factors are waste water reservoirs, the physical quality of drinking water, a habit washing hands with soap before eating, the bowel, the dump, gender, socioeconomic status, habits of washing hands with soap after defecation and health education. Keywords: CART, Typhoid fever PENDAHULUAN Penyakit demam tifoid seringkali menjadi sebab seseorang harus menjalani rawat inap. Demam Tifoid atau Typhoid fever yang biasa juga disebut typhus atau types oleh orang awam, merupakan penyakit yang disebabkan oleh bakteri Salmonella Typhi (S. Typhi). Bakteri S. Typhi menyerang bagian saluran pencernaan. Puslitbang Sistem dan Kebijakan Kesehatan menyatakan demam tifoid disebabkan pencemaran air minum dan sanitasi yang buruk. Demam tifoid adalah penyakit infeksi akut yang menyerang mulai dari usia balita, anak-anak dan dewasa. Data World Health Organization (WHO) tahun 2003 memperkirakan terdapat sekitar 17 juta kasus demam tifoid di seluruh dunia dengan kejadian 600.000 kasus kematian tiap tahun (Anonim, 2008). Angka kejadian demam tifoid diketahui lebih tinggi pada negara berkembang khususnya di daerah tropis. Sehingga tak heran jika demam tifoid banyak ditemukan di Indonesia. Hasil Riset Dasar Kesehatan tahun 2007 menunjukkan bahwa persentase penduduk yang terjangkit demam tifoid dibandingkan dengan seluruh penduduk (prevalensi) di Indonesia sebesar 1,6%. Provinsi NAD merupakan prevalensi tifoid tertinggi yaitu sebesar 2,96%. Setelah ditelusuri ternyata penyumbang terbesar berasal dari kabupaten Aceh Utara. Oleh karena itu penelitian dilakukan di wilayah Aceh Utara untuk mendapatkan faktor-faktor yang menyebabkan terjangkitnya penyakit demam tifoid. Ada tiga penelitian yang digunakan untuk dasar penelitian ini. Tugas akhir Nunik Hidayati mahasiswa S1 jurusan Statistika FMIPA ITS, thesis Rahayu Lubis mahasiswa pasca sarjana jurusan Kesehatan Masyarakat di Universitas Sumatera Utara, dan penelitian Bambang Wasito Tjipto peneliti dari Puslitbang System dan Kebijakan Kesehatan. Hidayati (2001) memodelkan kasus penyakit demam tifoid di Jawa Timur dengan menggunakan regresi poisson. Asumsi yang harus dipenuhi apabila menggunakan metode regresi poisson adalah variabel dependen harus diskrit dan berdistribusi poisson. Ada beberapa faktor resiko yang diduga mempengaruhi terjangkitnya penyakit demam tifoid antara lain kepadatan penduduk, prosentase cakupan penduduk pemakai air bersih, prosentase cakupan penduduk pemakai jamban keluarga, prosentase kondisi rumah yang memenuhi syarat, prosentase cakupan pembuangan sampah sementara yang memenuhi syarat, prosentase cakupan tempat pengolahan makanan yang memenuhi syarat, dan prosentase cakupan penduduk pemakai sarana pembuangan air limbah. Hasil dari penelitian Hidayati variabel yang mempengaruhi terjangkitnya demam tifoid adalah kepadatan penduduk, prosentase cakupan penduduk pemakai air bersih, prosentase cakupan pembuangan sampah sementara yang memenuhi syarat, prosentase cakupan tempat pengolahan makanan yang memenuhi syarat, dan prosentase cakupan penduduk pemakai sarana pembuangan air limbah. Sedangkan penelitian Lubis (2007) mempelajari faktor risiko yang Muhammad Sjahid Akbar, Dina Yuanita, dan Sri Harini 72 Volume 1 No. 2 Mei 2010 berhubungan dengan kejadian penyakit demam tifoid pada penderita yang dirawat di RSUD Dr. Soetomo Surabaya dengan menggunakan regresi logistik. Variabel yang digunakan seperti tingkat pengetahuan, higiene perorangan, kebiasaan makan/minum diluar rumah dan sanitasi lingkungan. Hasilnya faktor yang mempengaruhi kejadian penyakit demam tifoid adalah hygiene perorangan dan kualitas air minum. Selain itu, Tjipto (2009) meneliti faktor-faktor yang berpengaruh terhadap kejadian penyakit demam tifoid pada balita di Indonesia dengan analisis multivariate logistik biner. Tjipto (2009) menyatakan bahwa demam tifoid erat kaitannya dengan higiene perorangan dan sanitasi lingkungan. Hasil penelitian menunjukkan bahwa faktor-faktor yang berpengaruh agar tidak terjadi penyakit infeksi tifoid adalah buang air besar ditempat yang baik (jamban), dan mencuci tangan dengan benar (memakai sabun). Tujuan penelitian ini adalah untuk menda- patkan faktor yang mempengaruhi terjangkitnya demam tifoid menggunakan metode Classification and Regression Trees (CART). Alasan menggunakan metode CART adalah CART merupakan salah satu metode non parametrik dengan hasil analisis berupa topologi pohon atau berupa grafis sehingga hasil analisis lebih mudah diinterpretasi (Lewis dan Roger, 2000). Data yang digunakan merupakan data sekunder yang diambil dari Riskesdas tahun 2007 dan Susenas tahun 2007. Data dihimpun oleh Badan Litbangkes Departemen Kesehatan RI. Total sampel ART di Aceh Utara adalah sebanyak 2.491 ART. Pada penelitian ini data yang digunakan 1816 data ART dengan batasan ART minimal berusia 10 tahun. Variabel respon yang digunakan berskala biner yaitu , 1 untuk anggota rumah tangga terinfeksi demam tifoid dan 2 untuk anggota rumah tangga yang tidak terinfeksi demam tifoid. Sedangkan variabel prediktor yang digunakan dalam penelitian ini adalah. asal daerah (x1), jenis kelamin (x2), status sosial ekonomi (x3), kualitas fisik air minum (x4), tempat penampungan air minum(x5), tempat pembuangan sampah(x6), tempat penampungan air limbah (x7), tempat buang air besar (x8), kebiasaan cuci tangan pakai sabun setelah buang air besar (x9), kebiasaan cuci tangan pakai sabun sebelum makan (x10), dan penyuluhan kesehatan (x11). CLASSIFICATION AND REGRESSION TREES (CART) Classification and Regression Trees (CART) adalah suatu metode teknik pohon keputusan (Breiman et al., 1993). CART menghasilkan suatu pohon klasifikasi jika variabel responnya kategorik, dan menghasilkan pohon regresi jika variabel responnya kontinu. Tujuan utama CART adalah untuk mendapatkan suatu kelompok data yang akurat sebagai penciri dari suatu pengklasifikasian. Klasifikasi pohon dalam CART melibatkan 4 komponen, yaitu variabel respon, variabel prediktor, data learning, dan data testing. Data learning untuk verifikasi model dan data testing untuk validasi model. Sebagai ilustrasi struktur pohon klasifikasi dapat dilihat pada Gambar 1. Simpul utama dinotasikan dengan t1 sedangkan internal nodes (simpul dalam) dinotasikan dengan t2, t3, t4, t7, t9 dan t13. Simpul akhir atau simpul terminal adalah t5, t6, t8, t10, t11, t12, t14 dan t15 . Penghitungan depth (kedalaman) pohon dimulai dari simpul utama t1 yang berada pada kedalaman 1, sedangkan t2 dan t3 berada pada kedalaman 2 begitu seterusnya sampai pada t14 dan t15 yang berada pada kedalaman 6. Pembentukan pohon klasifikasi terdiri atas 3 tahap yang memerlukan learning sample L. Tahap pertama adalah pemilihan pemilah. Menurut Breiman et al. (1993) setiap pemilahan hanya bergantung pada nilai yang berasal dari satu variabel independen. Rumus kemungkinan pemilah disajikan sebagai berikut. Variabel independen kontinu = 1−n pemilahan Variabel independen kategori nominal = 12 1 −−L pemilahan (1) Variabel independen kategori ordinal = L - 1 pemilahan Setelah semua kemungkinan pemilah didapatkan, masing-masing pemilah dicari nilai goodness of split. Goodness of split merupakan suatu evaluasi pemilahan oleh pemilah s pada simpul t. Goodness of split ���, �� didefinisikan sebagai penurunan keheterogenan. Sehingga semakin besar nilai goodness of split semakin homogen simpul anak yang dihasilkan. ���, �� � ∆ ��, �� � ��� �� ���� � �� � (2) Pengembangan pohon dilakukan dengan mencari semua kemungkinan pemilah pada simpul �� sehingga ditemukan pemilah s* yang memberikan nilai penurunan keheterogenan tertinggi yaitu, ∆ ���, ��� � ������ ��, ��� (3) Dengan ��� adalah fungsi keheterogenan indeks Gini, ���, �� adalah kriteria goodness of split, �� ���� adalah proporsi pengamatan dari simpul t menuju simpul kiri, dan � �� � adalah proporsi pengamatan dari simpul t menuju simpul kanan. Pendekatan CART untuk Mendapatkan Faktor yang Mempengaruhi… Jurnal CAUCHY – ISSN: 2086-0382 73 Indeks Gini sebagai metode pemilahan yang digunakan mempunyai fungsi sebagai berikut. ��� � ∑ �� |����� ���|�� (4) dengan, �� |�� adalah proporsi kelas i pada simpul t, dan ���|�� adalah proporsi kelas j pada simpul t. Gambar 1 Struktur Klasifikasi Pohon Tahap kedua adalah penentuan simpul terminal (penghentian pembentukan pohon). Simpul t dapat dijadikan simpul terminal jika (1) Tidak terdapat penurunan keheterogenan yang berarti. (2) Hanya terdapat satu pengamatan (n=1) pada tiap simpul anak. (3) Adanya batasan minimum n/pengamatan pada simpul anak. dan (4) Adanya batasan jumlah level atau tingkat kedalaman pohon maksimal (Lewis, 2000). Tahap ketiga adalah penandaan label tiap simpul terminal berdasarkan aturan jumlah anggota kelas terbanyak, yaitu: ����|�� � ���� ���|�� � ���� � �!� ��!� (5) dengan ���|�� adalah proporsi kelas j pada simpul t, "���� adalah jumlah pengamatan kelas j pada simpul t, dan "��� adalah jumlah pengamatan pada simpul t. Label kelas simpul terminal t adalah �� yang memberi nilai dugaan kesalahan pengklasifikasian simpul t terbesar. Setelah terbentuk pohon maksimal tahap selanjutnya adalah pemangkasan pohon untuk mencegah terbentuknya pohon klasifikasi yang berukuran sangat besar dan kompleks. Sehingga diperoleh ukuran pohon yang layak berdasarkan cost complexity prunning. Besarnya resubtitution estimate pohon T pada parameter kompleksitas # yaitu : $%�&� � $�&� ' %|&(| (6) dengan Rα(T) adalah resubtitution suatu pohon T pada kompleksitas α, R(T) adalah resubstitution estimate, α adalah Parameter cost - complexity bagi penambahan satu simpul akhir pada pohon T, dan |&(| adalah banyaknya simpul terminal pohon T. Cost complexity prunning menentukan pohon bagian T(α) yang meminimumkan Rα(T) pada seluruh pohon bagian untuk setiap nilai α. Nilai parameter kompleksitas α akan secara perlahan meningkat selama proses pemangkasan. Selanjutnya pencarian pohon bagian T(α) < Tmax yang dapat meminimumkan Rα(T) yaitu : $% �&�%�� � )*+&,-./0 $%�&� (7) Setelah dilakukan pemangkasan diperoleh pohon klasifikasi optimal yang berukuran sederhana namun memberikan nilai pengganti yang cukup kecil. Penduga pengganti yang sering digunakan adalah penduga sampel uji (test sample estimate) dan validasi silang lipat V (Cross Validation V-Fold Estimate). Menurut Breiman et al. (1993) jika jumlah sampel yang digunakan lebih kecil dari 3000 pengamatan penduga pengganti yang digunakan adalah Cross Validation V-Fold Estimate. Penduga validasi silang lipat V sering digunakan apabila amatan yang ada tidak cukup besar. Amatan dalam L dibagi secara acak menjadi V bagian yang saling lepas dengan ukuran kurang lebih sama besar untuk setiap kelasnya. Pohon T(V) dibentuk dari L-LV dengan v = 1, 2, ..., V. Misalkan d(v)(x) adalah hasil pengklasifikasian. Penduga sampel uji untuk R(T1(V)) yaitu 12�342 �5�6 � � 78 ∑ 93:�5���;� < �;6�0=,�=�>�? (8) dengan "@ � "/B adalah jumlah amatan dalam Lv. Kemudian dilakukan prosedur yang sama Kedalaman 1 Kedalaman 6 Kedalaman 2 2 Pemilah 6 t15 t14 1 3 4 Pemilah 7 t13 t12 2 3 t8 t9 Pemilah 4 t7 t4 t10 t11 3 4 Pemilah 5 Pemilah 2 Pemilah 3 Pemilah 1 t1 t3 t2 t5 t6 Muhammad Sjahid Akbar, Dina Yuanita, dan Sri Harini 74 Volume 1 No. 2 Mei 2010 menggunakan seluruh L, maka penduga validasi silang lipat V untuk 42 �5� adalah : 1C8�42� � � 5 ∑ 12�34�8�658�� (9) Pohon klasifikasi optimum dipilih T* dengan 1C8�4�� � � D2 1 C8�42� (10) APLIKASI DAN PEMBAHASAN Penelitian menggunakan variabel respon kategorik berskala biner. Bernilai 1 untuk anggota rumah tangga terinfeksi demam tifoid dan 0 untuk anggota rumah tangga yang tidak terinfeksi demam tifoid, sehingga didapatkan pohon klasifikasi untuk menjelaskan keterkaitan 11 variabel prediktor yang diduga mempengaruhi terjangkitnya penyakit demam tifoid. Pada klasifikasi pohon data sampel anggota rumah tangga terjangkit dan tidak terjangkit demam tifoid di Aceh Utara dibagi menjadi dua kelompok yaitu data learning dan data testing. Penelitian ini menggunakan perbandingan data learning 75% (1.362 data) dan testing 25% (454 data). Tahap pertama pembentukan pohon klasifikasi maksimal adalah pemilah-pemilah. Perhitungan pemilah pada setiap variabel prediktor menggunakan persamaan (1). Hasil yang diperoleh adalah variabel asal daerah, variabel jenis kelamin, variabel status sosial ekonomi, variabel kualitas air minum, variabel tempat buang air besar, variabel kebiasaan cuci tangan pakai sabun setelah buang air, variabel kebiasaan cuci tangan pakai sabun sebelum makan, dan variabel keikutsertaan penyuluhan dengan 1 kemungkinan pemilahan. Variabel kondisi penampungan air minum dan variabel kondisi tempat pembuangan sampah dengan 3 kemungkinan pemilahan. Dan variabel kondisi penampungan air limbah dengan 15 kemungkinan pemilahan. Penelitian ini menggunakan metode pemilahan Indeks Gini sesuai persamaan (4). Pemilah terbaik adalah pemilah yang menghasilkan nilai penurunan keheterogenan tertinggi (kriteria pemilahan goodness of split pada persamaan (3)). Pemilah terbaik pada simpul 1 (pemilah utama) pada penelitian ini adalah variabel tempat penampungan air (x5). Variabel tempat penampungan air terpilih sebagai pemilah utama karena menghasilkan nilai penurunan keheterogenan tertinggi pada simpul 1 (Gambar 2). Informasi hasil perhitungan penurunan keheterogenan pada setiap pemilah di simpul 1 disajikan pada Table 1. Tahap kedua yaitu penentuan simpul terminal. Simpul t dikatakan sebagai simpul terminal jika tidak terdapat penurunan keheterogenan yang berarti sehingga tidak akan dipilah lagi. Simpul terminal adalah simpul yang berwarna merah, biru dan putih. Pohon klasifikasi maksimal (maximal tree) dari data anggota rumah tangga yang terjangkit maupun tidak terjangkit demam tifoid ditunjukkan pada Gambar 2. Tabel 1. Nilai Penurunan Keheterogenan Variabel Pemilah pada Simpul 1 Pemilah Split ∆ ��, �� X1 1 0,000418599 X2 1 0,000126786 X3 1 0,000714858 X4 1 0,000867109 X5 1,2 0,001200313 X5 1,3 2,08527E-05 X5 2,3 0,000896645 X6 1,2 9,47417E-05 . . . X7 2,3 0,000400087 . . . . . . X8 1 0,000343279 X9 1 0,000118855 X10 1 0,001019946 X11 1 0,00041325 Pohon klasifikasi maksimal terdiri dari 89 simpul terminal dengan 15 kedalaman. Kedalaman adalah jumlah level atau tingkatan dalam pohon maksimal dimana tiap level terdiri atas beberapa simpul. Kedalaman dihitung dari simpul utama sampai simpul terminal (simpul akhir). Pohon klasifikasi akan semakin besar jika kedalaman pohon juga semakin besar. Tahap ketiga adalah penandaan label kelas. Pemberian label kelas untuk setiap simpul terminal berdasarkan rumus pada persamaan (5). Perbedaan warna pada tiap simpul terminal menunjukkan adanya perbedaan label kelas. Simpul terminal dengan warna biru menunjukkan pada simpul tersebut ditandai dengan label kelas 1 yang berarti anggota rumah tangga terjangkit demam tifoid, dengan persentase jumlah pengamatan yang terjangkit demam tifoid mendekati 100%. Warna biru akan berubah secara perlahan menjadi warna putih jika persentase jumlah pengamatan yang terjangkit demam tifoid pada simpul terminal tersebut berkisar 50%. Sedangkan untuk simpul terminal berwarna merah menunjukkan label kelas 2 yang berarti anggota rumah tangga tidak Pendekatan CART untuk Mendapatkan Faktor yang Mempengaruhi… Jurnal CAUCHY – ISSN: 2086-0382 75 terjangkit demam tifoid, dimana persentase jumlah pengamatan kelas yang tidak terjangkit demam tifoid pada simpul tersebut mendekati 100%. Gambar 2. Pohon Klasifikasi Maksimal Tabel 2. Kesalahan Klasifikasi Data Learning pada Pohon Maksimal Kelas Aktual Kelas Prediksi Total Aktual 1 2 1 68 0 68 2 167 1.127 1.294 Total Prediksi 235 1.127 1.362 Benar 1 0,871 Total Benar 0,877 Tabel 2 menunjukkan hasil klasifikasi pohon maksimal untuk data learning. Kesalahan klasifikasi terjadi bila data pada kelas aktual 1 (terjangkit demam tifoid) masuk ke dalam kelas prediksi 2 (tidak terjangkit demam tifoid) begitupun sebaliknya. Tidak terjadi kesalahan pengklasifikasian pada kelas 1 yang merupakan kelas bagi anggota rumah tangga yang terjangkit demam tifoid. Pada kelas 2 (kelas bagi anggota rumah tangga yang tidak terjangkit demam tifoid) terjadi kesalahan pengklasifikasian sebanyak 167 pengamatan. Ketepatan klasifikasi untuk data learning pada pohon klasifikasi maksimal adalah sebesar 68 ' 1.127 1.362 � 100% � 87,7% Selanjutnya dilakukan pemangkasan pohon klasifikasi maksimal. Breiman, et al (1993) menyatakan pemangkasan pohon klasifikasi dilakukan apabila pohon klasifikasi yang terbentuk berukuran sangat besar dan kompleks dalam penggambaran struktur data. Sehingga pada akhirnya diperoleh ukuran pohon yang layak dan berdasarkan cost complexity minimum. Gambar 3 memberikan informasi bahwa nilai relative cost pohon klasifikasi maksimal lebih besar dibandingkan relative cost pohon klasifikasi optimal. Oleh karena itu perlu dilakukan pemangkasan pohon maksimal agar didapatkan nilai relative cost yang paling kecil. Garis hijau menunjukkan nilai relative cost minimum pada pohon optimal sebesar 0,599 (Persamaan 10). Gambar 3. Plot Relative Cost Setelah dilakukan pemangkasan terhadap pohon klasifikasi maksimal maka dihasilkan pohon klasifikasi optimal yang memiliki relative costi terkecil dengan 9 kedalaman dan 16 simpul terminal yang disajikan dalam Gambar 4 dan Spilters pada pohon klasifikasi optimal disajikan pada Gambar 5. Gambar 4. Pohon Klasifikasi Optimal Gambar 5. Spilters Pohon Klasifikasi Optimal Variabel prediktor yang menjadi pemilah utama pada pohon klasifikasi optimal adalah Muhammad Sjahid Akbar, Dina Yuanita, dan Sri Harini 76 Volume 1 No. 2 Mei 2010 tempat penampungan air minum (x5) dengan skor variabel penting 100. Dengan kata lain penampungan air minum merupakan faktor utama yang mempengaruhi anggota rumah tangga terjangkit atau tidak terjangkit demam tifoid. Keterangan dari dr. Satinta Febrianti yang berdinas di Rumah Sakit Yasmin Banyuwangi, penyebab seseorang terjangkit demam tifoid adalah bakteri salmonella thypi.Penularannya melalui makanan dan minuman yang telah tercemari oleh bakteri salmonella thypi. Orang yang kelelahan lebih mudah terjangkit penyakit demam tifoid karena daya tahan tubuhnya menurun. Apabila seseorang dengan daya tahan tubuh menurun mengkonsumsi makanan atau minuman yang tercemar oleh bakteri s.thypi maka orang tersebut mudah terjangkit penyakit demam tifoid. Hal ini sesuai dengan hasil penelitian ini yang mendghasilkan tempat penampungan air minum sebagai faktor utama yang mempengaruhi terjangkitnya demam tifoid. Karena dengan tidak mempunyai tempat penampungn air minum atau tempat penampungan air minum terbuka maka mudah sekali bakteri salmonella thypi mencemari air yang merupakan bahan pokok untuk keperluan sehari-hari. Sehingga orang yang tidak mempunyai tempat penampungan air minum atau tempat penampungan air minumnya terbuka lebih rentan terjangkit demam tifoid. Selain tempat penampungan air minum variabel yang juga berkontribusi dalam pembentukkan pohon optimal adalah variabel tempat penampungan air limbah (x7) dengan skor 70.61, variabel kualitas fisik air minum (x4) dengan skor 55.23, variabel kebiasaan cuci tangan pakai sabun sebelum makan (x10) dengan skor 48.12, dan variabel tempat buang air besar (x8) dengan skor 40.60. Variabel tempat pembuangan sampah(x6), variabel jenis kelamin (x2), dan variabel status sosial ekonomi (x3) juga berkontribusi dalam pembentukan pohon optimal dengan skor variabel penting masing- masing adalah 37.50, 33.80, 22.09. Sedangkan variabel kebiasaan cuci tangan pakai sabun setelah buang air besar (x9) dan penyuluhan kesehatan (x11) memiliki skor variabel penting dibawah 20 . Simpul utama (simpul 1) dipilah oleh variabel penampungan air minum dengan mengelom-pokkan 931 anggota rumah tangga yang tidak memiliki tempat penampungan air minum dan anggota rumah tangga yang penampungan air minumnya terbuka pada simpul kiri menjadi simpul 2. Sisannya yaitu 431 anggota rumah tangga yang tempat penampungan air minumnya terbuka dikelompokkan pada simpul kanan menjadi simpul terminal 16. Simpul 2 terdapat 62 anggota rumah tangga yang terjangkit demam tifoid (6,7%) dan 869 anggota rumah tangga yang tidak terjangkit demam tifoid (93,3%). Sedangkan simpul terminal 16 terdapat 6 anggota rumah tangga yang terjangkit demam tifoid (1,4%) dan 425 anggota rumah tangga yang tidak terjangkit demam tifoid (98,6%). Karena proporsi terbesar pada simpul terminal 16 adalah tidak terjangkit demam tifoid, maka pada simpul terminal 6 diberi label kelas tidak terjangkit demam tifoid (Persamaan 5). Terjadi kesalahan pengklasifikasian pada simpul terminal 16 dengan label kelas tidak terjangkit demam tifoid, karena terdapat 6 anggota rumah tangga yang dinyatakan terjangkit demam tifoid. Proses pemilahan akan terjadi lagi pada simpul 2 namun pada simpul terminal 16 tidak akan terjadi pemilahan. Simpul 2 dipilah variabel kebiasaan cuci tangan pakai sabun sebelum makan. Sebanyak 663 anggota rumah tangga yang mencuci tangan pakai sabun sebelum makan dipilah pada simpul kiri menjadi simpul 3 dan 268 anggota rumah tangga yang tidak mencuci tangan pakai sabun sebelum makan dipilah pada simpul kanan menjadi simpul 13. Pada simpul 3 terdapat 56 anggota rumah tangga yang dinyatakan terjangkit demam tifoid (8,4%) dan 607 anggota rumah tangga yang tidak terjangkit demam tifoid (91,6%). Sedangkan pada simpul 13 terdapat 6 anggota rumah tangga yang terjangkit demam tifoid (2,2%) dan 262 anggota rumah tangga yang tidak terjangkit demam tifoid (97,8). Pemilahan akan dilakukan terus-menerus sampai simpul terminal. Tabel 3 menunjukkan hasil klasifikasi pohon maksimal untuk data learning. Kesalahan klasifikasi terjadi bila data pada kelas aktual 1 (terjangkit demam tifoid) masuk ke dalam kelas prediksi 2 (tidak terjangkit demam tifoid) begitupun sebaliknya. Jumlah kesalahan pengklasifikasian untuk kelas 1 (terjangkit demam tifoid) adalah sebanyak 17 dari 68 jumlah amatan. Jumlah kesalahan pengklasifikasian untuk kelas 2 (tidak terjangkit demam tifoid) adalah sebanyak 199 dari 1.294 jumlah amatan. Dengan demikian diperoleh ketepatan pengklasifikasian sebesar 51 ' 1.095 1.362 � 100% � 84,1% Tabel 3. Ketepatan pohon klasifikasi optimal dari data learning Kelas Aktual Prediksi Kelas Total Aktual 1 2 1 51 17 68 2 199 1.095 1.294 Total Prediksi 250 1.112 1.362 Benar 0,750 0,846 Total Benar 0,841 Jurnal CAUCHY Selanjutnya dilakukan uji validasi. dilakukan validasi adalah untuk mengetahui layak atau tidak model pohon klasifikasi dalam pengklasifikasian data baru. Caranya yaitu data testing klasifikasi yang telah terbentuk sebelumnya dari data learning sebesar 25% dari total data keseluruhan yaitu 454 data Tabel 4 menunjukkan bahwa data sebanyak 454 pengamatan menghasilkan ketepatan pengklasifikasian sebesar Jumlah kesalahan pengklasifikasian untuk kelas 1 (terjangkit demam tifoid) adalah sebanyak 18 dari 37 jumlah amatan. Sedangkan jumlah kesalahan pengklasifikasian untuk kelas 2 (tidak terjangkit demam tifoid) adalah sebanyak 47 dari 417 jumlah amatan. Karen pada data testing sudah tinggi yaitu 85,7% maka model pohon klasifikasi optimal yang dihasilkan sudah baik. Tabel 4. Kelas Aktual 1 2 Total Prediksi Benar Total Benar PENUTUP Metode klasifikasi optimal dengan ketepatan klasifikasi data learning ketepatan klasifikasi data 85,7%. Variabel yang berpengaruh terhadap terjangkitnya penyakit demam tifoid di Aceh Utara pada pohon optimal adalah variabel tempat penampungan air minum sebagai faktor utama dengan skor tertinggi sebesar 100, tempat penampungan air limba kualitas fisik air minum dengan skor 55.23, kebiasaan cuci tangan pakai sabun sebelum makan dengan skor 48.12, variabel tempat buang air besar dengan skor 40.60, tempat pembuangan sampah dengan skor 37.50, jenis kelamin dengan skor 33.80 dan status sosial ekonomi dengan skor Jurnal CAUCHY – ISSN: 2086 Selanjutnya dilakukan uji validasi. dilakukan validasi adalah untuk mengetahui layak atau tidak model pohon klasifikasi dalam pengklasifikasian data baru. Caranya yaitu data dimasukkan kedalam model pohon klasifikasi yang telah terbentuk sebelumnya dari learning. Data sebesar 25% dari total data keseluruhan yaitu 454 data. Tabel 4 menunjukkan bahwa data sebanyak 454 pengamatan menghasilkan ketepatan pengklasifikasian sebesar Jumlah kesalahan pengklasifikasian untuk kelas 1 (terjangkit demam tifoid) adalah sebanyak 18 dari 37 jumlah amatan. Sedangkan jumlah kesalahan pengklasifikasian untuk kelas 2 (tidak terjangkit demam tifoid) adalah sebanyak 47 dari 417 jumlah amatan. Karen pada data testing sudah tinggi yaitu 85,7% maka model pohon klasifikasi optimal yang dihasilkan sudah baik. Tabel 4. Ketepatan pohon klasifikasi optimal dari data Kelas Aktual Prediksi Kelas 1 19 2 47 Total Prediksi 66 Benar 0,514 Total Benar 0,857 PENUTUP Metode CART klasifikasi optimal dengan ketepatan klasifikasi learning sebesar 84,1%, sedangkan ketepatan klasifikasi data 85,7%. Variabel yang berpengaruh terhadap terjangkitnya penyakit demam tifoid di Aceh Utara pada pohon optimal adalah variabel tempat penampungan air minum sebagai faktor utama dengan skor tertinggi sebesar 100, tempat penampungan air limba kualitas fisik air minum dengan skor 55.23, kebiasaan cuci tangan pakai sabun sebelum makan dengan skor 48.12, variabel tempat buang air besar dengan skor 40.60, tempat pembuangan sampah dengan skor 37.50, jenis kelamin dengan .80 dan status sosial ekonomi dengan skor ISSN: 2086-0382 Selanjutnya dilakukan uji validasi. dilakukan validasi adalah untuk mengetahui layak atau tidak model pohon klasifikasi dalam pengklasifikasian data baru. Caranya yaitu data dimasukkan kedalam model pohon klasifikasi yang telah terbentuk sebelumnya dari Data testing yang digunakan sebesar 25% dari total data keseluruhan yaitu Tabel 4 menunjukkan bahwa data sebanyak 454 pengamatan menghasilkan ketepatan pengklasifikasian sebesar 85,7%. Jumlah kesalahan pengklasifikasian untuk kelas 1 (terjangkit demam tifoid) adalah sebanyak 18 dari 37 jumlah amatan. Sedangkan jumlah kesalahan pengklasifikasian untuk kelas 2 (tidak terjangkit demam tifoid) adalah sebanyak 47 dari 417 jumlah amatan. Karena ketepatan klasifikasi pada data testing sudah tinggi yaitu 85,7% maka model pohon klasifikasi optimal yang dihasilkan Ketepatan pohon klasifikasi optimal dari data testing Prediksi Kelas 1 2 19 18 47 370 66 388 0,514 0,887 0,857 CART menghasilkan pohon klasifikasi optimal dengan ketepatan klasifikasi sebesar 84,1%, sedangkan ketepatan klasifikasi data testing 85,7%. Variabel yang berpengaruh terhadap terjangkitnya penyakit demam tifoid di Aceh Utara pada pohon optimal adalah variabel tempat penampungan air minum sebagai faktor utama dengan skor tertinggi sebesar 100, tempat penampungan air limbah dengan skor 70.61, kualitas fisik air minum dengan skor 55.23, kebiasaan cuci tangan pakai sabun sebelum makan dengan skor 48.12, variabel tempat buang air besar dengan skor 40.60, tempat pembuangan sampah dengan skor 37.50, jenis kelamin dengan .80 dan status sosial ekonomi dengan skor Pendekatan CART untuk Mendapatkan Faktor yang Mempengaruhi… 0382 Selanjutnya dilakukan uji validasi. Tujuan dilakukan validasi adalah untuk mengetahui layak atau tidak model pohon klasifikasi dalam pengklasifikasian data baru. Caranya yaitu data dimasukkan kedalam model pohon klasifikasi yang telah terbentuk sebelumnya dari yang digunakan sebesar 25% dari total data keseluruhan yaitu Tabel 4 menunjukkan bahwa data testing sebanyak 454 pengamatan menghasilkan ketepatan pengklasifikasian sebesar Jumlah kesalahan pengklasifikasian untuk kelas 1 (terjangkit demam tifoid) adalah sebanyak 18 dari 37 jumlah amatan. Sedangkan jumlah kesalahan pengklasifikasian untuk kelas 2 (tidak terjangkit demam tifoid) adalah sebanyak 47 dari a ketepatan klasifikasi pada data testing sudah tinggi yaitu 85,7% maka model pohon klasifikasi optimal yang dihasilkan Ketepatan pohon klasifikasi optimal Total Aktual 37 417 454 0,887 menghasilkan pohon klasifikasi optimal dengan ketepatan klasifikasi sebesar 84,1%, sedangkan adalah sebesar 85,7%. Variabel yang berpengaruh terhadap terjangkitnya penyakit demam tifoid di Aceh Utara pada pohon optimal adalah variabel tempat penampungan air minum sebagai faktor utama dengan skor tertinggi sebesar 100, tempat h dengan skor 70.61, kualitas fisik air minum dengan skor 55.23, kebiasaan cuci tangan pakai sabun sebelum makan dengan skor 48.12, variabel tempat buang air besar dengan skor 40.60, tempat pembuangan sampah dengan skor 37.50, jenis kelamin dengan .80 dan status sosial ekonomi dengan skor Pendekatan CART untuk Mendapatkan Faktor yang Mempengaruhi… Tujuan dilakukan validasi adalah untuk mengetahui layak atau tidak model pohon klasifikasi dalam pengklasifikasian data baru. Caranya yaitu data dimasukkan kedalam model pohon klasifikasi yang telah terbentuk sebelumnya dari yang digunakan sebesar 25% dari total data keseluruhan yaitu testing sebanyak 454 pengamatan menghasilkan Jumlah kesalahan pengklasifikasian untuk kelas 1 (terjangkit demam tifoid) adalah sebanyak 18 dari 37 jumlah amatan. Sedangkan jumlah kesalahan pengklasifikasian untuk kelas 2 (tidak terjangkit demam tifoid) adalah sebanyak 47 dari a ketepatan klasifikasi pada data testing sudah tinggi yaitu 85,7% maka model pohon klasifikasi optimal yang dihasilkan menghasilkan pohon klasifikasi optimal dengan ketepatan klasifikasi sebesar 84,1%, sedangkan adalah sebesar 85,7%. Variabel yang berpengaruh terhadap terjangkitnya penyakit demam tifoid di Aceh Utara pada pohon optimal adalah variabel tempat penampungan air minum sebagai faktor utama dengan skor tertinggi sebesar 100, tempat h dengan skor 70.61, kualitas fisik air minum dengan skor 55.23, kebiasaan cuci tangan pakai sabun sebelum makan dengan skor 48.12, variabel tempat buang air besar dengan skor 40.60, tempat pembuangan sampah dengan skor 37.50, jenis kelamin dengan .80 dan status sosial ekonomi dengan skor 22.09. Sedangkan variabel kebiasaan cuci tangan pakai sabun setelah buang air besar dan penyuluhan kesehatan dengan skor variabel penting dibawah 20. DAFTAR PUSTAKA [1] [2] [3] [4] [5] [6] [7] [8] [9] [10 Pendekatan CART untuk Mendapatkan Faktor yang Mempengaruhi… 22.09. Sedangkan variabel kebiasaan cuci tangan pakai sabun setelah buang air besar dan penyuluhan kesehatan dengan skor variabel penting dibawah 20. DAFTAR PUSTAKA ] Anonim. 2007. . ] Breiman L, Friedman J.H, Olshen R.A, dan Stone C.J. 1993. Trees. Chapman And Hall. ] Departemen Kesehatan RI. 2008. Kesehatan Dasar (Laporan Nasional 2007) Jakarta. ] Hidayati, N Terhadap Faktor Mempengaruhi Penyakit Demam Typhoid di Provinsi Jawa Timur”. Jurusan Statistika FMIPA ITS ] Jevuska. 2008. Fever), . 10] Steinberg D. dan Phillip C. 2005. Classification and Regression Trees Salford System, San Diego. Pendekatan CART untuk Mendapatkan Faktor yang Mempengaruhi… 22.09. Sedangkan variabel kebiasaan cuci tangan pakai sabun setelah buang air besar dan penyuluhan kesehatan dengan skor variabel penting dibawah 20. DAFTAR PUSTAKA Anonim. 2007. Demam Tifoid http://ummusalma.wordpress.com/2007/ 01/22/helloworld/, tanggal akses: 27 September 2009>. Breiman L, Friedman J.H, Olshen R.A, dan Stone C.J. 1993. Classification And Regression . Chapman And Hall. Departemen Kesehatan RI. 2008. Kesehatan Dasar (Laporan Nasional 2007) N. 2001. “Analisis Regresi Poisson Terhadap Faktor Mempengaruhi Penyakit Demam Typhoid di Provinsi Jawa Timur”. Jurusan Statistika FMIPA ITS Jevuska. 2008. Demam Tifoid (Typhoid http://www.jevuska.com/2008/05/ tifoid-typhoid 26 September 2009>. Kompas. 2005. Masyarakat Diminta Waspadai Penyakit Tipus http://www.kompas.com/ kompas tanggal akses: 28 Agustus2009 Lewis dan Roger J. 2000. to Classification And Regression Trees (CART) Analysis. Presented at the 2000. . (2007). “Faktor Resiko Kejadian Penyakit Demam Tifoid Penderita Yang Dirawat Di RSUD DR. Thesis, Mahasiswa Jurusan Ilmu Kesehatan Masyarakat Universitas Sumatera Utara. Sumatera Utara. Salma, U. 2007. Demam Tifoid . Steinberg D. dan Phillip C. 2005. fication and Regression Trees Salford System, San Diego. Pendekatan CART untuk Mendapatkan Faktor yang Mempengaruhi… 22.09. Sedangkan variabel kebiasaan cuci tangan pakai sabun setelah buang air besar dan penyuluhan kesehatan dengan skor variabel Demam Tifoid, http://ummusalma.wordpress.com/2007/ tanggal akses: 27 Breiman L, Friedman J.H, Olshen R.A, dan Classification And Regression . Chapman And Hall. New York. Departemen Kesehatan RI. 2008. Kesehatan Dasar (Laporan Nasional 2007) “Analisis Regresi Poisson Terhadap Faktor-Faktor yang Mempengaruhi Penyakit Demam Typhoid di Provinsi Jawa Timur”. Skripsi, Mahasiswa Jurusan Statistika FMIPA ITS. Surabaya. Demam Tifoid (Typhoid http://www.jevuska.com/2008/05/ typhoid-fever, tanggal akses: Masyarakat Diminta Waspadai Penyakit Tipus http://www.kompas.com/ kompas tanggal akses: 28 Agustus2009>. Lewis dan Roger J. 2000. An Introduction to Classification And Regression Trees . Presented at the 2000. Faktor Resiko Kejadian Penyakit Demam Tifoid Penderita Yang Dirawat Di RSUD DR. Soetomo Surabaya Thesis, Mahasiswa Jurusan Ilmu Kesehatan Masyarakat Universitas . Sumatera Utara. Demam Tifoid, . Steinberg D. dan Phillip C. 2005. fication and Regression Trees Salford System, San Diego. Pendekatan CART untuk Mendapatkan Faktor yang Mempengaruhi… 77 22.09. Sedangkan variabel kebiasaan cuci tangan pakai sabun setelah buang air besar dan penyuluhan kesehatan dengan skor variabel http://ummusalma.wordpress.com/2007/ tanggal akses: 27 Breiman L, Friedman J.H, Olshen R.A, dan Classification And Regression New York. Departemen Kesehatan RI. 2008. Riset Kesehatan Dasar (Laporan Nasional 2007). “Analisis Regresi Poisson Faktor yang Mempengaruhi Penyakit Demam Typhoid di Skripsi, Mahasiswa . Surabaya. Demam Tifoid (Typhoid http://www.jevuska.com/2008/05/10- fever, tanggal akses: Masyarakat Diminta Waspadai Penyakit Tipus, http://www.kompas.com/ kompas-cetak/, An Introduction to Classification And Regression Trees . Presented at the 2000. Faktor Resiko Kejadian Penyakit Demam Tifoid Penderita Yang Soetomo Surabaya”. Thesis, Mahasiswa Jurusan Ilmu Kesehatan Masyarakat Universitas press.com Steinberg D. dan Phillip C. 2005. CART– fication and Regression Trees. CA: