Abstract
Ontology-Based Automatic Classification for News Articles in Indonesian Language. Searching specific information will be difficult if relying only on query. Choosing less specific queries will result in a lot of irrelevant information fetched by the system. One of the most successful ways to overcome this problem is to perform document classification based on the topic. There are many methods that can be used to conduct such a classification, such as using statistical and machine learning approaches. However, those document classification methods require training the data or learning the documents. In this study, the authors attempted to classify documents using a method that doesn’t require learning the documents. This classification method uses ontology to classify documents. Document classification using ontology is done by comparing the value of similarity among documents and existing node in the ontology. A document is classified into a category or a node if it has the highest similarity value in one of the nodes in the ontology. The results show that ontology can be used to perform document classification. The recall value is 97.03%, the precision is 91.63%, and the f-measure is 94.02%.
Bahasa Abstract
Pencarian informasi tertentu akan sulit dilakukan bila mengandalkan query saja. Pemilihan query yang kurang spesifik akan berakibat banyaknya informasi yang tidak relevan ikut terambil oleh sistem. Salah satu cara yang paling berhasil untuk mengatasi permasalahan ini adalah dengan melakukan klasifikasi dokumen berdasarkan topiknya. Ada banyak metode digunakan untuk melakukan klasifikasi dokumen seperti menggunakan pendekatan statistik dan machine learning. Namun, metode klasifikasi dokumen tersebut membutuhkan training data atau dokumen pembelajaran. Pada penelitian ini penulis berusaha untuk melakukan klasifikasi dokumen menggunakan sebuah metode yang tidak memerlukan dokumen pembelajaran. Metode klasifikasi ini menggunakan ontologi untuk melakukan klasifikasi dokumen. Klasifikasi dokumen dengan menggunakan ontologi dilakukan dengan membandingkan nilai kemiripan di antara dokumen dan sebuah node yang ada di ontologi. Sebuah dokumen diklasifikasikan dalam sebuah kategori atau node jika memiliki nilai kemiripan paling tinggi di salah satu node di ontologi. Hasil penelitian menunjukkan bahwa ontologi dapat digunakan untuk melakukan klasifikasi dokumen. Nilai recall adalah 97,03%, precision 91,63%, dan f-measure 94,02%.
References
- D. Anggraeni, Skripsi Sarjana, Fakultas Ilmu Komputer, Universitas Indonesia, Indonesia, 2009.
- S. Susanto, Skripsi Sarjana, Fakultas Ilmu Komputer, Universitas Indonesia, Indonesia, 2006
- S.Y. Lim, M.H. Song, S.J. Lee, Ontology-based Automatic Classification of Web Documents, ICIC 2006, LNAI 4114, Springer-Verlag, Berlin, 2006, p.690.
- L. Tenenboim, B. Shapira, P. Shoval, Proceedings of the Intelligent Information and Engineering Systems Conference, Varna, Bulgaria, 2008.
- Y. Wibisono, Seminar Nasional Matematika, Universitas Pendidikan Indonesia, Bandung, Jawa Barat 2005.
- N.F. Noy, D.L. McGuinness, Ontology Development 101: A Guide to Creating Your First Ontology, Knowledge Systems Laboratory (KSL) of Department of Computer Science Stanford, USA: Technical Report, KSL-01-05, 2001.
- R. Baeza-Yates, B. Ribeiro-Neto, Modern Information Retrieval,Addison Wesley, New York, 1999, p.544.
- L.M. Khodra, Y. Wibisono, Konferensi Nasional Sistem Informasi, Universitas Pasundan Bandung, Indonesia, Februari 2006.
- G. Salton, M.J. McGill, Introduction to Modern Information Retrieval, McGraw Hill, New York, 1986, p.400.
- D.K. Kang, A. Silvescu, V. Honavar, Proceedings of the Tenth Pacific-Asia Conference on Knowledge Discovery and Data Mining (PAKDD 2006), Lecture Notes in Computer Science, Berlin: Springer-Verlag, 2006, p.45.
- T. Mitchell, Generative and Discriminative Classifiers: Naïve Bayes and Logistic Regression, in Machine Learning, McGraw Hill, New York, 2006, p.414.
Recommended Citation
Basnur, Prajna Wira and Sensuse, Dana Indra
(2010)
"Ontology-Based Automatic Classification for News Articles in Indonesian Language,"
Makara Journal of Technology: Vol. 14:
Iss.
1, Article 5.
DOI: 10.7454/mst.v14i1.446
Available at:
https://scholarhub.ui.ac.id/mjt/vol14/iss1/5
Included in
Chemical Engineering Commons, Civil Engineering Commons, Computer Engineering Commons, Electrical and Electronics Commons, Metallurgy Commons, Ocean Engineering Commons, Structural Engineering Commons