Ontology-Based Automatic Classification for News Articles in Indonesian Language. Searching specific information will be difficult if relying only on query. Choosing less specific queries will result in a lot of irrelevant information fetched by the system. One of the most successful ways to overcome this problem is to perform document classification based on the topic. There are many methods that can be used to conduct such a classification, such as using statistical and machine learning approaches. However, those document classification methods require training the data or learning the documents. In this study, the authors attempted to classify documents using a method that doesn’t require learning the documents. This classification method uses ontology to classify documents. Document classification using ontology is done by comparing the value of similarity among documents and existing node in the ontology. A document is classified into a category or a node if it has the highest similarity value in one of the nodes in the ontology. The results show that ontology can be used to perform document classification. The recall value is 97.03%, the precision is 91.63%, and the f-measure is 94.02%.

Bahasa Abstract

Pencarian informasi tertentu akan sulit dilakukan bila mengandalkan query saja. Pemilihan query yang kurang spesifik akan berakibat banyaknya informasi yang tidak relevan ikut terambil oleh sistem. Salah satu cara yang paling berhasil untuk mengatasi permasalahan ini adalah dengan melakukan klasifikasi dokumen berdasarkan topiknya. Ada banyak metode digunakan untuk melakukan klasifikasi dokumen seperti menggunakan pendekatan statistik dan machine learning. Namun, metode klasifikasi dokumen tersebut membutuhkan training data atau dokumen pembelajaran. Pada penelitian ini penulis berusaha untuk melakukan klasifikasi dokumen menggunakan sebuah metode yang tidak memerlukan dokumen pembelajaran. Metode klasifikasi ini menggunakan ontologi untuk melakukan klasifikasi dokumen. Klasifikasi dokumen dengan menggunakan ontologi dilakukan dengan membandingkan nilai kemiripan di antara dokumen dan sebuah node yang ada di ontologi. Sebuah dokumen diklasifikasikan dalam sebuah kategori atau node jika memiliki nilai kemiripan paling tinggi di salah satu node di ontologi. Hasil penelitian menunjukkan bahwa ontologi dapat digunakan untuk melakukan klasifikasi dokumen. Nilai recall adalah 97,03%, precision 91,63%, dan f-measure 94,02%.


