Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia
Kebelakangan ini, kajian tentang analisis sentimen semakin mendapat tempat dan banyak dijalankan. Walau bagaimanapun, kajian berkenaan analisis sentimen dalam Bahasa Melayu masih kurang. Tujuan kajian ini adalah untuk mencadangkan suatu kajian tentang pembangunan korpus analisis sentimen dalam Bah...
Saved in:
Main Authors: | , |
---|---|
Format: | Article |
Language: | English |
Published: |
Penerbit Universiti Kebangsaan Malaysia
2020
|
Online Access: | http://journalarticle.ukm.my/15421/1/08.pdf http://journalarticle.ukm.my/15421/ http://www.ukm.my/apjitm/articles-year.php |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | Kebelakangan ini, kajian tentang analisis sentimen semakin mendapat tempat dan banyak dijalankan. Walau
bagaimanapun, kajian berkenaan analisis sentimen dalam Bahasa Melayu masih kurang. Tujuan kajian ini adalah
untuk mencadangkan suatu kajian tentang pembangunan korpus analisis sentimen dalam Bahasa Melayu dengan
menggunakan kaedah separa selia dijalankan. Korpus analisis sentimen yang menggunakan data daripada Twitter
ini dibangunkan dengan menggunakan dua gabungan pendekatan iaitu sentimen leksikon dan pembelajaran mesin.
Pemprosesan bahasa tabii digunakan pada peringkat awal. Pada peringkat ini, leksikon sentimen digunakan untuk
membuat pengelasan data yang akan dijadikan benih data latihan. Selain itu, emotikon sentimen turut digunakan
untuk membandingkan ketepatan keputusan antara leksikon sentimen dan emotikon sentimen. Selepas benih data
latihan telah disediakan, proses penambahan data latihan baru yang lebih besar kuantitinya akan dijalankan dengan
menggunakan kaedah pengelasan menggunakan benih data dan pembelajaran mesin. Secara ringkasnya, proses
pengelasan yang dijalankan dengan menggunakan pembelajaran mesin adalah merangkumi pra-pemprosesan,
pengekstrakan fitur dan pengelasan. Perbandingan antara pengelasan juga dijalankan dengan menggunakan lima
jenis algoritma. Berdasarkan keputusan ekperimen yang telah dijalankan, penggunaan pendekatan leksikon
sentimen dan algoritma pengelas Bayes Naif Multinomial adalah pengelas yang terbaik untuk pembangunan
korpus analisis sentimen dalam Bahasa Melayu ini. |
---|