Staff View: Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia

Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia

Kebelakangan ini, kajian tentang analisis sentimen semakin mendapat tempat dan banyak dijalankan. Walau bagaimanapun, kajian berkenaan analisis sentimen dalam Bahasa Melayu masih kurang. Tujuan kajian ini adalah untuk mencadangkan suatu kajian tentang pembangunan korpus analisis sentimen dalam Bah...

Full description

Saved in:

Bibliographic Details
Main Authors:	Ezuana Sukawai,, Nazlia Omar,
Format:	Article
Language:	English
Published:	Penerbit Universiti Kebangsaan Malaysia 2020
Online Access:	http://journalarticle.ukm.my/15421/1/08.pdf http://journalarticle.ukm.my/15421/ http://www.ukm.my/apjitm/articles-year.php
Tags:	Add Tag No Tags, Be the first to tag this record!

id	my-ukm.journal.15421
record_format	eprints
spelling	my-ukm.journal.154212020-10-23T03:26:07Z http://journalarticle.ukm.my/15421/ Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia Ezuana Sukawai, Nazlia Omar, Kebelakangan ini, kajian tentang analisis sentimen semakin mendapat tempat dan banyak dijalankan. Walau bagaimanapun, kajian berkenaan analisis sentimen dalam Bahasa Melayu masih kurang. Tujuan kajian ini adalah untuk mencadangkan suatu kajian tentang pembangunan korpus analisis sentimen dalam Bahasa Melayu dengan menggunakan kaedah separa selia dijalankan. Korpus analisis sentimen yang menggunakan data daripada Twitter ini dibangunkan dengan menggunakan dua gabungan pendekatan iaitu sentimen leksikon dan pembelajaran mesin. Pemprosesan bahasa tabii digunakan pada peringkat awal. Pada peringkat ini, leksikon sentimen digunakan untuk membuat pengelasan data yang akan dijadikan benih data latihan. Selain itu, emotikon sentimen turut digunakan untuk membandingkan ketepatan keputusan antara leksikon sentimen dan emotikon sentimen. Selepas benih data latihan telah disediakan, proses penambahan data latihan baru yang lebih besar kuantitinya akan dijalankan dengan menggunakan kaedah pengelasan menggunakan benih data dan pembelajaran mesin. Secara ringkasnya, proses pengelasan yang dijalankan dengan menggunakan pembelajaran mesin adalah merangkumi pra-pemprosesan, pengekstrakan fitur dan pengelasan. Perbandingan antara pengelasan juga dijalankan dengan menggunakan lima jenis algoritma. Berdasarkan keputusan ekperimen yang telah dijalankan, penggunaan pendekatan leksikon sentimen dan algoritma pengelas Bayes Naif Multinomial adalah pengelas yang terbaik untuk pembangunan korpus analisis sentimen dalam Bahasa Melayu ini. Penerbit Universiti Kebangsaan Malaysia 2020-06 Article PeerReviewed application/pdf en http://journalarticle.ukm.my/15421/1/08.pdf Ezuana Sukawai, and Nazlia Omar, (2020) Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia. Asia-Pacific Journal of Information Technology and Multimedia, 9 (1). pp. 94-109. ISSN 2289-2192 http://www.ukm.my/apjitm/articles-year.php
institution	Universiti Kebangsaan Malaysia
building	Tun Sri Lanang Library
collection	Institutional Repository
continent	Asia
country	Malaysia
content_provider	Universiti Kebangsaan Malaysia
content_source	UKM Journal Article Repository
url_provider	http://journalarticle.ukm.my/
language	English
description	Kebelakangan ini, kajian tentang analisis sentimen semakin mendapat tempat dan banyak dijalankan. Walau bagaimanapun, kajian berkenaan analisis sentimen dalam Bahasa Melayu masih kurang. Tujuan kajian ini adalah untuk mencadangkan suatu kajian tentang pembangunan korpus analisis sentimen dalam Bahasa Melayu dengan menggunakan kaedah separa selia dijalankan. Korpus analisis sentimen yang menggunakan data daripada Twitter ini dibangunkan dengan menggunakan dua gabungan pendekatan iaitu sentimen leksikon dan pembelajaran mesin. Pemprosesan bahasa tabii digunakan pada peringkat awal. Pada peringkat ini, leksikon sentimen digunakan untuk membuat pengelasan data yang akan dijadikan benih data latihan. Selain itu, emotikon sentimen turut digunakan untuk membandingkan ketepatan keputusan antara leksikon sentimen dan emotikon sentimen. Selepas benih data latihan telah disediakan, proses penambahan data latihan baru yang lebih besar kuantitinya akan dijalankan dengan menggunakan kaedah pengelasan menggunakan benih data dan pembelajaran mesin. Secara ringkasnya, proses pengelasan yang dijalankan dengan menggunakan pembelajaran mesin adalah merangkumi pra-pemprosesan, pengekstrakan fitur dan pengelasan. Perbandingan antara pengelasan juga dijalankan dengan menggunakan lima jenis algoritma. Berdasarkan keputusan ekperimen yang telah dijalankan, penggunaan pendekatan leksikon sentimen dan algoritma pengelas Bayes Naif Multinomial adalah pengelas yang terbaik untuk pembangunan korpus analisis sentimen dalam Bahasa Melayu ini.
format	Article
author	Ezuana Sukawai, Nazlia Omar,
spellingShingle	Ezuana Sukawai, Nazlia Omar, Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia
author_facet	Ezuana Sukawai, Nazlia Omar,
author_sort	Ezuana Sukawai,
title	Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia
title_short	Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia
title_full	Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia
title_fullStr	Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia
title_full_unstemmed	Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia
title_sort	pembangunan korpus bagi analisis sentimen dalam bahasa melayu secara separa selia
publisher	Penerbit Universiti Kebangsaan Malaysia
publishDate	2020
url	http://journalarticle.ukm.my/15421/1/08.pdf http://journalarticle.ukm.my/15421/ http://www.ukm.my/apjitm/articles-year.php
_version_	1681490392269193216
score	13.211869

Pembangunan korpus bagi analisis sentimen dalam Bahasa Melayu secara separa selia

Similar Items