Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib

Pendiskritan data merupakan kaedah pra-pemprosesan yang penting dalam membangunkan model pengelasan. Teknik pendiskritan data digunakan untuk menukarkan atribut selanjar kepada atribut diskrit. Ia sangat penting dalam membangunkan model berasaskan petua seperti pepohon keputusan dan set kasar. Pengg...

Full description

Saved in:
Bibliographic Details
Main Author: Mohd Shuib, Nor Liyana
Format: Article
Language:en
Published: Universiti Teknologi MARA, Perlis 2010
Subjects:
Online Access:https://ir.uitm.edu.my/id/eprint/32042/1/32042.pdf
https://ir.uitm.edu.my/id/eprint/32042/
https://jurnalintelek.uitm.edu.my/index.php/main
Tags: Add Tag
No Tags, Be the first to tag this record!
_version_ 1833064140335218688
author Mohd Shuib, Nor Liyana
author_facet Mohd Shuib, Nor Liyana
author_sort Mohd Shuib, Nor Liyana
building Tun Abdul Razak Library
collection Institutional Repository
content_provider Universiti Teknologi Mara
content_source UiTM Institutional Repository
continent Asia
country Malaysia
description Pendiskritan data merupakan kaedah pra-pemprosesan yang penting dalam membangunkan model pengelasan. Teknik pendiskritan data digunakan untuk menukarkan atribut selanjar kepada atribut diskrit. Ia sangat penting dalam membangunkan model berasaskan petua seperti pepohon keputusan dan set kasar. Penggunaan teknik pendiskritan dapat meningkatkan ketepatan pengelas dan menjadikan pembelajaran lebih tepat dan laju. Objektif kajian ini ialah untuk mengaplikasikan teknik pendiskritan data yang terpilih ke atas empat set data daripada UCI Machine Learning dan membuat perbandingan prestasi berdasarkan ketepatan pengelas, bilangan petua dan panjang petua. Teknik pendiskritan yang digunakan ialah teknik Taakulan Boolean, Equal Frequency Binning dan Entropi. Setiap teknik ini diaplikasikan ke atas empat set data dari domain yang berbeza untuk mendapatkan satu teknik yang terbaik. Set data tersebut ialah Iris, Glass, Pima dan Wine. Model pengelasan perlombongan data dibangunkan menggunakan kaedah pengelas set kasar melalui beberapa proses seperti pra-pemprosesan data, pembahagian set data latihan dan ujian, perlombongan data, pengujian dan perbandingan. Satu analisis perbandingan ke atas teknik pendiskritan yang digunakan dihasilkan. Hasil analisis mendapati penggunaan teknik Taakulan Boolean menggeneralisasikan purata ketepatan yang tertinggi jika dibandingkan dengan dua teknik yang lain.
format Article
id my.uitm.ir-32042
institution Universiti Teknologi Mara
language en
publishDate 2010
publisher Universiti Teknologi MARA, Perlis
record_format eprints
spelling my.uitm.ir-320422020-07-08T05:31:24Z https://ir.uitm.edu.my/id/eprint/32042/ Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib jurnalintelek Mohd Shuib, Nor Liyana Electronic Computers. Computer Science Data mining Pendiskritan data merupakan kaedah pra-pemprosesan yang penting dalam membangunkan model pengelasan. Teknik pendiskritan data digunakan untuk menukarkan atribut selanjar kepada atribut diskrit. Ia sangat penting dalam membangunkan model berasaskan petua seperti pepohon keputusan dan set kasar. Penggunaan teknik pendiskritan dapat meningkatkan ketepatan pengelas dan menjadikan pembelajaran lebih tepat dan laju. Objektif kajian ini ialah untuk mengaplikasikan teknik pendiskritan data yang terpilih ke atas empat set data daripada UCI Machine Learning dan membuat perbandingan prestasi berdasarkan ketepatan pengelas, bilangan petua dan panjang petua. Teknik pendiskritan yang digunakan ialah teknik Taakulan Boolean, Equal Frequency Binning dan Entropi. Setiap teknik ini diaplikasikan ke atas empat set data dari domain yang berbeza untuk mendapatkan satu teknik yang terbaik. Set data tersebut ialah Iris, Glass, Pima dan Wine. Model pengelasan perlombongan data dibangunkan menggunakan kaedah pengelas set kasar melalui beberapa proses seperti pra-pemprosesan data, pembahagian set data latihan dan ujian, perlombongan data, pengujian dan perbandingan. Satu analisis perbandingan ke atas teknik pendiskritan yang digunakan dihasilkan. Hasil analisis mendapati penggunaan teknik Taakulan Boolean menggeneralisasikan purata ketepatan yang tertinggi jika dibandingkan dengan dua teknik yang lain. Universiti Teknologi MARA, Perlis 2010-12 Article PeerReviewed text en https://ir.uitm.edu.my/id/eprint/32042/1/32042.pdf Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib. (2010) Jurnal Intelek <https://ir.uitm.edu.my/view/publication/Jurnal_Intelek/>, 5 (2). ISSN 2231-7716 https://jurnalintelek.uitm.edu.my/index.php/main
spellingShingle Electronic Computers. Computer Science
Data mining
Mohd Shuib, Nor Liyana
Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib
title Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib
title_full Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib
title_fullStr Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib
title_full_unstemmed Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib
title_short Aplikasi teknik pendiskritan dalam perlombongan data / Nor Liyana Mohd Shuib
title_sort aplikasi teknik pendiskritan dalam perlombongan data / nor liyana mohd shuib
topic Electronic Computers. Computer Science
Data mining
url https://ir.uitm.edu.my/id/eprint/32042/1/32042.pdf
https://ir.uitm.edu.my/id/eprint/32042/
https://jurnalintelek.uitm.edu.my/index.php/main
url_provider http://ir.uitm.edu.my/