Pembangunan korpus cerpen Bahasa Melayu: analisis linguistik korpora / Nurul Huda Mohd Saad, Rafidah Abd. Karim dan Khalijah Mohd Nor

Korpus Cerpen Bahasa Melayu (CBM) merupakan aplikasi SGML (ISO 8879:1986, Pemprosesan Maklumat-Teks dan Sistem Pejabat-Standard Generalized Markup Language) dan mematuhi Garis Panduan Elektronik (Text Electronic and Interchange-TEI). ia menyediakan konvensyen pengekodan untuk linguistik korpora yang...

Full description

Saved in:
Bibliographic Details
Main Authors: Mohd Saad, Nurul Huda, Abd. Karim, Rafidah, Mohd Nor, Khalijah
Format: Book Section
Language:en
Published: Bahagian Penyelidikan dan Jaringan Industri, UiTM Melaka 2012
Subjects:
Online Access:https://ir.uitm.edu.my/id/eprint/67496/1/67496.pdf
https://ir.uitm.edu.my/id/eprint/67496/
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Korpus Cerpen Bahasa Melayu (CBM) merupakan aplikasi SGML (ISO 8879:1986, Pemprosesan Maklumat-Teks dan Sistem Pejabat-Standard Generalized Markup Language) dan mematuhi Garis Panduan Elektronik (Text Electronic and Interchange-TEI). ia menyediakan konvensyen pengekodan untuk linguistik korpora yang direka secara optimum sesuai digunakan secara meluas dalam penyelidikan bahasa Melayu dan diterima sebagai set pengekodan standard bagi kajian berasaskan korpus. Korpus CBM dikenal pasti sebagai pengekodan tahap minimum di mana korpora mesti dianggap seragam dari segi perwakilan deskriptif (penandaan maklumat struktur dan bahasa). La juga menyediakan konvensyen pengekodan bagi pengekodan yang lebih luas dan anotasi linguistik, serta reka bentuk umum mewakili korpora beranotasi untuk ciri-ciri linguistik.