Deskripsi Mata Kuliah
Mata kuliah ini merupakan mata kuliah berbasis proyek yang mempelajari tentang teknik dasar untuk mengolah data teks. Pada mata kuliah akan diperkenalkan konsep morfologi bahasa, representasi teks, pre-processing, ekstraksi fitur hingga mendapatkan informasi seperi similarity dan klasterisasi teks. Topik-topik yang dibahas meliputi: morfologi bahasa, represntasi string, regex, tokenisasi, text pre-processing, Bag of Words, TF-IDF, word similarity, word clustering, dan web scraping. Mahasiswa akan membuat proyek berkelompok untuk mengaplikasikan teori dan konsep pemrosesan teks pada permasalahan di bidang Sains Data.
CPMK
- Menjelaskan konsep Language Modeling dalam pengolahan teks
- Mampu merepresentasikan pengetahuan linguistik pada tingkat representasi morfologi, sintaksis serta semantik
- Mampu melakukan penggalian data teks dari sumber digital dan mengolahnya menggunakan teknik pre-processing, ekstraksi fitur, dan klasifikasi teks
- Mampu merancang penyelesaian masalah pada data teks menggunakan pengolahan data teks yang terkait