Mata kuliah ini merupakan mata kuliah berbasis proyek yang mempelajari tentang teknik dasar untuk mengolah data teks. Pada mata kuliah akan diperkenalkan konsep morfologi bahasa, representasi teks, pre-processing, ekstraksi fitur hingga mendapatkan informasi seperi similarity dan klasterisasi teks. Topik-topik yang dibahas meliputi: morfologi bahasa, represntasi string, regex, tokenisasi, text pre-processing, Bag of Words, TF-IDF, word similarity, word clustering, dan web scraping. Mahasiswa akan membuat proyek berkelompok untuk mengaplikasikan teori dan konsep pemrosesan teks pada permasalahan di bidang Sains Data.