•  

Our Top Course
Pengembangan Media Foto
( 16 Sections)
 
Komunikasi Pembelajaran
( 16 Sections)
 

Course Text Processing Algorithms

Program Studi S1 Sains Data UNESA

 
Card image

Course Description

This course is a project-based course that studies basic techniques for processing text data. The course will introduce the concepts of language morphology, text representation, pre-processing, feature extraction to obtain information such as similarity and text clustering. Topics covered include: language morphology, string representation, regex, tokenization, text pre-processing, Bag of Words, TF-IDF, word similarity, word clustering, and web scraping. Students will create group projects to apply text processing theories and concepts to problems in the field of Data Science.

Program Objectives (PO)

  • Mampu merepresentasikan pengetahuan linguistik pada tingkat representasi morfologi, sintaksis serta semantik
  • Mampu melakukan penggalian data teks dari sumber digital dan mengolahnya menggunakan teknik pre-processing, ekstraksi fitur, dan similarity teks
  • Mampu melakukan pemodelan data teks dengan menggunakan klasifikasi dan klaster
  • Mampu merancang penyelesaian masalah pada data teks menggunakan pengolahan data teks yang terkait

Aktifitas Pembelajaran

  • Pertemuan 1
    Konsep morfologi bahasa mulai dari fonem, morpheme, lexemes, syntax, dan contex
    • Date  25 Agustus 2025

  • Pertemuan 2
    Represesntasi string, operasi string, regex, dan visualisasi data teks pada pemrograman
    • Date  1 September 2025

  • Pertemuan 3
    Melakukan Web Scraping (HTTP dan API)
    • Date  8 September 2025

  • Pertemuan 4
    Melakukan teknik pre-prosesing data teks
    • Date  15 September 2025

  • Pertemuan 5
    • Date  22 September 2025

  • Pertemuan 6
    Melakukan teknik ekstraksi fitur pada data teks
    • Date  29 September 2025

  • Pertemuan 7
    Melakukan teknik dalam similaritas dari data teks
    • Date  6 Oktober 2025

  • Pertemuan 8
    Ujian Tengah Semester
    • Date  13 Oktober 2025

  • Pertemuan 9
    Melakukan teknik clustering text pada data teks
    • Date  20 Oktober 2025

  • Pertemuan 10
    Topik utama dengan LDA
    • Date  27 Oktober 2025

  • Pertemuan 11
    Konsep NLP (pada summarization)
    • Date  3 November 2025

  • Pertemuan 12
    Teknik pemrosesan data pada permasalahan nyata
    • Date  10 November 2025

  • Pertemuan 13
    Teknik pemrosesan data pada permasalahan nyata
    • Date  17 November 2025

  • Pertemuan 14
    Teknik pemrosesan data pada permasalahan nyata
    • Date  24 November 2025

  • Pertemuan 15
    Teknik pemrosesan data pada permasalahan nyata
    • Date  1 Desember 2025

  • Pertemuan 16
    Ujian Akhir Semester (UAS)
    • Date  8 Desember 2025

Lecturer

ULFA SITI NURAINI
ULFA SITI NURAINI
  • 215,475 Reviews4.8 Rating

Video Images
Preview this course
 
 
  • Program StudiS1 Sains Data
  • Semester3
  • Lectures1
Difficult Things About Education.
$75$10