Mata kuliah Big Data dirancang untuk membekali mahasiswa dengan pengetahuan konseptual dan keterampilan praktis yang fundamental untuk mengelola dan menganalisis data dalam skala masif. Mata kuliah ini membahas secara komprehensif siklus hidup Big data, mulai dari akuisisi dan penyimpanan (ingestion & storage), pemrosesan terdistribusi (distributed processing), hingga analisis dan visualisasi untuk menghasilkan wawasan bisnis yang dapat ditindaklanjuti (actionable insights).
Fokus utama pembelajaran terletak pada penguasaan arsitektur dan teknologi inti dalam ekosistem Big Data. Mahasiswa akan mempelajari secara mendalam ekosistem Hadoop, termasuk Hadoop Distributed File System (HDFS) sebagai fondasi penyimpanan, Yet Another Resource Negotiator (YARN) untuk manajemen sumber daya, dan paradigma MapReduce sebagai model pemrosesan data batch fundamental. Selanjutnya, mata kuliah ini akan beralih ke framework pemrosesan data modern yang lebih unggul, yaitu Apache Spark, yang mencakup modul Spark Core (RDD), Spark SQL (DataFrame), Spark Streaming untuk pemrosesan data waktu-nyata (real-time), dan Spark MLlib untuk penerapan machine learning dalam skala besar. Selain itu, mahasiswa akan diperkenalkan dengan solusi penyimpanan data non-relasional (NoSQL) seperti basis data dokumen (MongoDB) dan column-family (Cassandra) yang dirancang untuk menangani data dengan volume dan variasi tinggi.
Pendekatan pedagogis yang digunakan adalah kombinasi antara perkuliahan teoretis, sesi laboratorium praktis (hands-on), dan implementasi Project-Based Learning (PBL). Melalui PBL, mahasiswa akan bekerja dalam tim untuk merancang dan membangun sebuah pipeline analisis data end-to-end, yang mengintegrasikan berbagai teknologi yang telah dipelajari untuk memecahkan sebuah studi kasus nyata. Pendekatan ini memastikan bahwa mahasiswa tidak hanya memahami "apa" dan "mengapa" dari teknologi Big Data, tetapi juga mampu "bagaimana" menerapkannya secara efektif.