PENGEMBANGAN CHATBOT ANALISIS DATA MAHASISWA DENGAN TERM FREQUENCY - INVERSE DOCUMENT FREQUENCY DAN LOGISTIC REGRESSION
Abstract
ABSTRAK
Perkembangan teknologi informasi mendorong akan kebutuhan mahasiswa dan lembaga pendidikan untuk memahami berbagai macam data akademik, seperti nilai ujian, tingkat kehadiran, dan kinerja belajar. Namun, penyajian data di dalam bentuk tabel atau grafik seringkali dapat sulit dipahami, terutama oleh pengguna yang tidak familiar dengan analisis statistik. Penelitian ini bertujuan untuk mengembangkan sebuah chatbot yang melakukan analisis data mahasiswa, berbasis teknologi Natural Language Processing (NLP) dan Machine Learning, supaya informasi akademik dapat diakses dengan cepat, mudah, dan interaktif. Metode yang digunakan dalam penelitian ini adalah metode Term Frequency – Inverse Document Frequency (TF-IDF) untuk mengubah teks pertanyaan pengguna menjadi vektor numerik dan metode Logistic Regression untuk mengklasifikasikan intent. Dataset yang dipakai berisi data akademik sebanyak 5.000 mahasiswa dan model dilatih dengan metode supervised learning dengan menggunakan pembagian data sebanyak 80% untuk training / pelatihan dan sebanyak 20% untuk testing / pengujian. Hasil evaluasi chatbot menunjukkan akurasi sebesar 83% dengan nilai precision 0,86, recall 0,83, dan F1-score 0,82. Chatbot dapat menjawab berbagai pertanyaan seperti jumlah mahasiswa, nilai tertinggi, hingga rata-rata kehadiran. Kesimpulannya, dapat terlihat bahwa integrasi Natural Language Processing, Term Frequency – Inverse Document Frequency, dan Logistic Regression terbukti dapat efisien dalam melakukan analisis data akademik dan dukungan pengambilan keputusan di dalam lingkungan pendidikan.
Keywords
Full Text:
PDF 875-885 (Indonesian)References
Noviadhi, I. Y., S, F. V., Denyana, N. T., Romadhoni, A. S., Hidayat, M. D., Ihsan, M. K., Mardlotillah, Z., and Pandhowo, D., “Penerapan Teknologi Artificial Intelligence ChatBots dalam Proses Belajar Mengajar untuk Mata Kuliah Sistem Operasi pada Program Studi Teknik Informatika Universitas Negeri Semarang di Era Industri 4.0 dan Society 5.0”, Jurnal Mediasi, vol. 3, no. 1, pp 93-105, February 2024, Available: http://jurnalilmiah.org/journal/index.php/mediasi/article/view/753
G. P. Arta and Taufik, “Implementasi Model Long Short-term Memory pada Sistem Chatbot Layanan Informasi Penyakit Diabetes”, Jurnal Rekayasa Sistem Informasi dan Teknologi, vol. 3, no. 1, Agustus 2025, Available: https://journal.ppmi.web.id/index.php/jrsit/article/view/3033
A. Hadi, “Design of NLP-based Chatbot Media as a Mental Health Consultation Media with Depression Anxiety Stress approach", The Internet of Things and Artificial Intelligence Journal, vol. 5, no. 1, pp 115-126, February 2025, doi: 10.31763/iota.v5i1.888
Ayanouz, S., Abdelhakim, B. A., and Benhmed, M, "A Smart Chatbot Architecture based NLP and Machine Learning for Health Care Assistance". Proceedings of the 3rd International Conference on Networking, Information Systems & Security, pp 1–6, May 2020, doi: 10.1145/3386723.3387897
J. A. Lukmanto and T. P. Wijayanti, "Analisis Sentimen Program Makan Siang Gratis Menggunakan Model IndoBERT", Jurnal Algoritma, Logika dan Komputasi, vol. 8, no. 2 pp 820–829, September 2025. Available: https://journal.ubm.ac.id/index.php/alu/article/view/8868
R. Kusumastuti, E. Utami and A. Yaqin, "Detection of Sarcasm Sentences in Indonesian Tweets using SentiStrength," 2022 6th International Conference on Information Technology, Information Systems and Electrical Engineering (ICITISEE), Yogyakarta, Indonesia, 2022, pp. 93-98, doi: 10.1109/ICITISEE57756.2022.10057904.
H. Wijaya and N. Hayati, "Natural Language Processing (NLP) for Sentiment Analysis of Seblak Bandung Pedas Kudus Reviews", JBASE - Journal of Business and Audit Information Systems, vol. 8, no. 1, pp 13–22, Maret 2025. Available: https://journal.ubm.ac.id/index.php/jbase/article/view/8035
Abdulla, H., Eltahir, A. M., Alwahaishi, S., Saghair, K., Platos, J., and Snasel, V., "Chatbots development using Natural Language Processing: A Review", 26th International Conference on Circuits, Systems, Communications and Computers (CSCC), pp 122–128, January 2023, doi: 10.1109/cscc55931.2022.00030
Mustaqim, M., Gunawan, A., Pratama, Y. B., and Zaliman, I., "Pengembangan chatbot layanan publik menggunakan machine learning dan Natural Language Processing", Journal of Information Technology and Society, vol. 1, no. 1, pp 1–4, June 2023, doi: 10.35438/jits.v1i1.16
M. I. Pangestu, J. A. Ginting, I. G. N. Suryantara, and M. Marvelino, "Optimasi Pertanian di Bekasi Utara: Prediksi Curah Hujan dan Rekomendasi Tanaman dengan menggunakan Model Regresi Linier", Jurnal Algoritma, Logika dan Komputasi, vol. 7, no. 2, pp 731–742, September 2024. Available: https://journal.ubm.ac.id/index.php/alu/article/view/8081
E. Fammaldo, M. Lestari, and C. Hermawan, "Gradient Boosting Trees Untuk Pemodelan Dan Prediksi Biaya Kerugian Asuransi Mobil", Jurnal Algoritma, Logika dan Komputasi, vol. 7, no. 1, pp 634–642, Maret 2024. Available: https://journal.ubm.ac.id/index.php/alu/article/view/6030
Badlani, S., Aditya, T., Dave, M., and Chaudhari, S., "Multilingual healthcare chatbot using machine learning". 2021 2nd International Conference for Emerging Technology (INCET), pp 1–6, June 2021, doi: 10.1109/INCET51464.2021.9456304
Moulya, S., and Pragathi, T. R, "Mental Health Assist and Diagnosis Conversational Interface using Logistic Regression Model for Emotion and Sentiment Analysis", Journal of Physics: Conference Series, 2161(1), 2022, doi: 10.1088/1742-6596/2161/1/012039
DOI: http://dx.doi.org/10.30813/j-alu.v9i1.9015
Refbacks
- There are currently no refbacks.
p-ISSN 2620-620X
e-ISSN 2621-9840
Indexed By

Recommended Tools:
Dimension


