Skip to content

Jordannst/NewsArticleClassification

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

6 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

📰 News Category Classifier Web App

Preview Aplikasi

Aplikasi ini merupakan sistem klasifikasi berita berbasis web yang mampu memprediksi kategori berita menggunakan dua pendekatan:

  1. Model Machine Learning klasik (Multinomial Naive Bayes + TF-IDF)
  2. Large Language Model (LLM) Gemini dari Google

🔍 Fitur Utama

  • Input teks berita dari user
  • Deteksi dan terjemahan otomatis jika teks menggunakan Bahasa Indonesia
  • Preprocessing teks (cleaning, stopwords, stemming, dll)
  • Klasifikasi berita ke dalam 5 kategori:
    • BUSINESS
    • EDUCATION
    • ENTERTAINMENT
    • SPORTS
    • TECHNOLOGY
  • Dua mode klasifikasi:
    • TF-IDF + Naive Bayes
    • Gemini LLM untuk klasifikasi generatif

🛠️ Tech Stack


🧠 Model & Dataset

  • Dataset terdiri dari lima kategori berita: business, education, entertainment, sports, dan technology
  • Preprocessing teks termasuk:
    • Menghapus HTML, URL, angka, tanda baca
    • Menghapus stopwords dan melakukan stemming
  • Model: Multinomial Naive Bayes
  • Representasi teks: TF-IDF Vectorizer

About

AI-powered News Classifier using Machine Learning (Scikit-learn) and LLM (Gemini API) with Flask web interface.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors