Skip to content

The project aims to predict customer churn in the telecommunications industry using several models, with K-Nearest Neighbors (KNN) proving to be the best. We performed data analysis, handled missing values through imputation, and balancing data using SMOTE. The optimal model was chosen based on the highest recall score after hyperparameter

Notifications You must be signed in to change notification settings

aliabdurrahman10/TelcoCustomerChurnModel

Repository files navigation

Prediksi Churn Pelanggan Telco

Deskripsi

Analisis ini bertujuan untuk memprediksi churn pelanggan pada perusahaan telekomunikasi. Churn merujuk pada pelanggan yang berhenti menggunakan layanan atau berlangganan dalam periode tertentu. Dengan memahami pelanggan yang berisiko churn, perusahaan dapat mengambil langkah-langkah proaktif untuk mempertahankan mereka.


Tujuan

  • Menganalisis data churn pelanggan dan mengembangkan model prediktif untuk mendeteksi pelanggan yang berisiko churn.
  • Menggunakan recall sebagai metrik utama untuk mengevaluasi akurasi model dalam mendeteksi pelanggan yang akan churn.
  • Memberikan insight untuk tim manajemen dan pemasaran dalam merancang strategi retensi pelanggan.

Mengapa Memilih Churn?

Churn dipilih karena perusahaan telekomunikasi menghadapi tantangan besar dalam mempertahankan pelanggan di pasar yang sangat kompetitif. Memahami siapa saja pelanggan yang berisiko churn sangat penting, karena mempertahankan pelanggan yang sudah ada jauh lebih hemat biaya dibandingkan dengan mencari pelanggan baru. Kehilangan pelanggan berarti kehilangan pendapatan dan berpotensi meningkatkan biaya akuisisi pelanggan baru.

Dengan memprediksi pelanggan yang berisiko churn, perusahaan dapat mengambil langkah-langkah pencegahan, seperti memberikan penawaran khusus atau meningkatkan kualitas layanan. Fokus utama adalah pada recall, yaitu seberapa banyak pelanggan yang benar-benar akan churn dapat terdeteksi oleh model. Kegagalan mendeteksi pelanggan yang akan churn (false negative) bisa berisiko kehilangan kesempatan untuk melakukan intervensi yang dapat mempertahankan mereka.

Pendekatan ini sangat mendukung strategi bisnis yang memprioritaskan pencegahan churn, yaitu lebih baik memberi upaya retensi pada pelanggan yang terdeteksi berisiko, meskipun sebagian dari mereka mungkin tetap bertahan, daripada tidak mendeteksi pelanggan yang benar-benar akan pergi.


Dataset

Sumber data berasal dari Kaggle:

  1. Telco Customer Churn Dataset
    Sumber: Kaggle - Telco Customer Churn
    • Menyediakan data pelanggan telco, termasuk informasi tentang layanan yang digunakan, pembayaran, dan status churn.

Target Audience: Manajemen dan Tim Pemasaran yang membutuhkan wawasan tentang perilaku churn pelanggan.


Tools & Teknologi

  • Python: Pandas, NumPy, Scikit-learn, Streamlit, Matplotlib, Seaborn
  • Jupyter Notebook: Untuk eksplorasi data, pembersihan, dan pengembangan model
  • Streamlit: Untuk deploy model sebagai aplikasi web interaktif
  • GitHub: Dokumentasi & versioning kode

Analisis

  • Data Preprocessing: Pembersihan data, penanganan nilai yang hilang, dan encoding variabel kategorikal.
  • Modeling: Pelatihan beberapa model pembelajaran mesin dengan fokus pada recall untuk mendeteksi pelanggan berisiko churn.
  • Evaluasi Model: Menggunakan metrik recall untuk memastikan model mampu mendeteksi churn dengan akurat.
  • Deployment: Deployment model ke aplikasi web dengan Streamlit untuk prediksi real-time.

Deployment

Model yang dilatih sudah dideploy dan dapat diakses secara online melalui URL berikut:


Dependencies

  • pandas
  • numpy
  • scikit-learn
  • streamlit
  • matplotlib
  • seaborn

Lisensi

Proyek ini dilisensikan di bawah MIT License.


Kontributor

About

The project aims to predict customer churn in the telecommunications industry using several models, with K-Nearest Neighbors (KNN) proving to be the best. We performed data analysis, handled missing values through imputation, and balancing data using SMOTE. The optimal model was chosen based on the highest recall score after hyperparameter

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published