Skip to content

servgri/hackaton_2

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Прогнозирование целевых действий пользователей на платформе «СберАвтоподписка»

📌 Описание проекта

Учебный проект, выполненный в рамках практики магистратуры ТГУ по направлению «Науки о данных и машинное обучение».
Цель — разработка модели машинного обучения для предсказания вероятности совершения пользователем целевого действия на сайте сервиса СберАвтоподписка.

Тип задачи: бинарная классификация
Метрика: ROC-AUC


👥 Команда проекта

  • Тимлид: Гришин Сергей
  • Команда:
    • Вишняков Дмитрий
    • Данилова Елена
    • Коваленко Екатерина
    • Тагильцев Кирилл
    • Шерин Иван

📁 Структура проекта


🎯 Цель проекта

Разработать модель, предсказывающую вероятность того, что пользователь совершит одно из целевых действий:

  • «Оставить заявку»
  • «Заказать звонок»

🗃 Источник данных

Использованы логи пользовательской активности на сайте:

  • utm_* — рекламные метки
  • device_* — характеристики устройств
  • geo_* — геоданные
  • visit_* — информация о визите
  • event_*, hit_* — события на сайте

📁 Скачать данные
📄 Полное задание


🔧 Этапы работы

1. Предобработка данных

  • Обработка пропусков и редких категорий
  • Категоризация источников трафика
  • Инженерия признаков по дате и времени визита
  • Кодирование категориальных признаков (TopEncoderTransformer, MapColumnTransformer)

2. Сборка пайплайна

  • Кастомные sklearn-трансформеры
  • ColumnTransformer с StandardScaler и OneHotEncoder
  • Объединение всего в единый Pipeline

3. Обучение моделей

  • Подбор гиперпараметров с помощью GridSearchCV
  • Использованные модели:
    • Logistic Regression
    • Decision Tree
    • Random Forest
    • Extra Trees
    • Gradient Boosting
    • LightGBM
    • XGBoost
    • CatBoost
    • HistGradientBoosting
    • BaggingClassifier

4. Оценка результатов

  • Метрика: ROC-AUC
  • Визуализация: ROC-кривые и графики важности признаков
  • Сравнение всех моделей

5. Дополнительно

  • Обучение простой нейронной сети
  • Сохранение моделей с помощью pickle

📈 Результаты

  • Лучшие модели достигли ROC-AUC > 0.75
  • Удовлетворены требования:
    • Качество: ROC-AUC > 0.65
    • Скорость: время предсказания ≤ 3 секунд
  • Важнейшие признаки: utm_source, device_type, geo_city, день недели и др.

🛠 Используемые технологии

  • Python 3.10
  • Pandas, NumPy
  • Scikit-learn
  • LightGBM, XGBoost, CatBoost
  • Matplotlib, Seaborn
  • Google Colab / Jupyter Notebook
  • Pickle (сохранение моделей)

🚗 О сервисе «СберАвтоподписка»

«СберАвтоподписка» — сервис долгосрочной аренды автомобилей для физических лиц.

Включает:

  • Ежемесячный фиксированный платеж
  • Страхование (КАСКО, ОСАГО, ДСАГО)
  • ТО, ремонт, смена и хранение шин
  • 24/7 поддержка
  • Доп. опция: консьерж-сервис

🧾 Лицензия

Проект выполнен в учебных целях. Использование и распространение ограничено образовательной задачей.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors