Skip to content

Slothomas/DataScience-Analisis-DataBanco

Repository files navigation

Tecnologias Utilizadas 🚀🚀

Google Colab, Jupyter Notebook Azure Machine Learning Pandas, Python

DataScience-Analisis-DataBanco 📊📊

Analisis de datos de un banco para limpieza de datos, aplicar ingeneria de datos y construir modelo Machine Learning en la nube Azure

Descripción del Problema de Negocio 📝📝

En el sector bancario, la identificación precisa del propósito de las solicitudes de crédito es crucial para ofrecer productos financieros adecuados y estrategias de marketing personalizadas. Las instituciones financieras enfrentan el desafío de segmentar a sus clientes de manera efectiva para maximizar el impacto de sus ofertas y mejorar la satisfacción del cliente.

Problema:

Las entidades bancarias a menudo tienen dificultades para comprender las intenciones exactas detrás de las solicitudes de crédito de sus clientes debido a la falta de datos estructurados y la presencia de información no estandarizada. Esto puede llevar a una asignación ineficiente de recursos, ofertas de productos que no se alinean con las necesidades del cliente y, en última instancia, una pérdida de oportunidades de negocio.

Impacto:

  • 🚫 Ineficiencia en las Campañas de Marketing: Las ofertas de crédito mal dirigidas pueden resultar en bajas tasas de conversión y costos de adquisición elevados.
  • 😕 Satisfacción del Cliente: La falta de ofertas relevantes puede disminuir la satisfacción del cliente y la lealtad hacia la institución financiera.
  • ❌ Oportunidades Perdidas: No identificar correctamente el propósito de las solicitudes puede llevar a la pérdida de oportunidades para ofrecer productos financieros adecuados que se alineen con las necesidades del cliente.

Solución Propuesta:

Implementar un modelo de machine learning para predecir el propósito de las solicitudes de crédito basándose en datos históricos de clientes. Este modelo ayudará a:

  • 🎯 Segmentar Efectivamente a los Clientes: Al identificar patrones y propósitos específicos, se podrán diseñar campañas de marketing más efectivas y dirigidas.
  • 📈 Optimizar Ofertas de Productos: Ajustar las ofertas de crédito según las necesidades y propósitos identificados, mejorando así la relevancia y el impacto de las ofertas.
  • 😊 Mejorar la Experiencia del Cliente: Ofrecer productos y servicios que se alineen mejor con las intenciones y necesidades de los clientes, aumentando su satisfacción y lealtad.

Pasos del Proyecto 🛠️🛠️

Paso 1: ETL

Carga, estandariza y limpia los datos, convirtiéndolos a un formato numérico adecuado para su procesamiento en Azure.

Paso 1

Paso 2: Ingeniería de Características

Crea nuevas características, categoriza y agrupa los datos para mejorar la precisión del modelo de Machine Learning en Azure.

Paso 2

Paso 3: Análisis Exploratorio

Realiza un análisis visual y estadístico para comprender los datos, identificar patrones y detectar anomalías.

Paso 3

Paso 4: Balanceo de Clases y Preparación de los Archivos para el Modelo

Aplica SMOTE para balancear las clases y utiliza train_test_split() para preparar conjuntos de datos de entrenamiento y prueba.

Paso 4

Paso 5: Entrenamiento y Despliegue del Modelo de Clasificación ML

Entrena el modelo de clasificación y despliega el modelo en Azure para su uso en producción.

--- API disponible hasta el 15 de Agosto por temas economicos ---

Paso 5

🔍 Modelo 1 🔍

En este modelo, se utilizó el archivo 'german_credit_procesadov1.csv' sin aplicar ingeniería de características. Se empleó un modelo de machine learning de clasificación con validación cruzada de k iteraciones y 7 validaciones cruzadas durante una hora. El mejor resultado obtenido fue un Accuracy de 0.3539489, indicando un margen significativo para mejorar.

Resultados Generales

Matriz de Confusión Precisión y Recall

🔍 Modelo 2 🔍

Para este modelo, se utilizó el archivo 'german_credit_procesadov2.csv', que incluye la ingeniería de características del paso 2 y el balanceo de clases del paso 4. Se empleó un modelo de machine learning de clasificación con validación cruzada de k iteraciones y 8 validaciones cruzadas, una más que el modelo anterior, también durante una hora. El mejor resultado obtenido fue un Accuracy de 0.7346501, lo cual representa una mejora significativa, duplicando el indicador y resultando en un modelo más confiable y preciso.

Resultados Generales

Matriz de Confusión Precisión y Recall

¿Qué queda por delante? 🔭🔭

Para avanzar, se deben considerar los siguientes pasos: obtener una base de datos más grande para mejorar el entrenamiento del modelo, aplicar una ingeniería de características más profunda, seguir experimentando con diferentes modelos, y generar filtros más específicos en las categorías. Estos esfuerzos tienen como objetivo incrementar el KPI de accuracy y lograr un modelo más preciso y confiable.

  • Obtener una base de datos más grande para mejorar el entrenamiento del modelo.
  • Aplicar una ingeniería de características más profunda.
  • Seguir experimentando con diferentes modelos.
  • Generar filtros más específicos en las categorías.

About

Analisis de datos de un banco para limpieza de datos, aplicar ingeneria de datos y construir modelo Machine Learning en la nube Azure

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors