DataScience-Analisis-DataBanco 📊📊

Tecnologias Utilizadas 🚀🚀

DataScience-Analisis-DataBanco 📊📊

Analisis de datos de un banco para limpieza de datos, aplicar ingeneria de datos y construir modelo Machine Learning en la nube Azure

Descripción del Problema de Negocio 📝📝

En el sector bancario, la identificación precisa del propósito de las solicitudes de crédito es crucial para ofrecer productos financieros adecuados y estrategias de marketing personalizadas. Las instituciones financieras enfrentan el desafío de segmentar a sus clientes de manera efectiva para maximizar el impacto de sus ofertas y mejorar la satisfacción del cliente.

Problema:

Las entidades bancarias a menudo tienen dificultades para comprender las intenciones exactas detrás de las solicitudes de crédito de sus clientes debido a la falta de datos estructurados y la presencia de información no estandarizada. Esto puede llevar a una asignación ineficiente de recursos, ofertas de productos que no se alinean con las necesidades del cliente y, en última instancia, una pérdida de oportunidades de negocio.

Impacto:

🚫 Ineficiencia en las Campañas de Marketing: Las ofertas de crédito mal dirigidas pueden resultar en bajas tasas de conversión y costos de adquisición elevados.
😕 Satisfacción del Cliente: La falta de ofertas relevantes puede disminuir la satisfacción del cliente y la lealtad hacia la institución financiera.
❌ Oportunidades Perdidas: No identificar correctamente el propósito de las solicitudes puede llevar a la pérdida de oportunidades para ofrecer productos financieros adecuados que se alineen con las necesidades del cliente.

Solución Propuesta:

Implementar un modelo de machine learning para predecir el propósito de las solicitudes de crédito basándose en datos históricos de clientes. Este modelo ayudará a:

🎯 Segmentar Efectivamente a los Clientes: Al identificar patrones y propósitos específicos, se podrán diseñar campañas de marketing más efectivas y dirigidas.
📈 Optimizar Ofertas de Productos: Ajustar las ofertas de crédito según las necesidades y propósitos identificados, mejorando así la relevancia y el impacto de las ofertas.
😊 Mejorar la Experiencia del Cliente: Ofrecer productos y servicios que se alineen mejor con las intenciones y necesidades de los clientes, aumentando su satisfacción y lealtad.

Pasos del Proyecto 🛠️🛠️

Paso 1: ETL

Carga, estandariza y limpia los datos, convirtiéndolos a un formato numérico adecuado para su procesamiento en Azure.

Paso 1

Paso 2: Ingeniería de Características

Crea nuevas características, categoriza y agrupa los datos para mejorar la precisión del modelo de Machine Learning en Azure.

Paso 2

Paso 3: Análisis Exploratorio

Realiza un análisis visual y estadístico para comprender los datos, identificar patrones y detectar anomalías.

Paso 3

Paso 4: Balanceo de Clases y Preparación de los Archivos para el Modelo

Aplica SMOTE para balancear las clases y utiliza train_test_split() para preparar conjuntos de datos de entrenamiento y prueba.

Paso 4

Paso 5: Entrenamiento y Despliegue del Modelo de Clasificación ML

Entrena el modelo de clasificación y despliega el modelo en Azure para su uso en producción.

--- API disponible hasta el 15 de Agosto por temas economicos ---

Paso 5

🔍 Modelo 1 🔍

En este modelo, se utilizó el archivo 'german_credit_procesadov1.csv' sin aplicar ingeniería de características. Se empleó un modelo de machine learning de clasificación con validación cruzada de k iteraciones y 7 validaciones cruzadas durante una hora. El mejor resultado obtenido fue un Accuracy de 0.3539489, indicando un margen significativo para mejorar.

🔍 Modelo 2 🔍

Para este modelo, se utilizó el archivo 'german_credit_procesadov2.csv', que incluye la ingeniería de características del paso 2 y el balanceo de clases del paso 4. Se empleó un modelo de machine learning de clasificación con validación cruzada de k iteraciones y 8 validaciones cruzadas, una más que el modelo anterior, también durante una hora. El mejor resultado obtenido fue un Accuracy de 0.7346501, lo cual representa una mejora significativa, duplicando el indicador y resultando en un modelo más confiable y preciso.

¿Qué queda por delante? 🔭🔭

Para avanzar, se deben considerar los siguientes pasos: obtener una base de datos más grande para mejorar el entrenamiento del modelo, aplicar una ingeniería de características más profunda, seguir experimentando con diferentes modelos, y generar filtros más específicos en las categorías. Estos esfuerzos tienen como objetivo incrementar el KPI de accuracy y lograr un modelo más preciso y confiable.

Obtener una base de datos más grande para mejorar el entrenamiento del modelo.
Aplicar una ingeniería de características más profunda.
Seguir experimentando con diferentes modelos.
Generar filtros más específicos en las categorías.

Name		Name	Last commit message	Last commit date
Latest commit History 41 Commits
img		img
README.md		README.md
X_test.csv		X_test.csv
X_train_resampled.csv		X_train_resampled.csv
datos_simulados_prueba.csv		datos_simulados_prueba.csv
datos_simulados_prueba_with_predictions.csv		datos_simulados_prueba_with_predictions.csv
german_credit.csv		german_credit.csv
german_credit_procesadov1.csv		german_credit_procesadov1.csv
german_credit_procesadov2.csv		german_credit_procesadov2.csv
modelo_ml_databancoipynb.ipynb		modelo_ml_databancoipynb.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Tecnologias Utilizadas 🚀🚀

DataScience-Analisis-DataBanco 📊📊

Descripción del Problema de Negocio 📝📝

Problema:

Impacto:

Solución Propuesta:

Pasos del Proyecto 🛠️🛠️

Paso 1: ETL

Paso 2: Ingeniería de Características

Paso 3: Análisis Exploratorio

Paso 4: Balanceo de Clases y Preparación de los Archivos para el Modelo

Paso 5: Entrenamiento y Despliegue del Modelo de Clasificación ML

--- API disponible hasta el 15 de Agosto por temas economicos ---

🔍 Modelo 1 🔍

🔍 Modelo 2 🔍

¿Qué queda por delante? 🔭🔭

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Tecnologias Utilizadas 🚀🚀

DataScience-Analisis-DataBanco 📊📊

Descripción del Problema de Negocio 📝📝

Problema:

Impacto:

Solución Propuesta:

Pasos del Proyecto 🛠️🛠️

Paso 1: ETL

Paso 2: Ingeniería de Características

Paso 3: Análisis Exploratorio

Paso 4: Balanceo de Clases y Preparación de los Archivos para el Modelo

Paso 5: Entrenamiento y Despliegue del Modelo de Clasificación ML

--- API disponible hasta el 15 de Agosto por temas economicos ---

🔍 Modelo 1 🔍

🔍 Modelo 2 🔍

¿Qué queda por delante? 🔭🔭

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages