Analisis de datos de un banco para limpieza de datos, aplicar ingeneria de datos y construir modelo Machine Learning en la nube Azure
En el sector bancario, la identificación precisa del propósito de las solicitudes de crédito es crucial para ofrecer productos financieros adecuados y estrategias de marketing personalizadas. Las instituciones financieras enfrentan el desafío de segmentar a sus clientes de manera efectiva para maximizar el impacto de sus ofertas y mejorar la satisfacción del cliente.
Las entidades bancarias a menudo tienen dificultades para comprender las intenciones exactas detrás de las solicitudes de crédito de sus clientes debido a la falta de datos estructurados y la presencia de información no estandarizada. Esto puede llevar a una asignación ineficiente de recursos, ofertas de productos que no se alinean con las necesidades del cliente y, en última instancia, una pérdida de oportunidades de negocio.
- 🚫 Ineficiencia en las Campañas de Marketing: Las ofertas de crédito mal dirigidas pueden resultar en bajas tasas de conversión y costos de adquisición elevados.
- 😕 Satisfacción del Cliente: La falta de ofertas relevantes puede disminuir la satisfacción del cliente y la lealtad hacia la institución financiera.
- ❌ Oportunidades Perdidas: No identificar correctamente el propósito de las solicitudes puede llevar a la pérdida de oportunidades para ofrecer productos financieros adecuados que se alineen con las necesidades del cliente.
Implementar un modelo de machine learning para predecir el propósito de las solicitudes de crédito basándose en datos históricos de clientes. Este modelo ayudará a:
- 🎯 Segmentar Efectivamente a los Clientes: Al identificar patrones y propósitos específicos, se podrán diseñar campañas de marketing más efectivas y dirigidas.
- 📈 Optimizar Ofertas de Productos: Ajustar las ofertas de crédito según las necesidades y propósitos identificados, mejorando así la relevancia y el impacto de las ofertas.
- 😊 Mejorar la Experiencia del Cliente: Ofrecer productos y servicios que se alineen mejor con las intenciones y necesidades de los clientes, aumentando su satisfacción y lealtad.
Carga, estandariza y limpia los datos, convirtiéndolos a un formato numérico adecuado para su procesamiento en Azure.
Crea nuevas características, categoriza y agrupa los datos para mejorar la precisión del modelo de Machine Learning en Azure.
Realiza un análisis visual y estadístico para comprender los datos, identificar patrones y detectar anomalías.
Aplica SMOTE para balancear las clases y utiliza train_test_split() para preparar conjuntos de datos de entrenamiento y prueba.
Entrena el modelo de clasificación y despliega el modelo en Azure para su uso en producción.
En este modelo, se utilizó el archivo 'german_credit_procesadov1.csv' sin aplicar ingeniería de características. Se empleó un modelo de machine learning de clasificación con validación cruzada de k iteraciones y 7 validaciones cruzadas durante una hora. El mejor resultado obtenido fue un Accuracy de 0.3539489, indicando un margen significativo para mejorar.
Para este modelo, se utilizó el archivo 'german_credit_procesadov2.csv', que incluye la ingeniería de características del paso 2 y el balanceo de clases del paso 4. Se empleó un modelo de machine learning de clasificación con validación cruzada de k iteraciones y 8 validaciones cruzadas, una más que el modelo anterior, también durante una hora. El mejor resultado obtenido fue un Accuracy de 0.7346501, lo cual representa una mejora significativa, duplicando el indicador y resultando en un modelo más confiable y preciso.
Para avanzar, se deben considerar los siguientes pasos: obtener una base de datos más grande para mejorar el entrenamiento del modelo, aplicar una ingeniería de características más profunda, seguir experimentando con diferentes modelos, y generar filtros más específicos en las categorías. Estos esfuerzos tienen como objetivo incrementar el KPI de accuracy y lograr un modelo más preciso y confiable.
- Obtener una base de datos más grande para mejorar el entrenamiento del modelo.
- Aplicar una ingeniería de características más profunda.
- Seguir experimentando con diferentes modelos.
- Generar filtros más específicos en las categorías.








