Skip to content

fiap-datascience/arcana

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

20 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Arcana  

📌 Descrição  

O Arcana é um projeto de análise e clusterização de clientes da TOTVS, com o objetivo de identificar perfis semelhantes, compreender padrões de satisfação e uso, e gerar insights estratégicos para retenção e crescimento.  

O projeto abrangeu desde a ingestão e organização dos dados em camadas até a aplicação de modelos de clusterização baseados em Gaussian Mixture Models Bayesianos (BGMM), resultando na criação de 8 personas de clientes que apoiam estratégias de personalização e relacionamento.  

🎥 Apresentação do Projeto

Assista ao nosso pitch de 5 minutos apresentando a solução, as personas e os resultados estratégicos do projeto.

➡️ Assistir no YouTube

🎯 Objetivos  

  • Consolidar uma visão 360º do cliente, integrando informações contratuais, de suporte, NPS e telemetria.  
  • Realizar análises exploratórias (EDA) para identificar padrões, hipóteses e direcionar a clusterização.  
  • Desenvolver e validar modelos de clusterização (BGMM) para agrupar clientes com base em perfil, comportamento e satisfação.  
  • Criar personas representativas dos clusters obtidos, facilitando a definição de estratégias específicas.  
  • Fornecer insights acionáveis para retenção, satisfação e crescimento.  
  • Construir dashboards interativos para visualização e monitoramento contínuo.  

📂 Dados Utilizados  

  • Dados cadastrais: informações contratuais, produtos, segmentos, faturamento.  
  • Tickets de suporte: chamados abertos, SLA, prioridade e resolutividade.  
  • NPS transacional e relacional: produto, implantação, onboarding, aquisição e suporte.  
  • Dados de telemetria: uso de módulos, duração de eventos, status de licença.  
  • Histórico de contratações e MRR.  

🛠️ Etapas  

  • Ingestão de dados na camada bronze (CSV bruto).  
  • Criação da camada silver (dados tratados e padronizados).  
  • Análises exploratórias (EDA).  
  • Engenharia de atributos para clusterização.  
  • Desenvolvimento e validação do modelo BGMM para definição dos clusters.  
  • Construção das personas a partir dos clusters.  
  • Construção de dashboards interativos no Power BI.  
  • Análise, documentação final e publicação dos resultados.  

🗂️ Estrutura do Repositório

O projeto está organizado da seguinte forma para garantir a clareza e a reprodutibilidade do processo:

  • dados/: Contém os scripts de ETL para movimentação e transformação dos dados.
    • raw/: Script responsável pela ingestão inicial dos dados brutos na camada Bronze.
    • curated/: Script de ETL que limpa, padroniza e transforma os dados da camada Bronze para a camada Silver, deixando-os prontos para análise.
  • notebooks/: Contém os notebooks Jupyter e scripts com toda a análise exploratória e o desenvolvimento do modelo.
    • analise_bronze.ipynb: Análise exploratória (EDA) básica para entendimento inicial dos dados, dando insumos para as tranformações iniciais.
    • analise_exploratoria.ipynb: Análise exploratória para entendimento mais abrangente dos dados dados.
    • clusterizacao.ipynb, clusterizacao_GMM.ipynb, testes_clusterizacao.ipynb,: Notebooks onde realizamos testes de diferentes modelos de Clusterização e avaliamos os resultados.
    • clusterizacao_final.py: Script com o desenvolvimento do modelo final, agregando engenheria de Feature e clusterização com BGMM.
    • acessar_dados_curated.py: Script suporte para a consulta das tabelas da camada Silver (Curated) na AWS.
    • acessar_dados_raw.py: Script suporte para a consulta das tabelas da camada Bronze (Raw) na AWS.

📊 Resultados  

  • Modelo de Clusterização: Gaussian Mixture Bayesian (BGMM), escolhido por sua capacidade de lidar com incerteza e determinar automaticamente o número ótimo de clusters.  
  • Clusters obtidos: foram definidos 8 clusters principais que representam diferentes perfis de clientes.  
  • Personas criadas: cada cluster foi traduzido em uma persona acionável, facilitando a comunicação dos resultados para áreas de negócio.  
  • Dashboard no Power BI: consolidou informações dos clusters e personas, possibilitando acompanhamento contínuo e interativo.  

👥 Personas Criadas  

A clusterização via BGMM resultou em 8 grupos principais de clientes, traduzidos em personas estratégicas. Abaixo estão as 8 personas identificadas:  

Cluster Persona Perfil / Segmento Valor Lealdade Engajamento Necessidades / Dores principais Ação Recomendável
0 Clientes Adormecidos Pequeno porte de serviços e varejo Mais baixo Média-Baixa Nulo Retomar contato e oferecer relevância Campanhas de reativação, ofertas personalizadas, contato humano
1 VIPs da Indústria Grande porte, concentrado em manufatura Muito Alto Alta Ativo Suporte premium, parceria estratégica Gestão de contas (KAM), reuniões executivas, suporte técnico diferenciado
2 Veteranos em Manutenção Perfil demográfico diversificado Moderado Alta Nulo Reforçar o valor de novas soluções Reconexão estratégica, workshops, consultoria pró-ativa
3 Parceiros Estratégicos Grandes empresas, perfil diversificado Extremo Alta Baixo Confiança, segurança e visão de longo prazo Atendimento "Concierge", contato executivo dedicado, alinhamento estratégico
4 Clientes Padrão Pequeno porte, perfil diversificado Moderado Média-Alta Ativo Estabilidade, confiança e evolução gradativa Relacionamento contínuo, upsell e suporte consultivo
5 Super-Usuários de Elite Grande porte, nicho em Educacional Muito Alto Muito Alta O mais alto Ser reconhecido e influenciar o roadmap Fidelização com programas de "embaixadores", co-criação de features
6 Usuários Intensivos Grande porte, foco em Manufatura Alto Alta Alto Suporte rápido e especializado (SLA) Sucesso do Cliente proativo, canal de suporte premium, consultoria
7 Novos Exploradores Pequeno porte de serviços e varejo Baixo Muito Baixa Alto Orientação e educação para ver valor rápido Nutrição e Onboarding, trilhas de sucesso, campanhas de cross-sell

🗃️ Kanban  

Organização do projeto no Trello: Kanban  

📊 DataViz  

Dashboard interativo no Power BI: Power BI  

🧑‍💻 Tecnologias  

  • Linguagem: Python (pandas, numpy, scikit-learn, seaborn, matplotlib).  
  • Infraestrutura: AWS (S3, Athena, Glue, Lakehouse).  
  • Visualização: Jupyter Notebook, Power BI.  
  • Versionamento: Git & GitHub.  

✅ Status Final  

  • Projeto concluído.  
  • Modelo BGMM validado e aplicado com sucesso.  
  • 8 Personas definidas e disponíveis em dashboard interativo.  
  • Entregues insights estratégicos para ações de retenção, satisfação e expansão da base de clientes.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors