O Arcana é um projeto de análise e clusterização de clientes da TOTVS, com o objetivo de identificar perfis semelhantes, compreender padrões de satisfação e uso, e gerar insights estratégicos para retenção e crescimento.
O projeto abrangeu desde a ingestão e organização dos dados em camadas até a aplicação de modelos de clusterização baseados em Gaussian Mixture Models Bayesianos (BGMM), resultando na criação de 8 personas de clientes que apoiam estratégias de personalização e relacionamento.
Assista ao nosso pitch de 5 minutos apresentando a solução, as personas e os resultados estratégicos do projeto.
- Consolidar uma visão 360º do cliente, integrando informações contratuais, de suporte, NPS e telemetria.
- Realizar análises exploratórias (EDA) para identificar padrões, hipóteses e direcionar a clusterização.
- Desenvolver e validar modelos de clusterização (BGMM) para agrupar clientes com base em perfil, comportamento e satisfação.
- Criar personas representativas dos clusters obtidos, facilitando a definição de estratégias específicas.
- Fornecer insights acionáveis para retenção, satisfação e crescimento.
- Construir dashboards interativos para visualização e monitoramento contínuo.
- Dados cadastrais: informações contratuais, produtos, segmentos, faturamento.
- Tickets de suporte: chamados abertos, SLA, prioridade e resolutividade.
- NPS transacional e relacional: produto, implantação, onboarding, aquisição e suporte.
- Dados de telemetria: uso de módulos, duração de eventos, status de licença.
- Histórico de contratações e MRR.
- Ingestão de dados na camada bronze (CSV bruto).
- Criação da camada silver (dados tratados e padronizados).
- Análises exploratórias (EDA).
- Engenharia de atributos para clusterização.
- Desenvolvimento e validação do modelo BGMM para definição dos clusters.
- Construção das personas a partir dos clusters.
- Construção de dashboards interativos no Power BI.
- Análise, documentação final e publicação dos resultados.
O projeto está organizado da seguinte forma para garantir a clareza e a reprodutibilidade do processo:
dados/: Contém os scripts de ETL para movimentação e transformação dos dados.raw/: Script responsável pela ingestão inicial dos dados brutos na camada Bronze.curated/: Script de ETL que limpa, padroniza e transforma os dados da camada Bronze para a camada Silver, deixando-os prontos para análise.
notebooks/: Contém os notebooks Jupyter e scripts com toda a análise exploratória e o desenvolvimento do modelo.analise_bronze.ipynb: Análise exploratória (EDA) básica para entendimento inicial dos dados, dando insumos para as tranformações iniciais.analise_exploratoria.ipynb: Análise exploratória para entendimento mais abrangente dos dados dados.clusterizacao.ipynb, clusterizacao_GMM.ipynb, testes_clusterizacao.ipynb,: Notebooks onde realizamos testes de diferentes modelos de Clusterização e avaliamos os resultados.clusterizacao_final.py: Script com o desenvolvimento do modelo final, agregando engenheria de Feature e clusterização com BGMM.acessar_dados_curated.py: Script suporte para a consulta das tabelas da camada Silver (Curated) na AWS.acessar_dados_raw.py: Script suporte para a consulta das tabelas da camada Bronze (Raw) na AWS.
- Modelo de Clusterização: Gaussian Mixture Bayesian (BGMM), escolhido por sua capacidade de lidar com incerteza e determinar automaticamente o número ótimo de clusters.
- Clusters obtidos: foram definidos 8 clusters principais que representam diferentes perfis de clientes.
- Personas criadas: cada cluster foi traduzido em uma persona acionável, facilitando a comunicação dos resultados para áreas de negócio.
- Dashboard no Power BI: consolidou informações dos clusters e personas, possibilitando acompanhamento contínuo e interativo.
A clusterização via BGMM resultou em 8 grupos principais de clientes, traduzidos em personas estratégicas. Abaixo estão as 8 personas identificadas:
| Cluster | Persona | Perfil / Segmento | Valor | Lealdade | Engajamento | Necessidades / Dores principais | Ação Recomendável |
|---|---|---|---|---|---|---|---|
| 0 | Clientes Adormecidos | Pequeno porte de serviços e varejo | Mais baixo | Média-Baixa | Nulo | Retomar contato e oferecer relevância | Campanhas de reativação, ofertas personalizadas, contato humano |
| 1 | VIPs da Indústria | Grande porte, concentrado em manufatura | Muito Alto | Alta | Ativo | Suporte premium, parceria estratégica | Gestão de contas (KAM), reuniões executivas, suporte técnico diferenciado |
| 2 | Veteranos em Manutenção | Perfil demográfico diversificado | Moderado | Alta | Nulo | Reforçar o valor de novas soluções | Reconexão estratégica, workshops, consultoria pró-ativa |
| 3 | Parceiros Estratégicos | Grandes empresas, perfil diversificado | Extremo | Alta | Baixo | Confiança, segurança e visão de longo prazo | Atendimento "Concierge", contato executivo dedicado, alinhamento estratégico |
| 4 | Clientes Padrão | Pequeno porte, perfil diversificado | Moderado | Média-Alta | Ativo | Estabilidade, confiança e evolução gradativa | Relacionamento contínuo, upsell e suporte consultivo |
| 5 | Super-Usuários de Elite | Grande porte, nicho em Educacional | Muito Alto | Muito Alta | O mais alto | Ser reconhecido e influenciar o roadmap | Fidelização com programas de "embaixadores", co-criação de features |
| 6 | Usuários Intensivos | Grande porte, foco em Manufatura | Alto | Alta | Alto | Suporte rápido e especializado (SLA) | Sucesso do Cliente proativo, canal de suporte premium, consultoria |
| 7 | Novos Exploradores | Pequeno porte de serviços e varejo | Baixo | Muito Baixa | Alto | Orientação e educação para ver valor rápido | Nutrição e Onboarding, trilhas de sucesso, campanhas de cross-sell |
Organização do projeto no Trello: Kanban
Dashboard interativo no Power BI: Power BI
- Linguagem: Python (pandas, numpy, scikit-learn, seaborn, matplotlib).
- Infraestrutura: AWS (S3, Athena, Glue, Lakehouse).
- Visualização: Jupyter Notebook, Power BI.
- Versionamento: Git & GitHub.
- Projeto concluído.
- Modelo BGMM validado e aplicado com sucesso.
- 8 Personas definidas e disponíveis em dashboard interativo.
- Entregues insights estratégicos para ações de retenção, satisfação e expansão da base de clientes.