Skip to content

pedrodumont/data-engineering-roadmap

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

235 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Roadmap de Engenharia de Dados

Jornada de Dados

Nossa missão é fornecer o melhor ensino em engenharia de dados

Bem-vindo ao Roadmap de Engenharia de Dados da Jornada de Dados! Este repositório foi construído colaborativamente e tem como objetivo capacitá-lo para a carreira de engenharia de dados, ajudando profissionais como você a atingir novos patamares em sua trajetória profissional.

Aqui você encontrará:

  • Roadmap de Estudo: Links, referências e materiais complementares para auxiliar no seu aprendizado. Se você quer ter um plano de estudo, você encontra uma série de projetos e recursos que o guiarão passo a passo no desenvolvimento das habilidades essenciais em engenharia de dados.
  • Códigos das Aulas: Todos os códigos e materiais utilizados durante as aulas estão disponíveis neste repositório para que você possa praticar e aprofundar seu conhecimento.
  • Calendário dos Próximos Encontros: Fique por dentro das datas e temas dos próximos workshops e bootcamps da Jornada de Dados.

Se você gostou do conteúdo e quer se inscrever em nosso programa profissional, pode fazer isso aqui:

Índice

  1. Comece por aqui
  2. Os primeiros 7 dias
  3. Projetos no Youtube
  4. Bootcamps Disponíveis
  5. Workshops
  6. Metodologia
  7. Detalhes das Aulas
  8. Pré-requisitos
  9. Plataforma e Autonomia
  10. Dúvidas

Comece por aqui

Bem-vindo à Jornada de Dados! Antes de mergulharmos nos conteúdos avançados, é essencial que você tenha seu ambiente de desenvolvimento devidamente configurado. O objetivo é que, em aproximadamente 1 hora, você esteja pronto para assistir às aulas no YouTube e participar das atividades práticas da Jornada de Dados.

Ter um ambiente bem configurado facilitará seu aprendizado e permitirá que você se concentre nos conceitos e práticas da engenharia de dados, sem se preocupar com problemas técnicos. Vamos começar?

Imagem Skills Objetivo YouTube
parte_01 Python, Git, GitHub e VSCode Tutorial de como configurar um ambiente de desenvolvimento para engenharia de dados com foco no mercado de trabalho. Link para o vídeo
parte_02 Python, Pyenv, PIP, VENV, PIPX e Poetry Segunda parte do tutorial de como configurar um ambiente de desenvolvimento para engenharia de dados com foco no mercado de trabalho. Link para o vídeo

Workshops

Workshops é uma imersão ao vivo sobre determinada ferramenta, onde você pode tirar dúvidas e aprender em grupo.

Imagem Skills Objetivo Repositório
Github Git e Github Aprenda a trabalhar em equipe de dados de forma mais eficiente Link
Workshop 1 Como estruturar o seu projeto de dados do zero Aprenda a estruturar projetos de dados de forma eficiente desde o início. Link
Workshop 2 Do Jupyter Notebook Pro Deploy Descubra como transformar notebooks em aplicações prontas para deploy. Link
Workshop 3 Como construir um DW barato Saiba como construir um Data Warehouse de baixo custo com ferramentas acessíveis. Link
Workshop 6 Pydantic, Data Quality e TDD em dados Utilize Pydantic para garantir a qualidade e integridade dos dados em seus projetos. Link
Workshop 6 Docker para analista e engenheiro de dados Aprenda a utilizar Docker para criar ambientes isolados e facilitar o deploy de aplicações de dados. Link
Workshop 8 Orquestrando suas ETLs com Airflow Aprenda a orquestrar e agendar seus pipelines ETL utilizando o Apache Airflow. Link
Workshop 11 REST API FastAPI Deploy Desenvolva e faça deploy de APIs REST utilizando FastAPI. Link
Workshop 12 Amazon SQS e Lambda Integre serviços da AWS como SQS e Lambda em seus projetos de dados. Link
Workshop 10 Kafka Streaming data processing Processamento de dados em tempo real utilizando Apache Kafka. Link
Workshop 16 Streamlit Dashboard Crie dashboards interativos para visualização de dados utilizando Streamlit. Link
Workshop 12 Terraform Automatize a sua infraestrutura com Terraform. Link
Workshop 17 Extração de dados em PDF e Regex Aprenda técnicas de extração de dados de PDFs e uso de expressões regulares. Link

Bootcamps Jornada de Dados

Aqui estão todos os bootcamps disponíveis na Jornada de Dados:

Acesso e início Bootcamp Carga Horária Link GitHub Status
Acesso Imediato Python para Dados 30 horas Link Concluído
Descrição: Aprenda os fundamentos de Python aplicados à engenharia de dados, incluindo bibliotecas como Pandas e NumPy, manipulação e limpeza de dados.
Acesso Imediato SQL para Analytics Engineer 20 horas Link Concluído
Descrição: Domine conceitos avançados de SQL necessários para um Analytics Engineer, incluindo consultas complexas e otimização de desempenho.
Acesso Imediato dbt-core 10 horas Link Concluído
Descrição: Utilize o dbt-core para transformar dados em seu data warehouse, implementando práticas modernas de engenharia de dados.
Acesso Imediato Web Scraping Avançado 10 horas Link Concluído
Descrição: Aprenda técnicas avançadas de web scraping, extração de dados de sites complexos e manipulação de APIs.
Acesso Imediato Power BI -- horas Link Em andamento
Descrição: Explore o Power BI para criar dashboards interativos e análises visuais de dados.
Início 22/08 Cloud para Dados 30 horas Link Em andamento
Descrição: Conheça os serviços de nuvem aplicados à engenharia de dados nas plataformas AWS, Azure e GCP, e implemente soluções escaláveis.
Janeiro Multi-engine ETL com Spark e DuckDB 20 horas Link Previsto para Janeiro
Descrição: Agendado para janeiro, este bootcamp ensinará como construir pipelines ETL utilizando múltiplos engines como Spark e DuckDB.

Metodologia

Acredito no ensino ao vivo, temos aulas todas as terças, YouTube e Bootcamps, e no último sábado do mês.

Os encontros são aos sábados às 9 horas, com duração de 4 horas.

Pré-requisitos

Para você aproveitar ao máximo do curso, é importante que você se sinta confortável com SQL e tenha experiência com Python. Idealmente, você deve ter entre 1 e 2 anos trabalhando com dados.

Caso você não tenha essa experiência, será necessário estudar bastante SQL e Python em paralelo. Recomenda-se ao menos 1 hora por dia de estudos além dos workshops.

Mas fique tranquilo, temos o nosso Bootcamp de 100 dias de Python e SQL para te colocar em forma.

Aqui é o lugar certo para aprender Python e SQL voltado para a engenharia de dados.

Plataforma e Autonomia

Você pode acessar nossa plataforma, que disponibiliza um ambiente amigável para acessar todo o material do curso.

Possui dúvidas?

About

roadmap de engenharia de dados da jornada 2024

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Python 96.9%
  • HTML 1.5%
  • Other 1.6%