Logo do curso
Curso

Projeto ciência de dados:

exploração, modelagem e apresentação

Quero estudar na alura

12h

Para conclusão

8

Pessoas nesse curso

Certificado

De participação

Introdução_

O que você aprenderá_

  • Analise de forma crítica conjuntos de dados e extraia insights relevantes para decisões de negócio.
  • Realize engenharia de features e trate variáveis categóricas e numéricas para melhorar a performance dos modelos.
  • Aplique técnicas de balanceamento e validação cruzada para treinar modelos mais robustos.
  • Treine e ajuste modelos de classificação, incluindo o uso de LightGBM e a otimização de threshold.
  • Avalie modelos com métricas adequadas e interprete matrizes de confusão e resultados para tomada de decisão.
  • Construa uma aplicação interativa em Streamlit para simular cenários, ajustar parâmetros e apresentar visualizações.

Público alvo_

Profissionais, estudantes e entusiastas de dados que já possuem conhecimentos básicos em Python e desejam aplicar machine learning, visualização e deploy em um projeto real usando AWS e Streamlit.

Letícia Pires

Letícia Pires

github

linkedin

Instrutora de dados e Fundadora do Pomodoki

Curso atualizado em 08/06/2026

Ementa

  1. Configurando o ambiente e analisando os dados

    • Apresentação
    • Preparando o ambiente
    • Preparando o ambiente: Cursor
    • Primeiros Passos Ambiente, Git e Cloud
    • Conectando Python ao AWS S3
    • Analisando variáveis qualitativas
    • Continuando análises variáveis qualitativas
    • Análise variáveis quantitativas
    • Para saber mais: np.where para labels dinâmicas
    • Analisando picos de transações no Bytebank
    • Configurando acesso ao AWS S3 na Indexa
    • O que aprendemos?
  2. Preparação dos dados para Machine Learning

    • Divisão dos dados
    • Pré-processamento e feature engineering variáveis categóricas
    • Pré-processamento e feature engineering variáveis numéricas
    • Balanceamento de classes
    • Para saber mais: desbalanceamento de classes
    • Para saber mais: consistência entre treino e teste
    • Prevenindo vazamento de dados na Organo
    • Estratégias de codificação para personalização de conteúdo em WaveCast
    • O que aprendemos?
  3. Escolhendo o melhor modelo

    • Rodando o primeiro modelo
    • Testando o LazyClassifier
    • Modelagem pré-ligação
    • Cross validation dos melhores candidatos
    • Para saber mais: pandas styles para realçar resultados
    • Otimização de tarefas na plataforma Checklist
    • Escolhendo o modelo ideal para prever a demanda de produtos no Gatito Petshop
    • O que aprendemos?
  4. Análise final do modelo e threshold de negócio

    • Analisando modelo final
    • Salvando artefatos no S3
    • Limiar de decisão (threshold)
    • Identificando limiar ideal
    • Simulação com novos clientes
    • Para saber mais: custo de oportunidade na análise de lucro
    • Avaliando riscos de segurança em Techsafe
    • Ajustando thresholds para campanhas de empréstimo no SwiftBank
    • O que aprendemos?
  5. Construindo dashboard iterativo com Streamlit

    • Configuração inicial Streamlit
    • Aba análise exploratória
    • Aba definição do ponto de corte
    • Aba modelagem
    • Matriz de confusão
    • Aba de Inferência do cliente
    • Para saber mais: Para saber mais: divisão de layouts com colunas no Streamlit
    • Projeto
    • Conclusão
    • O que aprendemos?

Descubra se esse curso é pra você! Leia as primeiras aulas

Comece essa formação agora mesmo e capacite-se para seu próximo projeto!

Conheça os planos
Escola

Data Science

Trabalhe com dados. Aprofunde seu conhecimento nas principais ferramentas de uma pessoa data scientist. Descubra as diferentes possibilidades de análise de dados, do Excel ao Python, e mergulhe em frameworks e bibliotecas, como Pandas, Scikit-Learn e Seaborn.

Conheça a escola

Faça parte da nossa comunidade no discord!

Troque conhecimentos com a comunidade da Alura

Aprenda Data Science com esse e outros cursos, comece agora!

Conheça os Planos para Empresas