ANTONIO SERGIO C. DE C. JUNIOR
Resumo
Graduando em Análise e Desenvolvimento de Sistemas (FGV) com foco em dados e inteligência
artificial. Experiência prática em pipelines de dados, ETL, modelagem preditiva e dashboards de BI.
Já construí pipeline completo no Databricks com arquitetura medallion e modelo de predição de churn
bancário com XGBoost e simulação de ROI.
Competências Técnicas
- Dados e IA: Python (pandas, scikit-learn, XGBoost, matplotlib, seaborn), PySpark, SQL/PostgreSQL, ETL/ELT, machine learning (classificação, regressão), séries temporais, sistemas de recomendação, SHAP, SMOTE
- Deep Learning / Visão Computacional: PyTorch, OpenCV, Ultralytics YOLO11, CLIP (Hugging Face Transformers), Gradio
- Plataformas: Databricks (Delta Lake, Unity Catalog), Google Colab, Jupyter/VS Code, Streamlit, Hugging Face Spaces
- Business Intelligence: Power BI, DAX, Power Query
- APIs e LLMs: Gemini, Claude, engenharia de prompts, prompt chaining, LangChain, RAG, LangGraph
- Ferramentas: Git/GitHub
- Idiomas: Inglês intermediário/avançado (leitura e escrita técnica; conversação intermediária)
Experiência
Residente em Tecnologia | Programa EmbarcaTech (Softex & MCTI)
Projeto com a GASMAR - Companhia Maranhense de Gás | 03/2025 – 03/2026
- Desenvolvimento de dashboards em Power BI para acompanhamento de ~800 Ordens de Serviço/mês da companhia.
- Processos de ETL consumindo API do sistema de manutenção (Fracttal), com tratamento em Power Query e DAX.
- Estruturação de indicadores operacionais (tempo médio de atendimento, backlog, cumprimento de SLA).
Bolsista em Análise de Dados | SECTI-MA
Secretaria de Ciência, Tecnologia e Inovação do Maranhão | 01/2025 – 07/2025
- Coleta, limpeza e estruturação de dados para projetos da secretaria.
- Criação de relatórios analíticos com Python e ferramentas de BI para apoio a decisões internas.
Formação
- Análise e Desenvolvimento de Sistemas (EAD) | Fundação Getulio Vargas | Em andamento | Previsão: 2028
- Data Science + IA (360h) | Programa Oracle Next Education (Alura) | Concluído | 01/2025 – 12/2025
- Capacitação em IA (360h) | FDTE/USP | Concluído | 10/2025 – 02/2026
- Técnico em Manutenção e Suporte em Informática | IFSULDEMINAS | Concluído | 2024 – 2025
Projetos
Pipeline de Dados — LH Nautical | Databricks, PySpark, Delta Lake, Streamlit
Desafio técnico do Programa Lighthouse (Indicium) — pipeline de dados ponta a ponta para empresa de varejo náutico.
- Construí arquitetura medallion (Bronze → Silver → Gold) no Databricks com Unity Catalog, aprendendo a stack do zero para o desafio.
- Integrei a API PTAX do Banco Central para cálculo de custos reais em BRL, revelando margem real de -5,3% (R$-139M de prejuízo) — insight invisível sem essa integração.
- Comparei 5 modelos de previsão de demanda (Naive Sazonal venceu com MAPE 8,1%) e implementei sistema de recomendação com 3 abordagens + variante ajustada por margem.
- Entrega: 10 notebooks documentados, dashboard Streamlit deployado, relatório executivo.
- Repositório: github.com/ASCCJR/Indicium_LH_Nautical
Modelo de Predição de Churn Bancário | Python, scikit-learn, XGBoost, SHAP
Modelo de classificação para prever cancelamento de clientes bancários (10.000 registros).
- Detecção e remoção de Data Leakage (variável Complain com ~99% de correlação com a target).
- Comparação de 3 modelos via cross-validation estratificada (5-fold); XGBoost selecionado por melhor equilíbrio Recall/AUC.
- Threshold tuning (50% → 30%), interpretabilidade com SHAP e simulação de ROI (+R$655k vs. R$2M de perda sem modelo).
- Repositório: github.com/ASCCJR/One-Bank-Churn-Prediction
Visão Computacional — People Analytics & App Interativo | Python, YOLO11, OpenCV, CLIP, PyTorch, Gradio
Trilha de Visão Computacional (FDTE/USP): projeto autoral de negócio + app publicado, sobre um caderno cobrindo toda a trilha.
- Projeto autoral "People Analytics" (varejo): pipeline que transforma vídeo de câmera em fact table + KPIs (footfall, ocupação, dwell time, conversão), com dashboard e anonimização de rostos (LGPD).
- 4 desafios resolvidos (blur, reconhecimento facial, object tracking, pose estimation) e caderno cobrindo detecção (YOLO), segmentação (SAM/DeepLab), GANs, CLIP e MLOps (TensorBoard).
- App interativo "CV Playground" no Hugging Face Spaces: huggingface.co/spaces/asccjr/cv-playground
- Repositório: github.com/ASCCJR/caderno-visao-computacional
Análise Exploratória — Online Retail | Python, pandas, matplotlib
EDA completa sobre dataset UCI Online Retail (541k transações, 38 países).
Chatbot NLP para E-commerce | Python, spaCy, scikit-learn, Gradio
Chatbot de atendimento ao cliente com classificação de intenção por NLP, deployado no Hugging Face Spaces.
Certificações
- Oracle Cloud Infrastructure 2025 Certified Data Science Professional
- Oracle Cloud Infrastructure 2025 Certified Foundations Associate
- Formação em Estatística e Machine Learning — Alura/ONE
- Formação em IA Generativa — Alura/ONE
- Formação em ETL — Alura/ONE