Data Scientist em formação

Transformo dados em
decisões inteligentes.

Análise exploratória, machine learning e visualização de dados aplicados a problemas reais — do zero ao modelo em produção.

3
Projetos publicados
0.756
Score Titanic · Kaggle
0.249
Score House Prices · Kaggle
0.947
AUC-ROC · Fraud Detection
Portfólio

Projetos

Projetos construídos com dados reais, decisões justificadas e código documentado.

🚢
Score 0.756 · Top 11k Kaggle
Análise Preditiva — Titanic

Análise exploratória completa com Pandas, feature engineering (FamilySize, Deck, Title) e modelo Random Forest com 83% de acurácia. EDA profunda com distinção entre probabilidade e representatividade.

Python Pandas Scikit-learn Random Forest Feature Engineering Matplotlib
🏠
Score 0.249 · Top 4k Kaggle
Previsão de Preços — House Prices

Regressão com Ridge aplicada a 79 variáveis. Pipeline completo: tratamento semântico de nulos, feature engineering (TotalArea, TotalBath, HouseAge), encoding, diagnóstico de resíduos e análise de coeficientes. RMSE de $24.588 — ~15% da mediana do dataset.

Python Pandas Scikit-learn Ridge Regression Feature Engineering Matplotlib
💳
AUC-ROC 0.947 · F1 0.87 · Precision 93%
Detecção de Fraude — Credit Card Fraud

Classificação binária com severo desbalanceamento de classes (0.17% fraudes). Pipeline completo: PCA analysis, feature engineering (Time→Hour, Amount→log), comparação de estratégias (class_weight vs SMOTE) e decisão de threshold guiada por regra de negócio.

Python Scikit-learn Random Forest SMOTE AUC-ROC Dados Desbalanceados

Construindo raciocínio,
não receitas.

Sou Abilio Fernandes, profissional em transição para Data Science com foco em resolver problemas reais — não em decorar funções.

Minha abordagem parte do entendimento profundo dos dados antes de qualquer modelo: limpeza criteriosa, análise exploratória honesta, e decisões sempre justificadas.

Tenho especial atenção à integridade dos dados — nunca apresento uma taxa sem o volume que a sustenta, nunca confundo correlação com causalidade.

Python Pandas NumPy Scikit-learn Matplotlib Seaborn Random Forest Ridge Regression Feature Engineering Transformações Log Análise de Resíduos AUC-ROC SMOTE Dados Desbalanceados Jupyter Git
Análise Exploratória
Avançado
Feature Engineering
Intermediário-avançado
Machine Learning
Intermediário
Visualização de Dados
Intermediário
Contato

Vamos conversar

Disponível para projetos, oportunidades e colaborações em Data Science e IA.

abilio@abilioai.com.br