Lucas Vinicius
Lucas Vinicius Oliveira Silva
Python | Data Analyst
23 anos Recife, PE — Brasil Física — UFPE

Transformo dados em decisões por meio de análise estatística e Machine Learning

Analista de Dados com sólida base em estatística e foco em visualização de dados, aliado à experiência em Machine Learning para geração de insights estratégicos e apoio à tomada de decisão.

lucas@portfolio:~ perfil.py
# Portfólio — Lucas Vinicius Oliveira Silva

class DataAnalyst:

  def __init__(self):
    self.nome       = "Lucas Vinicius Oliveira Silva"
    self.titulo     = "Python | Data Analyst"
    self.idade      = 23
    self.localizacao = "Recife, PE — Brasil"
    self.faculdade  = "Física (bacharelado) — UFPE"
    self.disponivel = True

lucas = DataAnalyst()
# sobre mim
# habilidades
# stack de ferramentas
// projetos 4 ativos
aprovacao_credito.py ● LIVE
MACHINE LEARNING · CLASSIFICAÇÃO · REGRESSÃO
Aprovação de Crédito com ML
SOBRE O PROJETO

Automatiza a análise de empréstimos utilizando técnicas de Machine Learning, prevendo a aprovação e estimando a taxa de juros de acordo com o perfil do cliente. O projeto combina um modelo de classificação para a decisão de aprovação com um modelo de regressão para precificação de risco, baseando todas as decisões em dados quantitativos.

PythonScikit-learnRandomForestRegressão LinearFastAPIPandasMatplotlib
Dashboard Loan
Random Forest
Ensemble de árvores de decisão para classificação de aprovação/negação com alta precisão.
Regressão Linear
Estima a taxa de juros proporcional ao risco real de cada cliente após a aprovação.
FastAPI
Aplicação backend para servir o modelo, recebendo os dados do cliente como entrada e retornando em tempo real a decisão de aprovação junto com a taxa de juros estimada.
RESULTADOS
Regras de negócio identificadas: idade mínima de 24 anos, score mínimo de 550, desempregados e clientes com mais de duas inadimplências não são aprovados, e comprometimento de renda acima de 50% reduz drasticamente as chances de aprovação.
As variáveis mais relevantes para a classificação foram score de crédito, status de emprego, histórico de inadimplências e percentual de renda comprometida.
A taxa de juros é influenciada principalmente pelo comprometimento de renda, existência de empréstimos ativos, número de parcelas definidas e score de crédito do cliente.
dashboard_vendas.py ● LIVE
BUSINESS INTELLIGENCE · SQL ANALYSIS · DATA VISUALIZATION
Análise de Vendas — Dashboard & SQL
SOBRE O PROJETO

Projeto dual de análise de vendas: dashboard executivo interativo no Power BI e análise SQL completa via SQLAlchemy e Pandas. O dashboard entrega visão rápida para gestores, enquanto a análise SQL aprofunda com queries analíticas e visualizações prontas para apresentação. 247 mil transações consolidadas em 4 anos.

Power BIDAXPower QuerySQLAlchemyPandasMatplotlibSeaborn
Dashboard Churn Bancário
Power BI + DAX
Dashboard com medidas dinâmicas de lucro, ticket médio e receita.
SQLAlchemy
Queries analíticas diretamente em Python sem exportar dados.
Pandas
Transformação dos resultados SQL em DataFrames para análise.
Power Query
ETL integrado — limpeza e transformação automática dos dados.
RESULTADOS
KPIs estratégicos desenvolvidos para monitorar o desempenho comercial: ticket médio, margem de lucro (%), quantidade vendida, gastos operacionais, faturamento e receita líquida.
Gráficos interativos com filtros dinâmicos por período, região e categoria de produto, permitindo análises segmentadas em tempo real.
Ranking de desempenho dos produtos e marcas mais vendidas, facilitando decisões de portfólio e estratégias de estoque.
churn_bancario.py ● LIVE
MACHINE LEARNING · CLASSIFICAÇÃO
Análise de Churn Bancário
SOBRE O PROJETO

Identifica clientes com alta probabilidade de cancelamento antes que saiam, permitindo ações proativas de retenção. Conta com um dashboard interativo em React que possibilita visualizar os principais fatores que levam ao cancelamento, trazendo transparência e apoio direto à tomada de decisão.

XGBoostMLflowSMOTESklearnReactPythonSeaborn
Dashboard Churn
XGBoost
Gradient boosting — alta precisão com dados desbalanceados.
MLflow
Rastreamento automático de experimentos, métricas e parâmetros.
SMOTE
Balanceamento sintético da classe minoritária.
React + Vercel
Dashboard interativo com deploy em produção.
RESULTADOS
Variáveis como histórico de reclamações, score de satisfação, nível de atividade e tempo de relacionamento demonstraram alto poder preditivo para identificar clientes em risco de cancelamento.
Clientes insatisfeitos representam o grupo com maior propensão ao churn, indicando que estratégias de retenção e engajamento direcionadas a esse perfil podem reduzir significativamente a evasão.
A variável risco_composto — criada a partir de uma combinação ponderada de indicadores — apresentou correlação de 60% com os clientes que efetivamente cancelaram o serviço.
segmentacao_clientes.py
MACHINE LEARNING · CLUSTERIZAÇÃO · E-COMMERCE
Quem são seus clientes? Segmentação Inteligente com RFM
SOBRE O PROJETO

A segmentação de clientes é uma das estratégias mais importantes para empresas de e-commerce, permitindo compreender diferentes perfis de consumo, otimizar campanhas de marketing, melhorar retenção e aumentar o valor do cliente ao longo do tempo. Neste projeto, foi aplicada a metodologia RFM (Recency, Frequency, Monetary) combinada com técnicas de clusterização não supervisionada para segmentar clientes de um e-commerce real, utilizando o dataset Online Retail.

PythonKMeansPCARFMScikit-learnPandasMatplotlib
Segmentação comportamental
Segmentar clientes com base no comportamento de compra.
Identificar perfis
Identificar clientes VIP, regulares e inativos.
Estratégias de negócio
Apoiar ações de retenção, reativação e fidelização com insights acionáveis.
RFM + PCA + KMeans
Metodologia RFM combinada com redução dimensional e clusterização.