CAIO BARRETO DE ALBUQUERQUE · ENGENHEIRO DE SOFTWARE · RECIFE, BRASIL

Construo a engenharia por trás de IA em produção.

Hoje isso significa um assistente multi-tenant com RAG e isolamento estrito por hotel: o backend de um produto de IA para hotelaria que desenvolvo de ponta a ponta.

Ver o trabalho GitHub ↗

TRABALHO / CASE STUDIES

CASE 01

STATUS flagship · em desenvolvimento ativo

PERÍODO 2025 · 2026

CÓDIGO privado

STACK

FastAPI
Python
RAG
JWT
DynamoDB

IA para operação hoteleira

Assistente de atendimento a hóspedes, multi-tenant, com isolamento estrito por hotel.

PROBLEMA

Hotéis atendem hóspedes em escala com equipes pequenas, e cada resposta depende de conteúdo específico daquele hotel: cardápios, horários, parceiros, políticas. Em um sistema multi-tenant com LLM, o risco central é um hotel receber, por engano, informação de outro. O isolamento precisa ser garantia de arquitetura, não promessa de prompt.

DECISÕES TÉCNICAS

01.

O tenant nunca vem do cliente. A sessão nasce em um endpoint de bootstrap que valida a tenant_key e devolve um JWT de curta duração; o chat lê o hotel_id apenas das claims do token.

02.

O retrieval exige hotel_id por contrato: não existe busca global no índice vetorial. O isolamento entre hotéis é estrutural, imposto na assinatura da função, não uma convenção.

03.

Conteúdo de parceiros entra por allowlist por hotel, com upload e publicação como etapas separadas de um fluxo administrativo.

04.

Modelagem em DynamoDB (PK/SK e GSIs) desenhada para consulta por tenant desde o primeiro dia, não adaptada depois.

RESULTADO

Em desenvolvimento ativo. O sistema de reservas que complementa o assistente está descrito no case 04.

[MÉTRICA: hotéis no piloto] [MÉTRICA: % de atendimentos resolvidos sem humano] [MÉTRICA: latência p95 do chat]

CASE 02

CONTEXTO MVP solo · 2026

CÓDIGO privado

STACK

Next.js 14
Firestore
AI SDK
Zod

Reinvent Flow · copiloto financeiro preditivo

Forecast de fluxo de caixa pessoal com simulador conversacional que não inventa números.

PROBLEMA

Um copiloto financeiro só é útil se o usuário confiar nos números. A pergunta que a arquitetura inteira responde: como garantir que o LLM nunca chute um valor?

DECISÕES TÉCNICAS

01.

Fronteira rígida entre IA e determinístico: se a saída é número, é TypeScript puro e testável (projeção P10/P50/P90 dia a dia, detecção de recorrências por cadência e desvio). O LLM produz apenas texto.

02.

Simulador por tool calling: o modelo orquestra funções determinísticas (projeção, cenário, recorrências), com no máximo 4 tool calls por turno e retornos validados com Zod.

03.

Nudges disparam por regras determinísticas com sourceRule rastreável; o LLM só formata título e corpo, com fallback estático se falhar.

04.

Dados seed com RNG de semente fixa: três perfis com arcos narrativos de 180 dias, reproduzíveis em qualquer rebuild.

RESULTADO

MVP navegável com três fluxos completos: dashboard com banda de incerteza, simulador conversacional e nudges priorizados. A camada de IA é abstraída atrás do AI SDK: trocar o provider é alterar um import.

[MÉTRICA: uso em sessões de teste]

CASE 03

CONTEXTO TCC · CESAR School · 2025 · 2026

CÓDIGO privado

STACK

Python
scikit-learn
SARIMAX
XGBoost
Streamlit

Previsão da inflação de veículos no Brasil

Modelos econométricos contra aprendizado de máquina sobre o IPCA Automóvel Novo.

PROBLEMA

Prever a variação mensal do subíndice IPCA Automóvel Novo (IBGE, código 5102001) em horizontes de 1, 3 e 6 meses, a partir de indicadores macroeconômicos e do setor automotivo: Selic, câmbio, crédito veicular, produção ANFAVEA, IBC-Br.

DECISÕES TÉCNICAS

01.

Backtesting honesto: janela expansível com passo de 1 mês, mínimo de 60 meses de treino e janela de teste única (fev/2021 a dez/2025) para todos os modelos.

02.

Defasagem de divulgação aplicada às exógenas (IBC-Br e crédito com 2 meses, ANFAVEA com 1) para impedir vazamento de informação futura.

03.

Pré-processamento dentro de Pipeline com GridSearchCV e TimeSeriesSplit, eliminando vazamento do scaler na validação cruzada.

04.

Dummies de COVID definidas por detecção de quebra estrutural (Pelt), não a olho; robustez verificada em sub-período pré-pandemia.

RESULTADO

A combinação com pesos rolantes (Naïve + LASSO + SARIMAX) alcança RMSE médio de 0,8333 contra 1,0387 do baseline Naïve, com superioridade estatística (Diebold-Mariano a 10%) nos horizontes de 3 e 6 meses. Base de 132 observações mensais (2015 a 2025) coletadas de SIDRA, BCB e IPEA, com dashboard de resultados em Streamlit.

CASE 04

CONTEXTO MVP · hotelaria · 2025

CÓDIGO privado

STACK

Next.js 14
Prisma
NextAuth
Zod

Sistema de reservas para hotelaria

O ciclo completo: disponibilidade, reserva, pagamento e check-in na recepção.

PROBLEMA

Cobrir o fluxo operacional de um hotel de ponta a ponta: disponibilidade por quarto e data, reserva com pagamento, lista do dia na recepção e administração de bloqueios de agenda.

DECISÕES TÉCNICAS

01.

Disponibilidade calculada no servidor, em rota dedicada por quarto e intervalo; o cliente nunca decide o que está livre.

02.

Áreas separadas por papel: hóspede (reserva e pagamento), recepção (check-in e lista do dia) e admin (bloqueio de slots), cada uma com suas próprias rotas de API.

03.

Validação com Zod nas bordas da API e autenticação com NextAuth (credentials e bcrypt).

RESULTADO

MVP funcional cobrindo reserva, pagamento, confirmação e check-in. É a contraparte operacional do assistente do case 01: juntos formam o produto de hotelaria.

CASE 05

CONTEXTO acadêmico · 2025

CÓDIGO github ↗

STACK

PyTorch
OpenCV
Python

Segmentação de imagens: deep learning contra K-Means

Quando a rede convolucional compensa, e quando o clássico basta.

PROBLEMA

Comparar segmentação clássica (K-Means) com redes convolucionais em PyTorch sobre as mesmas imagens, com métricas comparáveis e avaliação que qualquer pessoa consiga reproduzir.

DECISÕES TÉCNICAS

01.

Avaliação reprodutível por CLI: checkpoint do modelo, split do dataset e índice da imagem como argumentos explícitos, sem estado escondido.

02.

As duas abordagens medidas com as mesmas métricas: Mean IoU, Dice, Precision e Recall, além da comparação visual cluster contra máscara.

03.

Compatível com Google Colab e execução local, com CUDA opcional.

RESULTADO

Pipeline de comparação com saídas visuais e métricas por imagem, curvas de perda e acurácia.

[MÉTRICA: IoU e Dice do melhor checkpoint vs K-Means]

STACK

Backend e IA aplicada

Python · FastAPI
APIs de LLM · RAG
Auth multi-tenant · JWT

Produto e web

TypeScript · Next.js
React · Prisma · Zod

Dados e ML

pandas · scikit-learn
XGBoost · SARIMAX
PyTorch · PySpark

Infra

Docker · AWS · Vercel
Firestore · DynamoDB

SOBRE

Estudante do 8º período de Ciência da Computação na CESAR School, Recife. Engenheiro de software na kinid (identidade digital do ativo imobiliário) e construindo, de ponta a ponta, o produto de IA para hotelaria descrito acima. O interesse central é o trecho do caminho em que IA deixa de ser demo e vira sistema em produção, com as garantias de engenharia que isso exige.

Um e-mail resolve.

Disponível para conversas sobre engenharia de backend, IA aplicada e produto.

caiobarretodv@hotmail.com

GitHub ↗ LinkedIn ↗