O que é IA hoje?

Lucas S. Vieira

O que é IA hoje?

Nomenclaturas de IA

Guilda de IA

O Problema

Muita gente usa termos como se fossem a mesma coisa
Não são
Entender a diferença é fundamental

Quatro termos principais

IA (Inteligência Artificial)
LLM (Large Language Model)
RAG (Retrieval Augmented Generation)
Agente (AI Agent)

1. IA - Inteligência Artificial

O que é: Campo geral
Qualquer sistema que faz algo "inteligente"

Exemplos de IA

Spam filter do email → IA
Reconhecimento facial → IA
Chess engine → IA
ChatGPT → IA

2. LLM - Large Language Model

O que é: Um TIPO de IA
Modelo que prevê próxima palavra

Capacidades que importam (pra construtores)

Tool calling → Consegue chamar ferramentas externas
Raciocínio → Pensamento passo a passo explícito
Contexto longo → Janela de 100K+ tokens
Multimodalidade → Imagem, áudio, vídeo

Dica: estabilidade

Para construir agentes, o essencial é tool calling + estabilidade. Modelos densos (não-MoE) tendem a ser mais estáveis.

Modelos de LLM (Abril 2026)

Proprietários: Gemini 3 Flash, Gemini 3.1 Pro, Claude Opus 4.7, GPT-5.4
API gratuita: Gemini 2.5 Flash, Gemini 3.1 Flash-Lite
API barata: DeepSeek V3.2, MiniMax M2.5, GLM-5.1
Para edge/celular: Gemma 4 E2B, Qwen3.5-4B
Para agentes: Qwen3.5-27B, Qwen 3.6-35B-A3B

Open Weights (Abril 2026)

GLM-5.1 (MIT!) — agente open robusto
Kimi K2.5 — multimodal agentic
Qwen3.5 (série) — de 0.5B a 397B, Apache 2.0
DeepSeek V3.2 — MoE eficiente, barato na API
Gemma 4 — de E2B a 31B, Apache 2.0
Qwen 3.6-35B-A3B — 3B ativos, supera 27B densos

Paradoxo da eficiência

2023: GPT-4 era SOTA com ~1.8T parâmetros
2026: Gemma 4 E4B (4B) alcança desempenho comparable
Modelos modernos são ~450x menores e igualmente capazes

Como? Mais dados de treino, distilação, MoE, pós-treino.

Estado da Arte (Abril 2026)

Modelo	Tipo	Destaque
Claude Opus 4.7	Proprietário	Top geral
Gemini 3.1 Pro	Proprietário	Top Google
GPT-5.4	Proprietário	1M contexto
Gemini 3 Flash	Proprietário	Agentic, pago
GLM-5.1	Open (MIT)	Coding open forte

GLM-5.1: o open que compete

GLM-5.1 (open weights) empata com GPT-5.4 em coding, custando uma fração. Qwen 3.6-35B-A3B (3B ativos) roda em hardware modesto e supera modelos 10x maiores.

Sobre o termo "AGI"

"AGI virou um termo de hype, não um termo com significado preciso" — Andrew Ng (Google Brain)

Para quem constrói: o que importa são capacidades mensuráveis. O modelo faz tool calling? É estável? Foco no que você pode testar.

Modelos Densos vs MoE

Densos: Todos parâmetros ativos (estável)
MoE: Mixture of Experts (eficiente, mas instável)
Para agentes: prefira modelos densos

O que LLM NÃO faz

Não calcula (234 × 987 = ? → ele chuta)
Não sabe fatos específicos (suas notas, documentos)
Não tem memória de longo prazo

3. RAG - Retrieval Augmented Generation

O que é: Técnica para fazer LLM "saber" coisas
Usado para documentos que não estavam no treinamento

Fluxo RAG

Usuário pergunta
Sistema busca em documentos (Retrieval)
Passa documentos + pergunta para LLM (Augmented)
LLM responde baseado nos documentos (Generation)

Exemplo

Sem RAG:

"Quando foi fundada a Liga de IA?"
→ LLM: "Não sei" ou inventa data

Com RAG:

"Quando foi fundada a Liga de IA?"
→ Sistema busca no documento
→ Encontra: "fundada em 2025"
→ LLM responde: "2025"

4. Agente (AI Agent)

O que é: Sistema que usa LLM + ferramentas + memória
Diferença: LLM só fala, Agente faz coisas

Comparação

LLM puro:
Usuário: "Quanto é 234 × 987?"
LLM: "230.898" (pode estar errado, ele chutou)

Agente:
Usuário: "Quanto é 234 × 987?"
Agente: "Deixa eu calcular..."
→ Usa ferramenta de calculadora
→ Responde: "230.958" (correto)

Componentes de um agente

LLM → faz inferência com linguagem natural
Ferramentas → o que ele pode fazer
Memória → histórico da conversa
Decisão → lógica de quando usar cada ferramenta

LLM só fala. Agente fala E faz coisas.

Resumo Visual

Termo	O que é	Exemplo
IA	Campo geral	Spam filter, Xadrez, ChatGPT
LLM	Modelo de linguagem	GPT-5.4, Gemma 4
RAG	Busca + geração	Chatbot que consulta PDFs
Agente	LLM + ferramentas	Assistente que calcula, busca, age

Hierarquia

IA → contém tudo
LLM → subconjunto de IA
RAG → usa LLM + documentos
Agente → usa LLM + ferramentas + memória

Confusões Comuns

Frase	Termo correto
"Vou usar IA para responder"	LLM ou Agente
"Meu RAG responde perguntas"	Agente com RAG
"O agente alucina"	LLM alucina
"Preciso treinar minha IA"	LLM fine-tuning

Por que importa?

Se você sabe a diferença, não se perde.

"RAG" → embeddings, vector store, retrieval
"Agente" → ferramentas, loops, decisão
"LLM" → prompt, token, contexto
"IA" → genérico, pode ser qualquer coisa

Roadmap

Semana	Conceito
1	IA, LLM, RAG, Agentes (conceitos)
2-3	Prompting, Python mínimo
4-5	Estrutura de um agente, primeira ferramenta
6-7	Ferramentas múltiplas, embeddings
8	RAG
9-10	Agente completo, desenvolvimento

Perguntas?

No final, você vai ouvir "RAG", "Agente", "LLM" e saber exatamente o que é.