Lucas S. Vieira
Conectando com modelos
Guilda de IA
"Python é a ferramenta. O LLM é o cérebro. A API é a ponte."
Entender HTTP = entender todas as APIs de LLM.
| Aspecto | Cloud (Gemini) | Local (Ollama) |
|---|---|---|
| Setup | API key (2 min) | Install + download |
| Velocidade | ~100+ tok/s | 18-80 tok/s |
| Custos | Grátis com limites | 100% grátis |
| Privacidade | Dados vão pro Google | Fica na máquina |
| Internet | Necessária | Não (após setup) |
Recomendação: comece pelo Gemini (rápido), depois experimente Ollama e LM Studio.
System prompt = "Você é um tutor de Python." → muda completamente o comportamento.
system → user → assistant → user → ...É como repetir toda a conversa toda vez que você fala.
| Código | Significado | O que fazer |
|---|---|---|
| 401 | Não autorizado | Verificar API key |
| 429 | Rate limit | Aguardar e tentar |
| 500 | Erro do servidor | Tentar mais tarde |
| 503 | IndisponÃvel | Servidor sobrecarregado |
Na apostila:
chamar_api()com retry automático e backoff.
luksamuk.codes/pages/guilda-ia → Semana 04Gemini = 1M tokens/dia gratuito. Sem GPU, sem instalação.
Warm up é de ~2-3 min na primeira vez. Depois: ~80 tok/s com Qwen 3.5 4B.
chat.py no editoruv run chat.py — mesma requisição, 3 backendsperguntar() que funciona com qualquer APItry/exceptTodos os exercÃcios estão na apostila com gabarito.