Encadeamento de Prompts (Prompt Chaining)
O encadeamento de prompts decompõe uma tarefa numa sequência fixa de chamadas ao LLM, em que cada passo trabalha sobre a saída do anterior. Troca um pouco de latência por muito mais precisão e controle, e é o padrão de fluxo mais simples: use-o quando uma tarefa se divide limpamente em subtarefas ordenadas.
Problema
Um único prompt ao qual se pede fazer várias coisas ao mesmo tempo produz saídas de menor qualidade, mais difíceis de controlar e de depurar quando falham.
Quando usar
Use o encadeamento quando uma tarefa se decompõe numa sequência clara e ordenada de subtarefas — por exemplo esboço, depois rascunho, depois edição — e cada passo se beneficia do resultado do anterior.
Solução
Divida a tarefa em passos discretos e execute uma chamada ao LLM por passo, passando cada saída à seguinte. Opcionalmente adicione verificações programáticas (gates) entre passos para validar resultados intermediários antes de continuar.
Como cada chamada tem um único trabalho focado, os prompts são mais simples, as saídas mais confiáveis e as falhas ficam localizadas num passo concreto que você pode inspecionar e corrigir.
Componentes
Benefícios
- Maior precisão ao dar a cada chamada um único trabalho focado.
- Mais fácil de depurar: as falhas se localizam num passo.
- Os gates de validação podem capturar erros entre passos.
Riscos
- Maior latência total pelas chamadas sequenciais.
- Os erros podem se acumular na cadeia se não forem verificados.
- Passos demais adicionam custo e fragilidade.
Quando não usar
- Quando a tarefa é simples o bastante para uma única chamada.
- Quando as subtarefas são independentes: paralelize em vez disso.
- Quando o caminho não é conhecido de antemão: use um laço de agente.
Tecnologias
Exemplos
- Gerar um esboço, depois escrever cada seção, depois revisar o tom.
- Extrair campos estruturados, depois validá-los, depois resumir.
- Traduzir um documento, depois verificar a tradução contra o original.
KPIs
- Taxa de sucesso ponta a ponta
- Proporção de cadeias que produzem um resultado final correto; os erros se acumulam entre passos.
- Taxa de erro por passo
- Falha em cada elo: um passo confiável a 95% encadeado cinco vezes dá ~77% ponta a ponta.
- Latência e custo totais
- Soma de todas as chamadas da cadeia; mais passos significam mais de ambos.
- Taxa de recuperação
- Com que frequência um passo intermediário falho é detectado e corrigido em vez de propagado em silêncio.
Modos de falha observados
- Propagação de erros: uma falha cedo na cadeia corrompe todos os passos seguintes.
- Acúmulo de latência e custo à medida que a cadeia se alonga.
- Transferências frágeis quando o formato de saída de um passo não coincide com a entrada esperada do seguinte.
- Perda de contexto entre passos, de modo que elos posteriores esquecem restrições fixadas antes.
Lições aprendidas
- Valide ou verifique entre passos para detectar erros antes que se propaguem.
- Mantenha as cadeias tão curtas quanto a tarefa permitir; cada passo extra multiplica a probabilidade de falha.
- Fixe o contrato de saída de cada passo para que as transferências não quebrem em silêncio.
- Use o encadeamento para trabalho genuinamente sequencial; paralelize os passos independentes.
FAQs
- Como difere de um agente?
- O encadeamento segue uma sequência fixa predefinida. Um agente decide seus próprios passos de forma dinâmica. Prefira o encadeamento quando o caminho é conhecido de antemão.
- Quando devo adicionar gates entre passos?
- Sempre que um resultado intermediário precise cumprir uma condição antes de prosseguir: evita que os erros se propaguem pela cadeia.
- O encadeamento aumenta o custo?
- Sim, moderadamente — mais chamadas significam mais tokens e latência — mas o ganho em confiabilidade costuma compensar em tarefas de várias partes.