Base de conocimiento de IA agéntica

Base de conocimiento

Base de conocimiento de IA agéntica

Unidades autocontenidas y citables sobre IA aplicada y agéntica — cada una construida como una unidad de conocimiento reutilizable para personas, buscadores y agentes de IA por igual. Cada entrada lleva definición, puntos clave, FAQs, referencias, fecha y versión.

Conceptos

¿Qué es la IA Agéntica (Agentic AI)?

La IA agéntica designa sistemas que persiguen objetivos en varios pasos —planifican, llaman a herramientas, actúan sobre un entorno y reaccionan al feedback— en lugar de producir una única respuesta. Convierte a un modelo de lenguaje de generador de texto en un actor capaz de completar tareas. El cambio que representa es pasar del software 'hazlo tú', donde la persona conduce cada paso, al software 'hazlo por mí', donde el sistema ejecuta el trabajo y reporta el resultado.

Conceptos

¿Qué es la Evaluación de IA Agéntica?

La evaluación de IA agéntica es la práctica de medir cómo de bien un agente completa tareas de varios pasos con uso de herramientas en un entorno, no solo la calidad de una única respuesta. A medida que los modelos saturan los benchmarks estáticos de conocimiento, la evaluación se desplaza de medir capacidad (lo que un modelo sabe) a medir agencia (lo que un sistema realmente logra hacer). Unas buenas evaluaciones son el bucle de feedback que hace posible la ingeniería de harness.

Conceptos

¿Qué es un Agente de IA?

Un agente de IA es un sistema que combina un modelo con herramientas, memoria y un bucle de control para tomar acciones hacia un objetivo, en lugar de solo responder a un prompt. Percibe una situación, decide qué hacer, actúa mediante herramientas, observa el resultado y repite hasta terminar. La autonomía va desde una sola llamada a herramienta hasta la ejecución de tareas complejas de horizonte largo.

Conceptos

¿Qué son los Embeddings y la Búsqueda Vectorial?

Un embedding es un vector numérico que representa el significado de un texto (o imágenes, audio, código) de modo que los elementos semánticamente similares quedan cerca en el espacio vectorial. La búsqueda vectorial encuentra los embeddings más cercanos a una consulta, permitiendo buscar por significado en vez de por palabras clave. Los embeddings son la columna vertebral de la generación aumentada por recuperación, la búsqueda semántica, el clustering y la recomendación.

Conceptos

¿Qué es el Fine-tuning (Ajuste fino)?

El fine-tuning continúa el entrenamiento de un modelo preentrenado con un conjunto de datos más pequeño y dirigido para especializar su comportamiento, estilo o conocimiento de dominio. Es mucho más barato que el preentrenamiento y cambia los pesos del modelo, a diferencia del prompting o la recuperación, que lo dejan intacto. Úsalo para fijar un formato, tono o habilidad consistentes; usa recuperación cuando necesites hechos frescos o privados.

Conceptos

¿Qué son los Modelos Fundacionales (Foundation Models)?

Un modelo fundacional es un modelo grande preentrenado a escala con datos amplios que puede adaptarse a una gran variedad de tareas posteriores. Los modelos de lenguaje (LLM) y los multimodales son los ejemplos canónicos. El término, acuñado en Stanford en 2021, captura un cambio: en lugar de entrenar un modelo a medida por tarea, las organizaciones construyen sobre una base general compartida y luego la especializan mediante prompting, recuperación o fine-tuning.

Conceptos

¿Qué es el Model Context Protocol (MCP)?

El Model Context Protocol (MCP) es un estándar abierto para conectar modelos y agentes de IA con herramientas, fuentes de datos y sistemas externos a través de una interfaz única y uniforme. Presentado por Anthropic a finales de 2024, estandariza cómo una aplicación expone contexto y capacidades a un modelo, actuando como un adaptador universal para que cualquier cliente compatible hable con cualquier servidor compatible.

Conceptos

¿Qué es la Ingeniería de Prompts (Prompt Engineering)?

La ingeniería de prompts es la práctica de diseñar las entradas que se dan a un modelo de lenguaje para que produzca la salida deseada de forma fiable. Un buen prompt especifica el rol, la tarea, las restricciones, el formato de salida y, cuando conviene, ejemplos. Es la palanca más accesible para guiar el comportamiento del modelo —y una capa del harness más amplio— pero por sí sola no hace fiable a un sistema a escala.

Conceptos

¿Qué son los Modelos de Razonamiento (Reasoning Models)?

Los modelos de razonamiento son modelos de lenguaje entrenados para gastar cómputo extra 'pensando' antes de responder, generando pasos de razonamiento internos para resolver problemas más difíciles de matemáticas, código y lógica. Cambian latencia y coste por precisión en tareas complejas de varios pasos. La idea clave es el cómputo en inferencia (test-time compute): dejar que un modelo razone más en la inferencia, en vez de solo hacerlo más grande, puede mejorar mucho los resultados.

Conceptos

¿Qué es el Uso de Herramientas (Function Calling)?

El uso de herramientas, también llamado function calling, permite a un modelo de lenguaje invocar funciones, APIs o código externos para obtener información o tomar acciones en el mundo real. El modelo decide qué herramienta llamar y con qué argumentos; la aplicación ejecuta la herramienta y devuelve el resultado, que el modelo usa para continuar. El uso de herramientas es el puente que convierte a un generador de texto en un agente que de verdad hace cosas.

Harness Engineering

¿Qué son los Sistemas de Memoria de Agentes?

La memoria de un agente es cómo un agente de IA retiene y recuerda información más allá de una sola ventana de contexto: entre pasos, sesiones y tareas. Suele separar la memoria de trabajo a corto plazo (el contexto actual) de la memoria a largo plazo (almacenes duraderos que el agente lee y escribe). La memoria es lo que permite a un agente arrastrar estado en una tarea larga, recordar a un usuario en el tiempo y evitar repetir trabajo. Es una capa central de la ingeniería de harness.

Harness Engineering

¿Qué es la Observabilidad de Agentes de IA?

La observabilidad de IA es la práctica de instrumentar sistemas de IA —sobre todo agentes— para poder ver qué hicieron y por qué. Captura trazas de cada paso: prompts, llamadas a herramientas, contexto recuperado, salidas del modelo, tokens, latencia y coste. Como los agentes son no deterministas y de varios pasos, la observabilidad es lo que hace diagnosticables los fallos y sistemática la mejora. Es la capa que alimenta la evaluación y cierra el bucle de la ingeniería de harness.

Harness Engineering

¿Qué es la Ingeniería de Contexto (Context Engineering)?

La ingeniería de contexto es la disciplina de decidir qué información entra en la ventana de contexto limitada de un modelo en cada paso, y qué se queda fuera. Como los agentes se ejecutan en muchos pasos, meter todo ingenuamente en el contexto degrada calidad y coste. La ingeniería de contexto cura las instrucciones, el conocimiento recuperado, los resultados de herramientas y la memoria adecuados para que el modelo tenga justo lo que necesita cuando lo necesita. Es una parte central de la ingeniería de harness.

Harness Engineering

¿Qué es la Ingeniería de Harness (Harness Engineering)?

La ingeniería de harness es la disciplina de diseñar y optimizar el andamiaje alrededor de un modelo de IA —prompts, herramientas, memoria, entorno, bucle de control y guardarraíles— para que el modelo rinda de forma fiable en tareas reales. Su premisa central: a medida que los modelos base convergen en capacidad bruta, la ventaja competitiva se desplaza del modelo al harness que lo rodea. El mismo modelo puede aprobar o fallar una tarea casi por completo según su harness.

Patrones

¿Qué es el RAG empresarial (Enterprise RAG)?

El RAG empresarial (generación aumentada por recuperación) es el patrón de fundamentar las respuestas de un modelo en los propios documentos de la organización, recuperados en el momento de la consulta, en lugar de depender de la memoria paramétrica del modelo. Permite usar conocimiento privado, actual y gobernado —políticas, manuales, tickets, contratos— sin reentrenar un modelo, manteniendo el control de acceso, las citas y la auditabilidad que exigen las empresas.

Patrones

¿Qué es el Patrón Human-in-the-Loop?

Human-in-the-loop (HITL) es un patrón de diseño en el que una persona revisa, aprueba o corrige la salida de un sistema de IA antes de que surta efecto, sobre todo en acciones de alto impacto. En lugar de autonomía total, el agente propone y un humano dispone. Es un control primario para gestionar el riesgo en sistemas agénticos y un requisito recurrente en marcos de gobernanza como el Reglamento de IA de la UE y el NIST AI RMF.

Arquitecturas

¿Qué es una Arquitectura Multiagente?

Una arquitectura multiagente divide una tarea entre varios agentes especializados que colaboran, delegan o compiten para alcanzar un objetivo, en lugar de depender de un único agente general. Formas habituales: un orquestador que delega en trabajadores, pipelines donde cada agente posee una etapa, y patrones de debate o crítico. Puede mejorar la modularidad y la fiabilidad en tareas complejas, pero añade coste de coordinación y solo debe adoptarse cuando un solo agente se queda corto de forma demostrable.

Gobernanza

¿Qué es la Gobernanza de la IA (AI Governance)?

La gobernanza de la IA es el conjunto de políticas, procesos, roles y controles que garantizan que la IA se construya y use de forma responsable, legal y segura. Abarca gestión de riesgos, rendición de cuentas, transparencia, seguridad y cumplimiento a lo largo del ciclo de vida de la IA. En la práctica operacionaliza marcos reconocidos —el Reglamento de IA de la UE, el NIST AI Risk Management Framework e ISO/IEC 42001— en controles concretos que una organización puede implementar, evidenciar y auditar.

Gobernanza

¿Qué son los Guardarraíles de IA (Guardrails)?

Los guardarraíles son controles en tiempo de ejecución que acotan lo que entra y sale de un sistema de IA, manteniendo su comportamiento seguro, conforme a la política y al cumplimiento. Comprueban y filtran entradas y salidas, validan acciones de herramientas, bloquean contenido no permitido e imponen límites, situándose alrededor del modelo como capa de seguridad. Son un control primario y operativo en la gobernanza de IA y una defensa clave contra el mal uso y la inyección de prompts.

Gobernanza

¿Qué es la Inyección de Prompts (Prompt Injection)?

La inyección de prompts es un ataque en el que instrucciones maliciosas ocultas en la entrada a un modelo de lenguaje secuestran su comportamiento, haciéndole ignorar sus reglas, filtrar datos o usar mal las herramientas. Encabeza el OWASP Top 10 para aplicaciones LLM. La causa raíz es que los modelos no pueden separar de forma fiable las instrucciones de confianza del contenido no confiable, así que cualquier texto que un agente lea —una página web, un documento, el resultado de una herramienta— puede portar un ataque.