Skip to main content

Instrucción

La instrucción define el comportamiento base del agente: qué rol adopta, qué tono utiliza y qué pasos sigue antes de responder. Asegúrate de que sea breve, concreta y libre de ambigüedades. Si necesitas profundizar en la redacción, consulta la guía de buenas prácticas en @prompting.mdx. Ver recomendaciones y ejemplos de prompting

Modelo

Escoge el modelo que mejor se ajuste al tipo de interacción que buscas. Considera latencia, costo y complejidad de las tareas antes de seleccionarlo.

Modelos disponibles

  • Llama 4 Scout: modelo ágil y de baja latencia, ideal para ideas rápidas e interacciones ligeras.
  • GPT 4.1 Mini: variante simplificada de GPT-4.1 optimizada para respuestas rápidas con menor demanda de recursos.
  • Claude 3.5 Sonnet: excelente para tareas complejas que requieren textos más elaborados y contextos extensos.
  • GPT 4-o (Azure): versión de GPT 4-o alojada en Azure, enfocada en estabilidad y rendimiento en entornos empresariales.
  • Llama 4 Maverick: modelo de alto rendimiento diseñado para razonamientos exigentes y resolución multistep.
  • GPT 4.1: evolución refinada de GPT-4, con mejor comprensión, razonamiento y precisión.
  • GPT 4-o Mini: versión más rápida y ligera de GPT 4-o, orientada a casos donde prima la velocidad.

Temperatura

La temperatura controla el nivel de creatividad del modelo. Utiliza valores entre 0 y 1: en 0 obtendrás respuestas deterministas y consistentes; conforme te acerques a 1, las respuestas serán más creativas y variadas. Ajusta este parámetro según necesites precisión o exploración.

Bases de conocimiento

Refuerza al agente con documentación específica para que responda con información actualizada y verificable.
  • Archivos: carga archivos de hasta 2 MB en formatos .pdf o .csv.
  • URLs: añade enlaces cuya descarga no supere los 5 MB. Verifica que el contenido sea accesible públicamente.

MCPs

Conecta Model Context Protocols (MCPs) para ampliar las capacidades del agente. Cada integración requiere:
  • URL del endpoint al que se realizará la consulta.
  • Headers opcionales con credenciales o metadatos necesarios para la autenticación.
  • Nombre identificador para reconocer el MCP dentro del estudio.
  • Descripción que resuma qué información o acciones ofrece.

Tools

Las herramientas permiten que el agente ejecute acciones externas. Puedes configurarlas de dos formas:
  • Tools creadas en la plataforma: defínelas directamente en Brain Studio para integraciones reutilizables y gestionadas.
  • Llamadas HTTP: especifica un endpoint, método y esquema de entrada/salida para realizar peticiones puntuales a tus servicios.
Combina estos elementos para que el agente seleccione automáticamente la herramienta adecuada durante la conversación.

Configuración avanzada

En la pestaña de configuración avanzada del nodo AI Agent encontrarás opciones adicionales que amplían las capacidades del agente para procesar diferentes tipos de contenido y mensajes interactivos.

Soporte de lectura payload en mensajes entrantes

Habilita esta opción para permitir que el AI Agent procese payloads de respuesta rápida de mensajes interactivos. Cuando está activada, el agente puede interpretar y responder a las acciones del usuario en botones de respuesta rápida, mejorando la experiencia en flujos conversacionales que utilizan elementos interactivos. Cuándo habilitarla:
  • Cuando tu flujo incluye mensajes con botones de respuesta rápida (quick replies).
  • Si necesitas que el agente procese la información enviada a través de payloads en lugar de solo el texto visible del botón.
  • Para flujos que requieren capturar datos estructurados desde interacciones con botones.

Soporte de documentos PDF

Activa esta configuración para que el AI Agent pueda leer y procesar documentos PDF enviados por los usuarios durante la conversación. El agente extraerá el contenido del documento y podrá responder preguntas o realizar acciones basadas en la información contenida. Nota importante: Esta funcionalidad solo procesa el texto del PDF. Las imágenes contenidas dentro del documento no serán procesadas ni analizadas por el agente. Cuándo habilitarla:
  • Cuando esperas que los usuarios envíen documentos PDF como parte de la interacción.
  • Si necesitas que el agente analice, resuma o extraiga información de archivos PDF.
  • Para casos de uso como validación de documentos, extracción de datos o análisis de contenido.

Leer imagen con URL y pie de foto

Esta configuración permite al AI Agent procesar imágenes que incluyen un pie de foto (caption). El agente podrá acceder tanto a la imagen como al texto descriptivo asociado, procesando ambos elementos de forma conjunta. Cuándo habilitarla:
  • Cuando los usuarios envían imágenes con descripciones textuales.
  • Si necesitas que el agente procese tanto el contenido visual como el contexto textual de la imagen.
  • Para flujos que requieren análisis combinado de imagen y texto.

Buenas prácticas

  • Se recomienda activar siempre la sección de Base de Conocimiento (Knowledge) para anclar las respuestas del agente a la documentación oficial de tu negocio o a la documentación básica que necesite el prompt. Esto reduce drásticamente el riesgo de alucinaciones, ya que el modelo priorizará la información de tus archivos sobre su conocimiento general. Para maximizar su efectividad, asigna descripciones claras a cada archivo cargado, permitiendo que el agente sepa exactamente cuándo debe buscar información en ellos.