• Kostenlos testen
  • Log in
  • Vertrieb kontaktieren
  • Support
    • English
logo
  • User-Interface Plattform
  • use-cases-mobile-tab-icon Use Cases
  • App-Gallery Lösungen
  • Operations Entwickler
  • Corporate-Building Über uns

Plattform-Übersicht

  • The leading AI development platform Explore the unified, agile, enterprise-proven platform for the full SDLC
  • Agent Workbench Enterprise-taugliche KI-Agenten entwickeln und bereitstellen
  • Mentor Maßgeschneiderte KI-App-Generierung basierend auf einer Eingabe in natürlicher Sprache
  • Agentische Workflows Übergaben zwischen Mensch und KI-Agent automatisieren und orchestrieren
  • Data fabric Die virtuelle Datenschicht, die all Ihre KI-Apps und -Agenten versorgt
  • Sicherheit und Compliance Die Richtlinien und Governance Ihres Unternehmens in jede App und jeden KI-Agenten integriert
  • Enterprise-Integration Integration mit jedem System, jeder App und jedem KI-Modell
  • Preise Jetzt mit flexiblen Plänen starten

Mehr entdecken

  • Entdecken Sie, was Sie entwickeln können
  • Kundenberichte
  • Plattform-Demos
  • Leitfaden für KI-Softwareentwicklung
outystems-mentor-dark-icon

Orchestrieren Sie die Zusammenarbeit von Menschen und KI

outystems-agent-workbench-dark-icon

Was ist Low-Code?

Externe Apps

  • Bürgerportale
  • Mobile Banking-Portale
  • Versicherungsportale
  • Portale für virtuelle Pflege
  • Portale zur Erstellung von Kundenkonten
  • Self-Service-Portale für Kunden
  • Mehr über externe Apps

Core-Systeme

  • Digitale Kreditvergabesysteme
  • Schadenmanagementsysteme
  • Field-Service-Systeme
  • Lieferkettensysteme
  • Salesforce Integration
  • SAP
  • Mehr über Core-Systeme

Interne Apps

  • Mitarbeiter-Onboarding
  • Self-Service für Mitarbeiter
  • Office Management
  • Internes Case Management
  • IT-Service-Management
  • Performance-Management
  • Mehr über interne Apps
application-monitoring-icon

Alle Use Cases

customer-stories-icon

Kundenstorys lesen

Lösungen für Ihre Branche

  • Banking und Finanzdienstleistungen
  • Versicherungen
  • Behörden
  • Produktion & Fertigung
  • Weitere Branchen
  • Gesundheitswesen
  • Energie und Versorgungsunternehmen
  • Retail
  • Weiterbildung

Business-Initiativen

  • Agentic AI innovation
  • AI-driven development
  • IT speed and agility
  • Operative Effizienz
  • Customer Experience
  • Legacy-Modernisierung
full-stack-icon

Entdecken Sie App-Beispiele

customer-stories-icon

Kundenstorys lesen

Entdecken Sie unser Universum

  • Entwickler werden
  • Community Cloud
  • Foren
  • Forge Marketplace
  • User-Gruppen
  • Tech Talks

Unsere Lernangebote

  • Training
  • Dokumentation
  • Jump-Start-Sessions
  • Zertifizierungen

Advocacy-Programme

  • MVP Program
  • Champions-Programm

Entdecken Sie unsere Ressourcen

  • Support
  • Produkt-Updates
  • Entwickler-Newsletter
full-stack-icon

Entdecken Sie App-Beispiele

customer-stories-icon

Kundenstorys lesen

Unternehmen

  • Das Unternehmen Wir haben Pionierarbeit geleistet
  • Kundenstorys Wie Menschen OutSystems nutzen – und warum
  • Partner Unsere Partner kennen sich aus
  • Blog Alles, was uns interessiert
  • Webinare Live- und On-Demand-Sessions
  • Events Kommen Sie vorbei
  • Ressourcen Erfahren Sie alles über Low-Code (und vieles mehr!)
  • Services Wir helfen Ihnen gerne weiter
  • Karriere Kommen Sie in unser Team!
  • Discovery Hub Zentrale Inhalte an einem Ort
customer-stories-icon

Kundenstorys lesen

user-interface-icon

Entdecken Sie die Plattform

  • Einloggen
  • Kostenlos testen
  • Vertrieb kontaktieren
  • Support
  • English
Demo vereinbaren
My Platform
  1. Product Releases and Updates
  2. Automated Agent Logic Validation

Automated Agent Logic Validation

30 March 2026
odc-agent -evaluations

Building AI agents is exciting—until you need to prove they actually work. When you're iterating on a System Prompt, updating Grounding Data, or wiring up new tools, the only way to know if things still behave correctly has been manual, one-off testing. Change the prompt logic, re-deploy, and hope for the best. That kind of guesswork doesn't scale, and it certainly doesn't inspire the confidence needed to put agents in front of real users.

We saw a clear need for a structured, repeatable way to validate agent behavior during development—something that lets you know, before anything reaches production, whether your changes improved things or broke them.

Introducing Evaluations in Agent Workbench

Evaluations let you automatically test your Agent Logic against a Golden Dataset—a collection of test cases with inputs, expected outputs, and expected tool calls that you define. You upload the dataset as JSON, select the Service Action that wraps your agent, and run an evaluation. The platform executes each test case, captures a full execution trace (inputs, tool calls, token usage, and final output), and then automatically scores every result using the built-in platform Judge. No configuration needed—every run gets a quality score and Pass/Fail for each test case out of the box.

This means you can change a prompt, swap a tool, or adjust grounding logic and immediately see how those changes affect accuracy and reliability across dozens of scenarios. The full execution trace gives you the visibility to pinpoint exactly where things went wrong—which tool was called, what arguments were passed, and what the agent actually produced. And because the Judge runs automatically on every evaluation, you get consistent, comparable feedback across runs without any extra setup.

Learn more about Automated Agent Logic Validation Related Tags
  • Artificial Intelligence

Keep learning with our resources

state-ai-development-hcard
Resources

The State of AI Development in 2026

Discover how IT leaders are navigating the shift to agentic AI in 2026.

Get infographic
apps-ai-agents-g2-infographic-hcard
Resources

G2 Data: Why enterprises build apps and agents on OutSystems

Users rank OutSystems a top platform for apps and AI agents.

Get infographic
g2-low-code-grid-report-hcard
Analyst Report

G2 Grid Report for Low-Code Development Platforms, 2026

OutSystems is a Leader, earning a perfect 100 satisfaction score.

Get the Report
Plattform
  • Plattform
  • Plattform-Übersicht
  • Preise
  • Evaluierungsleitfaden
  • Low-Code Basics
  • Applikationsvorlagen
  • Kostenlos testen
Warum OutSystems
  • Warum OutSystems
  • Berichte von Kunden
  • Analystenbewertungen
  • Events
  • Dienstleistungen
  • Partner
  • FAQs
  • Karriere & Kultur
  • Mendix vs. OutSystems
Solutions By Business Initiative
  • Solutions By Business Initiative
  • IT speed and agility
  • Agentic AI innovation
  • Legacy modernization
  • Customer experience
  • Operational efficiency
Nach Branche
  • Nach Branche
  • Banking & Financial Services
  • Versicherungen
  • Behörden
  • Fertigung
  • Gesundheitswesen
  • Energieversorger
  • Handel
  • Bildungswesen
  • Alle Branchen ansehen
Partner
  • Partner
  • Übersicht
  • Partner finden
  • Partner werden
  • Technologiepartner
  • Trainingspartner
  • Zum Partner Center
Entwickler
  • Entwickler
  • Training
  • Produkt-Updates
  • Jump-Start-Sessions
  • Zertifizierungen
  • Forge Marketplace
  • Anwendergruppen
  • Tech Talks
  • De/Coded Podcast
Community
  • Community
  • Community Home
  • Foren
  • Ideen
  • OutSystems Research Program
  • MVP Program
  • Community Jobs
  • Champions-Programm
Technischer Support
  • Technischer Support
  • Technische Dokumentation
  • Support Center
  • Software-Downloads
Ressourcen
  • Ressourcen
  • KI-Softwareentwicklung
  • Digitale Transformation
  • Anwendungsentwicklung
  • Events und Webinare
  • Blog
  • Ressourcen
  • Discovery Hub
Unternehmen
  • Unternehmen
  • Über OutSystems
  • Kontakt Vertrieb
  • Niederlassungen
  • Presse
  • Karriere und Kultur
  • ESG Statement
  • Supplier Code of Conduct
  • Sitemap
Rechtliches
  • Rechtliches
  • Rechtlicher Überblick
  • Cookie-Richtlinie
  • EU-kofinanzierte Projekte
  • Modern Slavery Act
  • Nutzungsbedingungen
  • DSGVO bei OutSystems
  • Master Subscription Agreement
  • Nutzungsbedingungen für das Repository
  • Datenschutzerklärung
  • Code of Business Conduct and Ethics
  • Mitteilungs- und Löschungsrichtlinie
  • Corruption Risks Prevention Plan
OutSystems © - All Rights Reserved
OutSystems Germany GmbH
Unicorn Workspaces
Kaufingerstraße 24
80331 München
Tel: +49 (0)30 403667451
Weitere Standorte
  • English