OPERATIONS · 2026-05-25

Was liefert ein AI-Agents-Dienstleistungsunternehmen wirklich?

Eine konkrete, nicht-marketingmäßige Liste dessen, wofür ein Managed-AI-Agents-Dienstleistungsunternehmen 2026 wirklich auf der Pflichtenliste steht — und was im Leistungsumfang zu oft fehlt.

Von der Logitelia-Redaktion · 11 Min. Lesezeit

Einer der saubersten Filter bei der Bewertung eines AI-Agents-Dienstleisters ist die Frage, schriftlich, was genau Sie erhalten werden. Die Antworten clustern in zwei Gruppen. Anbieter, die mit einer dünnen Liste antworten („ein für Sie gebauter Custom-AI-Agent, mit laufendem Support"), verkaufen etwas, das näher an einem Freelancer-Projekt liegt. Anbieter, die mit einer langen Liste antworten („ein laufender Workflow, eine Eval-Suite, ein Observability-Dashboard, ein benannter Operator, exportierbare IP, monatlicher Review, Rufbereitschaft, definiertes SLA"), verkaufen einen echten Managed Service. Die Kostenlücke zwischen beiden Antworten sollte ebenfalls offensichtlich sein — und falls nicht, ist der Anbieter aus der ersten Gruppe überteuert.

Dieser Artikel entfaltet die lange Antwort. Er ist der Begleiter unseres Pillar-Guides Wie wählt man ein AI-Agents-Dienstleistungsunternehmen aus.

Der Workflow selbst

Offensichtlich, aber lohnt sich konkret zu werden. Ein Workflow ist eine Definition von Inputs, einer Sequenz von Agent-Schritten, den Tools, die der Agent aufrufen kann, den Outputs, die er erzeugt, und dem Ort, an den diese Outputs gehen. Er lebt irgendwo, wo Sie hineinsehen können — ein gerichteter Graph in der Plattform des Anbieters, eine YAML-Datei, ein Satz LangGraph-Nodes — nicht „im Kopf des Engineers, der ihn gebaut hat".

Was die Lieferung spezifizieren sollte: jede Inputquelle (mit Beispiel-Payloads), jedes externe Tool, das der Agent aufruft (mit Auth-Methode und Rate Limits), jedes Output-Ziel (mit Schema), die Erfolgskriterien für einen einzelnen Run und die Fehlerbehandlung für jeden vorhersehbaren Fehlertyp. Fehlt eines davon, wurde Ihnen kein Workflow geliefert — Ihnen wurde ein Skript geliefert, das zufällig beim ersten Mal funktioniert hat.

Die Evaluations-Suite

Eine Eval-Suite ist ein Satz Testfälle, die der Agent bestehen muss, bevor eine Änderung in Produktion geht. Sie ist der Unterschied zwischen „wir glauben, das funktioniert" und „wir können zeigen, dass es funktioniert". Ohne sie macht der Anbieter Änderungen blind, und Sie auch. Siehe AI agent evaluations explained für die lange Version.

Was die Lieferung spezifizieren sollte: einen versionierten Satz Testfälle (idealerweise 50–500 für einen typischen Workflow), die Ground-Truth-Antworten je Fall, die Bewertungsrubrik (deterministisch wo möglich, modell-bewertet wo nicht, mensch-bewertet für die kleine Menge, die das braucht), die Bestehensraten-Historie über die Zeit und die Regressionspolicy (was passiert, wenn die Rate sinkt).

Wenn der Anbieter Ihnen keinen Eval-Bericht aus einem anderen Kundenmandat (geschwärzt) zeigen kann, hat er keine Eval-Disziplin. Er improvisiert sie nach Vertragsunterschrift — möglicherweise gut, möglicherweise nicht.

Observability und ein Portal, in das Sie schauen können

Jede Aktion, die der Agent ausgeführt hat, abspielbar. Nicht „auf Anfrage verfügbar". Ein Live-Aktivitätsfeed mit Zeitstempeln, Inputs, Outputs, Tool-Calls, verwendetem Modell, Latenz und Kosten pro Run. Eine Suche über Runs nach Benutzer, Status, Fehlertyp. Die Fähigkeit, in einen einzelnen Run zu klicken und den vollständigen Trace zu sehen.

Das ist der am meisten unterschätzte Teil der Lieferung und der Teil, der gute Anbieter von passablen am stärksten unterscheidet. Ohne ihn wissen Sie nicht, was der Agent gestern getan hat, und der Anbieter auch nicht — er hat nur die bessere Geschichte darüber.

Ein benannter Senior Operator

Nicht „ein Team". Eine konkrete Person mit Namen, Kalender, E-Mail-Adresse und der Befugnis, Entscheidungen über Ihren Workflow zu treffen. Der Operator prüft die Aktivität des Agents täglich, behandelt Ausnahmen, verantwortet die Beziehung mit Ihnen, führt den Monthly Review und ist der Mensch, der für das Ergebnis verantwortlich ist.

Was die Lieferung spezifizieren sollte: wer der Operator ist, welche Seniorität er hat, wie viele andere Accounts er hält (Cap sollte 4–8 für eine Boutique sein), wie die Vertretung im Urlaub aussieht und das Benachrichtigungsfenster bei Rotation vom Account.

Integrationen, die Wartung überstehen

Echte Konnektoren zu Ihrem CRM, Help Desk, Buchhaltungssystem, Dokumentenspeicher, Kommunikationstools. Mit Credential-Rotation, Fehlerbehandlung, Retry-Logik, Versionspinning und einem schriftlichen Benachrichtigungspfad, wenn eine Upstream-API sich ändert.

Die Latte hier ist „das funktioniert in 18 Monaten noch". Ein Zapier-Szenario, das am Demo-Tag lief, schafft diese Latte nicht. Fragen Sie den Anbieter, wie er in der Vergangenheit eine Upstream-API-Änderung gehandhabt hat — eine konkrete Geschichte mit Datum ist das Signal operativer Reife.

Exportierbare Artefakte und IP-Übertragung

Innerhalb von 10 Werktagen nach Beendigung: jeder Prompt, jeder Workflow-Graph, jede Eval, jeder Integrationscode-Pfad, jede Log-Datei. In einem Format, das Ihnen erlaubt, in 30 Tagen bei einem anderen Anbieter oder intern wieder aufzubauen. Der Vertrag soll die IP an diesem Arbeitsergebnis Ihnen übertragen, nicht lizenzieren.

Das ist die Lieferung, die Käufer am häufigsten zu fragen vergessen, und die entscheidet, ob Sie nach 18 Monaten Kunde oder Geisel sind. Die Latte: Sie könnten den Workflow ohne die Plattform des Anbieters replizieren, wenn es sein müsste. Wenn der Workflow nur läuft, weil er innerhalb des Anbieter-Stacks lebt, besitzen Sie den Workflow nicht.

Kadenz: schriftliche Reviews und Live-Zugriff

Tägliche Prüfung durch den Operator (intern, Sie sehen das nicht, sollten aber wissen, dass es passiert). Wöchentliche schriftliche Zusammenfassung an Sie mit Schlüsselmetriken und etwaigen Ausnahmen. Zweiwöchentliche Tuning-Session, in der der Operator Sie durch vorgeschlagene und ausgelieferte Änderungen führt. Monatlicher Business Review, der die KPIs des Workflows an das Geschäftsergebnis bindet, dem er dient.

Alles darunter und der Workflow driftet und Sie erfahren es spät.

Ein SLA, das Sie tatsächlich durchsetzen können

Anbieter veröffentlichen gerne „99,9 % Uptime" als SLA. Das ist für einen AI-Agent-Workflow weitgehend bedeutungslos, weil die richtige Uptime-Metrik auf Workflow-Ebene liegt, nicht auf Infrastruktur-Ebene. Das SLA, das Sie wollen, umfasst: First-Response-Time auf Ausnahmen (z. B. 4 Stunden in Geschäftszeiten), Durchsatz-Untergrenzen (z. B. mindestens 100 Transaktionen/Tag im Normalbetrieb) und Eskalationspfad mit benannten Personen. Mit Remedies, die real sind — Gutschrift auf die nächste Rechnung bei zwei aufeinanderfolgenden Monaten Verfehlung, Kündigungsrecht bei drei.

Sicherheits- und Compliance-Posture

SOC 2 Type II in der Reifephase. Für jüngere Anbieter: schriftliche Security Policy, jährlicher Penetrationstest-Bericht, benannter DPO oder äquivalent, unterzeichnetes DPA, benannte Sub-Auftragsverarbeiter, definiertes Breach-Notification-Fenster (72 Stunden ist Standard). EU-Datenresidenz, wenn Sie in der EU sind — siehe AI agents data residency in the EU und AI agents and GDPR compliance.

Dokumentation und Runbooks

Ein echter Managed AI Service liefert Dokumentation, die einem Nachfolgeteam (Ihrem oder einem anderen Anbieter) erlaubt, den Workflow ohne tribale Kenntnis zu verstehen. Mindestens: ein Architekturdiagramm mit Inputs, Entscheidungspunkten, Tool-Calls und Outputs; eine schriftliche Beschreibung jedes Prompts und warum er so strukturiert ist; ein Runbook für die drei bis fünf häufigsten operativen Probleme; ein Changelog jeder ausgelieferten Änderung mit Begründung.

Das ist die Lieferung, die Käufer beim Unterschreiben unterschätzen und beim Austritt überschätzen. Der richtige Zeitpunkt, die Dokumentationslieferung zu verhandeln, ist jetzt, bevor der Anbieter entscheidet, ob er in das Schreiben investiert.

Ein monatliches Business-Review-Dokument

Kein Screenshot des Dashboards. Ein schriftliches Narrativ, das abdeckt: was der Workflow diesen Monat gegen die KPIs geleistet hat, was sich am Verhalten des Agents geändert hat und warum, was schiefging und was der Operator dagegen unternahm, was für nächsten Monat vorgeschlagen wird und eine ehrliche Einschätzung, wo der Workflow degradiert oder besser wird. 2–4 Seiten plus Anhang mit den Zahlen.

Die Qualität dieses Dokuments über die Zeit ist der beste Frühindikator für die Gesundheit der Beziehung. Wenn der Monthly Review wie eine Vorlage aussieht, läuft das Engagement aus — meist bevor eine Seite es zugibt.

Was NICHT enthalten ist (und das ist okay)

Ein echter Managed AI Service enthält nicht: den Bau neuer Workflows außerhalb des vereinbarten Scope (das ist eine separate Beauftragung), das Training Ihres Teams, die Arbeit selbst zu machen (das ist Beratung), interner Sponsor des Projekts zu sein (das ist der Job Ihres COO) oder Ergebnisse zu besitzen, die der Agent nicht beeinflusst (ein SDR-Agent besitzt keine Pipeline, wenn Ihr Sales-Team kaputt ist).

Anbieter, die all dies in den Scope nehmen, versprechen zu viel. Anbieter, die all dies ausschließen, scopen zu wenig. Dazwischen leben kompetente Dienstleistungsunternehmen.

Wo Logitelia hineinpasst

Die Managed AI Teams von Logitelia liefern jeden Punkt dieser Liste als Standard-Scope. Wenn Sie den vollen Käuferrahmen lesen wollen, ist die Säule Wie wählt man 2026 ein AI-Agents-Dienstleistungsunternehmen aus. Wenn Sie den Fit auf einen konkreten Workflow testen wollen, buchen Sie einen Intro-Call und wir gehen den Scope of Work in 30 Minuten durch.

Sehen, wie ein echter Managed-AI-Agent-Scope für Ihr Team aussieht? Wir teilen ein annotiertes Beispiel in einem 30-minütigen Call.

Book intro call