OPERATIONS · 2026-05-25

12 Warnsignale bei der Bewertung eines AI-Agents-Dienstleisters

Konkrete Signale aus Sales-Prozess und Pitchdeck, die konsistent eine schlechte Managed-AI-Agents-Services-Zusammenarbeit vorhersagen. Wenn Sie drei oder mehr sehen, gehen Sie weg.

Das ist der Begleiter zu unserem Pillar-Guide Wie wählt man ein AI-Agents-Dienstleistungsunternehmen aus. Der Leitfaden hat zehn Warnsignale kurz aufgeführt; dieser Artikel entpackt zwölf mit der Begründung für jedes. Die Reihenfolge ist grob nach absteigender Schwere.

1. Demo mit ihren Daten, lehnt bezahlten Piloten auf Ihren ab

Das lauteste Einzelsignal. Jeder kompetente Anbieter kann einen polierten Agent auf einem kuratierten Datensatz zeigen, den er selbst gebaut hat. Der Agent ist auf diese Beispiele getunt. Die einzige aussagekräftige Evaluation ist der Agent im Lauf auf einem Ausschnitt Ihrer echten Daten, mit sichtbaren Fehlern. Ein 1–3-wöchiger bezahlter Pilot ist die Standardforderung. Anbieter, die ablehnen, hinhalten oder eine 12-wöchige „Discovery"-Phase vor jedem funktionierenden Artefakt verlangen, schieben Risiko zu Ihnen, das ihres sein sollte.

2. Kann keinen einzigen konkreten Failure-Mode seines Agents nennen

Jeder Produktions-Agent hat Failure-Modes. Halluzinierte Entitäten. Edge Cases bei Input-Formaten. Tool-Calls, die in Timeouts laufen. Rate-Limit-Kaskaden, wenn die Upstream-API einen schlechten Tag hat. Anbieter, die behaupten, ihr Agent habe keine Failure-Modes, haben ihn nicht lange genug laufen lassen — oder doch und verbergen, was sie gelernt haben. Die ehrliche Antwort ist eine konkrete Liste mit konkreten Geschichten.

3. „Vollständig autonom, kein Mensch nötig"-Pitch 2026

Für alles mit Kundenkontakt oder Geldfluss ist das entweder Marketing-Floskel oder ein Anbieter, der dabei ist, eine schädliche Aktion in Ihrem Namen auszuführen. Der 2026er-Standard für Produktions-Workflows ist Human-in-the-Loop auf der letzten Meile. Anbieter, die reine Autonomie über alle Workflows verkaufen, verkaufen entweder eine Zukunft, die sie nicht gebaut haben, oder freiwillig auf Ihre Kosten lernen. Siehe den Autonomie-Rahmen im Pillar-Guide.

4. Besteht darauf, Prompts, Workflow oder Eval-Suite zu besitzen, für die Sie bezahlt haben

Das 2026er-Äquivalent einer Marketingagentur, die Ihr Werbekonto besitzt. Das Argument des Anbieters: „Die IP ist mit unserer Plattform vermischt, wir können sie nicht sauber trennen." Das ist technisch wahr und operativ eine Wahl. Boutique-Anbieter mit reifen Plattformen können und übertragen IP an Arbeitsergebnissen an Kunden. Falls Ihr Anbieter das nicht tut, leasen Sie Ihren eigenen Prozess von ihm. Gehen Sie weg.

5. Kein benannter Operator, „das Team kümmert sich"

Bedeutet einen Junior, oft über viele Accounts geteilt, der nach drei Monaten ohne Vorwarnung rotiert. Der ganze Sinn eines Managed Service ist, dass eine konkrete Person für das Workflow-Ergebnis verantwortlich ist. Ohne Name keine Verantwortlichkeit. Die Antwort des Anbieters muss eine Person mit Kalender sein — kein Pool, kein Slack-Channel, kein „wir haben ein starkes Team".

6. Preise bis zum Sales-Call versteckt

Wenn das Modell vernünftig ist, veröffentlicht der Anbieter eine Spanne. Verstecken bedeutet fast immer eines von drei Dingen: Sie diskriminieren beim Preis nach Ihrem Verzweiflungsgrad, die Zahl ist peinlich hoch für das Lieferergebnis, oder es gibt keine konsistente Preisgestaltung, weil jeder Deal Maßarbeit ist (was selbst ein Warnsignal für einen „laufenden Service" ist). Der Discovery-Call existiert, um Passung zu qualifizieren und Scope anzupassen, nicht um herauszufinden, ob Sie sich die Schlagzeile leisten können.

7. Kann EU-Datenresidenz-Fragen nicht in Klartext beantworten

Für EU-Käufer ist das disqualifizierend. Ein Anbieter, der 2026 EU-Kunden bedient, sollte „wo sind unsere Daten gespeichert, wo verarbeitet das Modell, wer sind die Sub-Auftragsverarbeiter" in 60 Sekunden mit benannten Regionen und Sub-Auftragsverarbeitern beantworten. Zögern hier bedeutet entweder, sie haben nicht darüber nachgedacht, oder sie werden Ihren Vertrag improvisieren. Beides ist schlecht. Siehe AI agents data residency in the EU.

8. White-Label oder Subunternehmer für die eigentliche Arbeit ohne Offenlegung

Manche Anbieter fronten eine Sales-Motion, die Engineering oder Operations an einen Dritten subkontrahieren — oft ein Offshore-Shop, den Sie direkt nicht beauftragt hätten. Fragen Sie schriftlich: „Berührt jemand außerhalb Ihrer Firma unseren Workflow, unsere Daten oder unsere Infrastruktur?" Wenn sie ausweichen, gehen Sie weg. Offengelegte Subkontrahierung ist okay; nicht offengelegte ist betrugsnah.

9. Vertragslaufzeit über 12 Monate fest ohne klares Build-Lieferergebnis

Reiner Lock-in. Der Anreiz des Anbieters verschiebt sich mit Vertragsunterschrift von Lieferung zu Retention. Die legitimen Gründe für eine lange Festlaufzeit sind: ein bedeutender einmaliger Build, der amortisiert werden muss, oder eine regulierte Umgebung mit bekannt langer Rampe. Außerhalb dieser ist eine 12-monatige Festbindung der Anbieter, der seine Marge gegen eine Beziehung schützt, die er nicht inhaltlich gewinnen kann.

10. Sales-Prozess geführt von einem Closer, der keine technischen Fragen beantworten kann

Wenn der Account Executive jede konkrete Frage an „das Engineering-Team" oder den „AI-Lead" delegiert, den Sie nie getroffen haben, unterschreiben Sie einen Vertrag mit Leuten, die Sie nicht kennen. Verlangen Sie den Operator und den Technical Lead beim ersten oder zweiten Call. Anbieter, die sie im Vorverkauf nicht vor Sie stellen, stellen sie auch in der Lieferung nicht.

11. Garantiert konkrete Ergebnisse, bevor er Ihre Daten gesehen hat

„Wir garantieren 30 % Reduktion der Support-Bearbeitungszeit." „Wir garantieren 50 qualifizierte Leads pro Monat." Eine konkrete Garantie, ausgesprochen bevor der Anbieter Ihre Daten gesehen hat, ist entweder unehrlich oder beruht auf einer Definition von „Garantie", die den ersten schwachen Monat nicht überlebt. Echte Performance-Zusagen sind kalibriert an einer Baseline, die im Pilot etabliert wurde — nicht aus einer Slidedeck gezogen.

12. Referenzen, die alle aus den letzten 6 Monaten stammen

Der Anbieter betreibt diesen Service seit zwei Jahren, aber jede gebotene Referenz hat vor 4–6 Monaten begonnen. Zwei Möglichkeiten: Die älteren Kunden sind abgewandert und der Anbieter verbirgt es, oder die älteren Kunden sind unzufrieden und nicht bereit für das Gespräch. Fragen Sie explizit nach einer Referenz, die seit 12+ Monaten dabei ist und mindestens einmal verlängert hat. Die Pause vor der Antwort sagt Ihnen, was Sie wissen müssen.

Die Gelbsignale, die nachzuhaken lohnt

Jenseits der zwölf harten Rotsignale sollten ein paar Gelbsignale Nachfragen statt sofortigen Walk auslösen.

Der Anbieter hat in den letzten 12 Monaten umfirmiert oder rebrandet. Manchmal eine normale Evolution. Manchmal ein Weg, einem schlechten Ruf zu entkommen. Fragen Sie den Gründer direkt und prüfen Sie die LinkedIn-Historie.

Starke Abhängigkeit von einem einzigen LLM-Anbieter ohne Migrationsplan. Wenn sie nicht sagen können, wie sie damit umgehen, wenn Anthropic oder OpenAI über Nacht Preise ändern oder ein Modell abkündigen, erben Sie das Konzentrationsrisiko.

Die Case Studies sind anonym. Manchmal legitim (NDA, regulierter Kunde). Oft ein Zeichen, dass kein echter Kunde sich namentlich nennen ließ. Fragen Sie nach einer benannten Referenz, selbst wenn die Case Study anonymisiert bleibt.

Die „Plattform" sieht aus wie eine Notion-Seite plus ein Slack-Channel. Kann ein junger Anbieter mit echter Zukunft sein oder ein dünner Shop ohne echte Plattform. Klopfen Sie ab, was das Operator-Portal tatsächlich enthält.

Preise sind „ab X €" ohne diskutierte Obergrenze. Der Startpreis ist selten der echte Preis. Drücken Sie auf die typische Landezone für einen Workflow in Ihrem Maßstab.

Wie diese Liste zu nutzen ist

Sie brauchen keinen sauberen Sweep. Ein Rotsignal ist ein Gelbsignal, das eine Frage wert ist. Zwei bedeuten ein ernstes Gespräch, ob fortgesetzt wird. Drei oder mehr — gehen Sie weg; der Anbieter hat strukturelle Probleme, die in Monat sechs Ihre werden. Die Beziehung verbessert sich nach Unterschrift nicht.

Die komplementäre Liste ist die positive Checkliste im Pillar-Guide. Ein Anbieter, der 11 von 13 Checks auf der positiven Liste besteht und null dieser Rotsignale zeigt, ist selten und im Rennen wert. Ein Anbieter, der die positive Liste besteht, aber zwei dieser Signale zeigt, ist die gefährlichste Kategorie — er sieht im Sales-Prozess gut aus und verschlechtert sich vorhersehbar.

Für die Fragen, die diese Signale ans Licht bringen, siehe 20 questions to ask before hiring an AI agents services company. Für die Fälle, in denen Sie den Prozess gar nicht starten sollten, siehe When NOT to hire an AI agents services company.

Wo Logitelia hineinpasst

Logitelia veröffentlicht Preisspannen, führt bezahlte Piloten auf echten Kundendaten, überträgt IP am Arbeitsergebnis an Kunden, benennt den Senior Operator vor dem Vertrag, hostet in der EU und hat keine undisclosed Subkontrahierung. Wenn Sie den Fit gegen die obigen Signale testen wollen, buchen Sie einen Intro-Call und wir antworten konkret — einschließlich der Failure-Modes, die unsere Agents haben.

Für den vollen Rahmen lesen Sie die Säule Wie wählt man 2026 ein AI-Agents-Dienstleistungsunternehmen aus.

Sie bewerten einen AI-Agents-Services-Anbieter und wollen eine zweite Meinung zu den Warnsignalen? Wir nehmen uns 30 Minuten für einen Sanity-Check, ohne Verpflichtung.

Book intro call