Eine Studie von Legal Guardian Digital hat Halluzinationsraten, Verfügbarkeit und Nutzerzufriedenheit von neun führenden KI-Assistenten gemessen — mit einem überraschenden Ergebnis: Popularität und Verlässlichkeit gehen nicht Hand in Hand.

Rund jeder vierte amerikanische Arbeitnehmer nutzt KI-Assistenten regelmäßig für den Arbeitsalltag. Welche Tools dabei tatsächlich verlässlich sind, hat eine im April 2026 veröffentlichte Studie der Digitalagentur Legal Guardian Digital untersucht. Die Forscher bewerteten neun gängige Chatbots anhand von vier Kriterien: Halluzinationsrate, Nutzerbewertung, Antwortkonsistenz und Verfügbarkeit (Uptime).

Perplexity AI erzielte mit einer Halluzinationsrate von nur 13 % und einer Verfügbarkeit von 100 % den höchsten Zuverlässigkeitswert (85 von 100 Punkten). Nutzer bewerteten den Dienst im Schnitt mit 4,6 von 5 Punkten — der höchste Kundenzufriedenheitswert unter den Top 3. Mit monatlich 40 US-Dollar ist Perplexity das teuerste getestete Angebot, wird von einem Großteil der Nutzer jedoch als preiswert eingeschätzt.

Auf Platz zwei landete Grok (Zuverlässigkeitsindex: 79) mit ebenfalls 100 % Uptime und einer Fehlerquote von 15 %. DeepSeek belegte Rang drei — bemerkenswert, da der chinesische Anbieter kostenlos verfügbar ist und trotzdem eine geringere Fehlerquote (14 %) aufweist als viele kostenpflichtige Konkurrenten, darunter ChatGPT und Microsoft Copilot.

ChatGPT, Marktführer mit einem Marktanteil von rund 60 %, kam nur auf Rang sechs. Die Halluzinationsrate von 30 % bedeutet, dass drei von zehn Antworten falsche oder erfundene Informationen enthalten — mehr als doppelt so viel wie beim Erstplatzierten. Laut Studienautor Austin Hunt, CEO von Legal Guardian Digital, ist der Marktanteil von ChatGPT ein Ergebnis von Frühstartervorteilen und Marketing, nicht von überlegener Leistung.

Die 10 zuverlässigsten Chatbots im Überblick

Rang Chatbot Halluzinationsrate (%) Nutzerbewertung (0–5) Qualität & Konsistenz (0–5) Verfügbarkeit (%) Index-Score (0–100)
1 Perplexity AI 13% 4.6 3.5 100% 85
2 Grok 15% 4.5 3.5 100% 79
3 DeepSeek 14% 4.7 3.5 99.52% 76
4 Kimi 27% 4.5 4.3 99.94% 60
5 Microsoft Copilot 27% 4.4 4.0 99.9% 53
6 ChatGPT 30% 4.7 4.0 99.98% 50
7 Claude 20% 4.4 3.5 98.68% 45
8 Google Gemini 32% 4.4 4.0 99.95% 41
9 Meta AI 25% 3.4 3.4 99.9% 37

Quelle: Legal Guardian Digital (April 2026). Hervorgehobene Zeilen = Top 3.

Die vollständigen Daten sind über Legal Guardian Digital abrufbar. Quellenangabe: legalguardian.io.

Von Jakob Jung

Dr. Jakob Jung ist Chefredakteur Security Storage und Channel Germany. Er ist seit mehr als 20 Jahren im IT-Journalismus tätig. Zu seinen beruflichen Stationen gehören Computer Reseller News, Heise Resale, Informationweek, Techtarget (Storage und Datacenter) sowie ChannelBiz. Darüber hinaus ist er für zahlreiche IT-Publikationen freiberuflich tätig, darunter Computerwoche, Channelpartner, IT-Business, Storage-Insider und ZDnet. Seine Themenschwerpunkte sind Channel, Storage, Security, Datacenter, ERP und CRM. Kontakt – Contact via Mail: jakob.jung@security-storage-und-channel-germany.de

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

WordPress Cookie Hinweis von Real Cookie Banner