✍️ Blog

KI-Anfragen gezielt schützen: Vercel warnt vor Inference-Diebstahl

6. Juni 2026·Quelle: Vercel Blog

Vercel hat ein wachsendes Sicherheitsproblem identifiziert: Kriminelle stehlen teure KI-Inferenzen (Abfragen an Sprachmodelle) und verkaufen sie weiter. Eine einzelne Anfrage an ein Frontier-Modell kostet etwa 2 Dollar – für Angreifer der perfekte Anreiz. Das Unternehmen zeigt, warum klassische Sicherheitsmaßnahmen wie IP-Rate-Limits und Login-Walls nicht ausreichen und welche neuen Schutzmechanismen nötig sind.

Die Bedrohung ist real: Eine ungeschützte KI-API im Internet kann schnell fünfstellige Rechnungen generieren. Vercel setzt deshalb auf tiefe Authentifizierung für jeden einzelnen Request – nicht nur pro Session. Das Unternehmen nutzt dafür ein System namens BotID, das jeden Zugriff analysiert. Besonders gefährdet sind offene KI-Playgrounds und Agenten-Endpoints, wo Angreifer volle Kontrolle über Prompts haben.

Attacker gehen dabei methodisch vor: Sie wrappen die fremde API in ein OpenAI- oder Anthropic-kompatibles Interface und verteilen ihre Anfragen über tausende Proxy-IPs. So umgehen sie einfache Limitierungen. Die gestohlenen Token können dann direkt in Standard-Clients wie Coding-Tools eingespeist werden – maximale Effizienz beim Weiterverkauf.

Unsere Einordnung

Inference-Diebstahl ist ein unterschätztes, aber hochrentables Problem im KI-Zeitalter – und zeigt, dass klassische Web-Security längst nicht mehr ausreicht. Die Lösung muss auf Request-Ebene ansetzen, nicht auf Session-Ebene. Das ist ein Weckruf für jeden, der KI-APIs ins Internet stellt.

Schlüsselfakten

  • Eine Anfrage an Frontier-Modelle kostet etwa $2, während HTTP-Anfragen nur Bruchteile eines Cents kosten – das 1-Million-fache Gefälle macht KI zum lukrativen Diebstahlsziel
  • Ungeschützte KI-Endpoints können schnell Zehntausende Dollar Schaden verursachen durch automatisierte Token-Diebstähle
  • Klassische Sicherheitsmaßnahmen wie IP-Rate-Limits und Auth-Walls sind unzureichend, da Angreifer Proxy-IPs in großem Maßstab nutzen
  • Attackers wrappen fremde APIs in OpenAI-/Anthropic-kompatible Adapter und verkaufen die gestohlenen Tokens mit Rabatt weiter
  • Vercel schützt sich durch Per-Request-Authentifizierung mit BotID-Analyse statt Session-basierter Kontrolle

Artikel teilen