✍️ Blog

400 Millionen Dokumente: Bank automatisiert Datenschutz mit KI

1. Juli 2026·Quelle: Amazon AWS AI Blog

Die Huntington Bank hat eine intelligente Lösung entwickelt, um sensible Kundendaten aus über 400 Millionen archivierten Dokumenten automatisch zu schwärzen. Statt Jahre dauerte die Aufgabe mit AWS-Services nur wenige Monate. Das Projekt zeigt, wie Machine Learning Compliance-Anforderungen in Finanzinstituten effizienter macht.

Die Herausforderung war enorm: Seit 2015 sammelte sich in Huntingtons Dokumentenverwaltungssystem eine ständig wachsende Masse an Dateien an – unterschiedliche Formate, verschiedene Speicherorte, strikte Sicherheitsanforderungen. Ein manuelles oder traditionelles Verfahren wäre tatsächlich Jahre in Anspruch genommen haben. Huntington nutzte daher eine automatisierte Pipeline aus mehreren AWS-Tools: Amazon Textract extrahiert Text aus gescannten Dokumenten, Amazon SageMaker identifiziert sensitive Daten durch Machine Learning, AWS Lambda koordiniert die Verarbeitung und AWS Step Functions orchestriert den gesamten Workflow.

Das Besondere: Die Lösung erfüllt strenge Compliance-Anforderungen wie PCI-DSS-Zertifizierung und verschlüsselt Daten sowohl während des Transports als auch in der Ruhestellung. Die Genauigkeit beim Erkennen sensibler Informationen liegt über 95 Prozent – ein kritischer Schwellenwert für regulatorische Anforderungen. Die verarbeiteten Dokumente werden anschließend wieder zurück ins lokale System repliziert, um die Hybrid-Cloud-Anforderung zu erfüllen.

Dieses Projekt illustriert einen wachsenden Trend: Banken und Finanzdienstleister nutzen zunehmend Cloud-basierte KI-Services nicht primär für Innovation, sondern für Compliance und Risikomanagement. Was früher teure manuelle Arbeit erforderte, wird durch automatisierte Pipelines gelöst.

Unsere Einordnung

Ein Paradebeispiel dafür, wie KI im Banking nicht disruptiv wirkt, sondern Compliance-Lasten reduziert – und damit finanzielle wie regulatorische Risiken senkt. Solche Projekte dürften in der nächsten Dekade zum Standard werden, während äußerer Druck (regulatorisch, wettbewerblich) zunimmt.

Schlüsselfakten

  • Huntington Bank reduzierte Verarbeitungszeit von mehreren Jahren auf wenige Monate
  • Über 400 Millionen Dokumente wurden mit automatisierter KI-Pipeline verarbeitet
  • Lösung erreicht über 95 Prozent Genauigkeit beim Erkennen sensibler Daten
  • AWS-Stack: Textract, SageMaker, Lambda und Step Functions mit Verschlüsselung
  • Hybrid-Cloud-Ansatz: Daten bleiben teilweise on-premises, werden aber in AWS verarbeitet

Artikel teilen