Lupe auf Texten in Sütterlin

Entzifferung alter deutscher Handschriften im digitalen Zeitalter

Künstliche Intelligenz, Datensicherheit und Fachkräfte bei Transkriptionen

Von Sabine Lenthe, Transcript 

Zur Datensicherheit von personenbezogenen Informationen bei der Transkription von alten deutschen Handschriften, durch KI (Künstliche Intelligenz) und die unverzichtbare Rolle professioneller Fachkräfte.

In der heutigen digitalen Ära nimmt die Nutzung von Künstlicher Intelligenz (KI) in verschiedenen Bereichen rasant zu, darunter auch die Transkription von alten deutschen Handschriften, wie Kurrentschriften, Sütterlin etc. Die Technologie verspricht Effizienz und Geschwindigkeit, birgt jedoch auch Risiken, insbesondere im Hinblick auf die Datensicherheit personenbezogener Informationen in Chroniken, Briefen, Feldpost, Tagebüchern etc. als auch in Bezug auf die Richtigkeit der Transkripte. Während KI-gestützte Systeme in der Lage sind, große Mengen an handschriftlichen Dokumenten zu entziffern/ verarbeiten, müssen wir uns der Herausforderungen bewusst sein, die mit der Verarbeitung sensibler Daten einhergehen. 

Risiken der Datensicherheit

Eines der zentralen Probleme bei der Nutzung von KI für die Transkription von alten Handschriften ist die potenzielle Verletzung der Privatsphäre. Handschriftliche Dokumente, wie Gerichtsakten, Kirchenbuchauszüge und Urkunden enthalten oft sensible, persönliche Informationen, die, wenn sie nicht ordnungsgemäß geschützt werden, in die falschen Hände geraten können. Die Speicherung und Verarbeitung dieser Daten erfordert strenge Sicherheitsmaßnahmen, um unbefugten Zugriff zu verhindern. 

Die aktuelle Gesetzgebung zum Datenschutz, wie die Datenschutz-Grundverordnung (DSGVO) in Europa, stellt zwar Anforderungen an den Umgang mit personenbezogenen Daten, doch die rasante Entwicklung der KI-Technologie stellt die Regulierungsbehörden vor Herausforderungen. Viele Unternehmen agieren in einem rechtlichen Graubereich, da sie möglicherweise nicht alle Anforderungen erfüllen oder sich nicht ausreichend über die gesetzlichen Bestimmungen informieren.  
Bedenklich ist auch, ob die Daten für das Training von KI-Modellen verwendet werden. Wenn personenbezogene Informationen in Trainingsdatensätze einfließen, besteht das Risiko, dass diese Informationen in zukünftigen Analysen oder Anwendungen wiederverwendet werden, was die Privatsphäre weiter verletzt.

Beispielgrafik

Textbeispiel KI Transkription

Die Rolle der Historiker:in

In diesem komplexen Umfeld spielt die Rolle von Fachkräften wie Historiker:innen eine entscheidende Rolle. 

Denn was zunächst als großer Fortschritt für Ahnenforscher:innen und Archive anmutet, zeigt in der Praxis in der Tat deutliche Schwächen. Die KI scheitert häufig an der Individualität historischer Handschriften und produziert fehlerhafte Transkriptionen. Besonders problematisch ist dies u.a. bei Namen, die für das Verständnis genealogischer Zusammenhänge essenziell sind. Historiker:innen bringen entscheidende Vorteile mit: Sie können sich intensiv in historische Schriften einlesen und im direkten Austausch mit Auftraggeber:innen unklare Passagen diskutieren und gemeinsam erschließen. Sie verfügen zudem über das nötige Fachwissen, um veraltete oder nur lokal gebräuchliche Begriffe zu recherchieren und Zusammenhänge zu erkennen. 

Qualitätskontrolle

Die Einbeziehung einer Historiker:in in den Prozess der KI-Transkription kann also dazu beitragen, die Qualität und Richtigkeit der Ergebnisse sicherzustellen. Historiker:innen können die von der KI erzeugten Transkripte überprüfen und auf inhaltliche Richtigkeit sowie auf den historischen Kontext achten. Dies ist besonders wichtig, da KI-Algorithmen nicht in der Lage sind, Nuancen und Bedeutungen korrekt zu erfassen, die für das Verständnis der Dokumente entscheidend sind.

Fazit

Die Transkription von alten deutschen Handschriften durch KI bietet Vorteile, doch die damit verbundenen Risiken für die Datensicherheit und Korrektheit sind nicht zu unterschätzen. Die Rolle von Fachkräften wie Historiker:innen ist also unerlässlich. Sie behandeln nicht nur personenbezogene Informationen mit der nötigen Sorgfalt, sie stellen auch sicher, dass die Transkripte exact wiedergegeben werden.