Transkriptionsprojekt zu den Brautbriefen von Fanny Mendelssohn-Bartholdy und Wilhelm Hensel
Die Musikabteilung der Staatsbibliothek, eine Seminargruppe der UdK Berlin sowie Stabi Lab haben ab dem Sommersemester 2024 Briefe und Billets, die Fanny Mendelssohn-Bartholdy und Wilhelm Hensel während der Zeit ihrer Verlobung ausgetauscht haben, in einem Seminarprojekt transkribiert.
Gegenstand des Transkriptionsprojekts sind drei Mappen mit insgesamt etwa 220 Briefen:
Briefe und Billets an Wilhelm Hensel aus der Verlobungszeit 1829 (Mappe 1) (MA Depos. 3,4)
Briefe und Billets an Wilhelm Hensel aus der Verlobungszeit 1829 (Mappe 2) (MA Depos. 3,5)
Briefe und Billets an Fanny Hensel aus der Verlobungszeit 1829 (MA Depos. 3,6)
Die Briefe zeichnen sich vor allem dadurch aus, dass sie den schnellen, tagesaktuellen, oft vertraulich-intimen Austausch der Verlobten ungefiltert wiedergeben. Die Briefe und Billets sind dabei kurz, selten länger als eine Seite; sie wurden meist von Bediensteten direkt dem jeweiligen Adressaten übergeben und lassen sich durchaus mit heutigen Textnachrichten vergleichen, in der Art wie sie Alltägliches (von Terminabsprachen bis zu Klagen über Zahnschmerzen), kleine Aufmerksamkeiten und Liebesschwüre mischen.
Transkriptionen
Im Seminar standen vorrangig die Briefe Fannys im Zentrum – nicht zuletzt, weil ihre Handschrift deutlich leichter zu entziffern ist als diejenige Wilhelms. Die angefertigten Transkriptionen aller 122 Briefe Fannys sind als Datenset publiziert und bilden die Grundlage für den Volltext der Briefe, wie er in den Digitalisierten Sammlungen der Staatsbibliothek abgebildet wird. Die Briefe sind damit auch für die Volltextsuche erschlossen.
Sämtliche Transkriptionen der Briefe Fannys sind als Datenset frei zugänglich publiziert:
HTR-Modelltraining
Da mit den Briefen Fannys und ihren Transkriptionen eine nicht unerhebliche Menge an Trainingsdaten für die automatische Handschriftenerkennung vorliegen (hier konkret zugespitzt auf eine persönliche Handschrift), ist es möglich, ein eigenes Modell für die Handschriftenerkennung zu trainieren (bzw. ein vorhandenes Modell nachzutrainieren). Dies erscheint gerade vor dem Hintergrund lohnend, als sich noch sehr viel mehr Handschriftliches aus der Feder Fannys im Bestand der Staatsbibliothek befindet. Mit dem richtigen Modell könnte hier recht schnell eine passable Transkription automatisch erstellt werden. Im Verlauf des Transkriptionsprojekts wurde dazu ein freies, generisches Modell auf die Handschrift Fannys nachtrainiert (fine-tuning), das auf einigen Testseiten (die nicht für das Training herangezogen wurden) sehr passable Ergebnisse liefert.
Zur Evaluation unserer Ergebnisse haben wir mit dinglehopper auf eine Eigenentwicklung aus der Staatsbibliothek zurückgegriffen. Auf fünf zufällig ausgewählten Testseiten erreicht das Modell eine Genauigkeit von über 90% (CER 0,94), sprich: 90% und mehr der Zeichen werden korrekt erkannt.
Beispielhaft hier eine Briefseite im Evaluationstool. Sie sehen links unsere Transkription (ground truth) und auf der rechten Seite den Text, den unser Modell auf dieser Briefseite „liest“ mit den jeweiligen Abweichungen in grüner/roter Markierung:
Unser Modell zur Erkennung von Fannys Handschrift ist ebenfalls frei zugänglich publiziert:
Briefe sortieren
Die Briefe Fannys und Wilhelms liegen, wie erwähnt, in drei Mappen vor, die auch die Grundlage für die drei digitalisierten Objekte in den Digitalisierten Sammlungen bilden. Innerhalb dieser Mappen sind die Briefe zwar nummeriert, die Sortierung bildet aber offensichtlich nicht die korrekte Reihenfolge der Korrespondenz ab. Dadurch und durch die Aufteilung der Mappen nach Absender, lässt sich die Korrespondenz nur schwerlich in dem schnellen Wechsel lesen, der sie gerade auszeichnet.
Nicht in allen Fällen lässt sich eine korrekte Reihenfolge der Briefe aus inhaltlichen Merkmalen erschließen. In einer Blockveranstaltung des Seminars ist es aber gelungen, einige Stränge der Korrespondenz zu rekonstruieren.
Um solche Ausschnitte aus der Korrespondenz als „virtuelle“ digitale Objekte sichtbar zu machen, hat das Stabi Lab Verfahren erprobt, für diese (oder ähnlich gelagerte Fälle) eigene IIIF-Manifeste zu erstellen, die auf die ursprünglichen Digitalisate verweisen und aus diesen einzelne Teile herausgreifen. So ist im Folgenden beispielsweise ein kurzer Ausschnitt aus der Korrespondenz zu sehen, in dem auf einen Brief Wilhelms unmittelbar Fannys Antwort folgt, auf die wiederum Wilhelm reagiert. Die Transkriptionen sind als Annotationen über das Menü im Viewer aufrufbar.



