Arbeitsablauf

Als Projekt des ÖHI Rom entstand die digitale Edition der Nuntiatur Pius XI. in Zusammenarbeit mit dem Auftraggeber Andreas Gottsmann (ÖHI Rom), Bernhard Kronegger (Universität Passau) sowie Martin Kroißenbrunner, der als externer Mitarbeiter beteiligt war. Die Kommunikation erfolgte durch E-Mail und Videokonferenzen.

Das zu digitalisierende Material beschränkt sich auf fünf Mappen. Pro Mappe wurde derselbe Workflow angewandt: Transkription, Kollationierung, TEI-Kodierung und schließlich Internetstellung. Im Folgenden wird genauer darauf eingegangen.

Da die Erstellung digitaler Editionen einem ständigen Wandel unterliegt, der mit häufigen Anpassungen der Arbeitsmittel einhergeht, werden immer wieder kleine Änderungen vorgenommen, ohne dass diese anders als durch die Benutzung selbst dokumentiert werden. Eine Darstellung des Arbeitsablaufs kann daher nur eine Momentaufnahme sein, auch wenn wir bemüht sind, sie aktuell zu halten und auch Veränderungen im Zeitverlauf zu dokumentieren.

1. Transkription

Der erste Schritt war die Umwandlung des Ausgangsmaterials in computerlesbaren Text. Dabei wurde mit Handschrift anders umgegangen als mit Maschinenschrift. Da pro Handschrift zu wenig Traninigsmaterial vorlag, wurde manuell transkribiert. Maschinenschrift konnte halbautomatisch transkribiert werden. Dafür scannte man die Mappen zuerst mit einem hochauflösenden Buchscanner. Danach wurden die Bilddateien auf Transkribus geladen, wo ein vortrainiertes Texterkennungsmodell angewandt wurde. Danach fand eine manuelle Kontrolle statt. Nach dem Export standen die korrigierten Transkriptionen in docx-Format für die Kollation bereit. Zusätzliche Hinweise für die TEI-Kodierung (z. B. Entfernungen und Einfügungen) wurden als Kommentare in den Word Dokumenten vermerkt.

2. Kollationierung

Nach der Transkription erfolgte die Kollationierung, also der Vergleich und die Zusammenführung der unterschiedlichen Textvarianten. Ziel war es, Abweichungen zwischen den Texten systematisch zu erfassen und zu dokumentieren.

[Dafür wurden die transkribierten Texte in ein digitales Kollationierungswerkzeug importiert, das einen direkten Vergleich der Varianten ermöglichte. Neben der automatisierten Texterkennung kamen auch manuelle Prüfungen zum Einsatz, um sicherzustellen, dass keine inhaltlichen oder formalen Abweichungen übersehen wurden. Die Unterschiede wurden annotiert und in einer kritischen Edition zusammengeführt. Besondere Herausforderungen stellten dabei beschädigte oder schwer lesbare Stellen dar, die mithilfe historischer und sprachwissenschaftlicher Analysen rekonstruiert wurden.]

3. TEI-Kodierung

Die TEI-Kodierung diente der strukturierten Erfassung und Auszeichnung der transkribierten und kollationierten Texte in einem standardisierten XML-Format. Grundlage für die Kodierung bildeten die kommentierten Word-Dokumente. Zunächst wurde eine TEI-Vorlage erstellt, die alle relevanten Struktur- und Metadateninformationen berücksichtigte.

Danach wurden die entsprechenden Inhalte systematisch in das TEI-Format übertragen. Dies geschah sowohl manuell als auch halbautomatisch mithilfe eines Python-Skriptes, das die <correspContext>-Elemente generierte, die für die Navigation innerhalb der digitalen Edition notwendig waren.

4. Internetstellung

Nach der Erstellung der XML/TEI-Dateien, die auf dieser Website dargestellt werden, wurden XSLT-Dateien erzeugt. Um die Transformation und weitere notwendige Schritte für die Funktionalität der Webapplikation sowie das Deployment auf GitHub Pages zu automatisieren, wurde GitHub Actions eingesetzt. Diese Vorgangsweise basiert auf dem Static Site Generator DSE-Static-Cookiecutter. Neue Änderungen an den TEI- oder XSL-Dateien können dadurch unkompliziert in die Webapplikation integriert werden.