[S] Erschließung von vormodernen Handschriften
Inhalt
Eine der zentralen Herausforderungen im Kontext der Digital Humanities ist die Verfügbarmachung von Quellen für Forschung, Lehre und eine interessierte Öffentlichkeit.
Im Seminar erschließen wir Handschriften aus dem Bestand der Herrnhutischen Archive und setzen uns mit den Möglichkeiten automatischer Optical Charakter Recognition (OCR) bis hin zur TEI-konformen Edition via XML auseinander. Ziele ist es, vom Bilddigitalisat zu Repräsentationen von Texten zu gelangen, die unterschiedlichen Standards genügen, und bestehende Workflows weiter zu verbessern.
- Fehlerfreies Transkript (HTR – Handwritten Text Recognition)
- Schlankes Ausgangsdokument (XML nach TEI)
- Dokument mit Metadaten (XML-Schema)
- Normalisierter Text (zur Einspeisung in Korpusanalyseumgebungen)
- Angereichertes Dokument (Ausweisung von potentiellen Glossareinträgen und named entities)
- Publikation der Dokumente
Vorkenntnisse im Hinblick auf das Lesen der Kurrent oder Auszeichnungssprachen sind wünschenswert, aber keine Voraussetzung für den Besuch des Seminars — ein funktionsfähiges digitales Endgerät mit Officeumgebung wird vorausgesetzt.
Eine Lizenz für den OXYGEN-XML-Editor wird im Seminar gestellt, gleiches gilt für die Transkriptionsumgebung eScriptorium. Informationen zum Kontext des Seminars finden Sie auf dem Blog des Moravian Knowledge Network. Sie können im Vorfeld auch einen Blick auf unsere Selbstlernmodule werfen, die Sie auf das ein oder andere Thema schon einmal vorbereiten.
Organisation
Lehrveranstaltung im 3., 4. und 5. Studienjahr
Termin: Donnerstag, 2. DS (9:20-10:50 Uhr)
Raum: SLUB TextLab / T3
Beginn: 17.10.2024
Zentrale Kommunikationsplattform für die Veranstaltung ist eine MATRIX-Gruppe.