Digitale Edition

Das Erstellen einer digitalen Edition der Variae des Cassiodor

Durch das Erstellen einer digitalen Edition der Variae des Cassiodor in TEI/XML-codierter Form liegen diese in einem einheitlichen Standard (Text Encoding Initiative) vor. Die Verwendung eines solchen Standards gewährleistet eine Interoperabilität, insofern als die Daten für verschiedene digitale Anwendungen lesbar und skriptgesteuert vergleichbar sind sowie in verschiedene Ausgabeformate (PDF, HTML etc.) überführt werden können.

Hierfür wird jedes einzelne der 470 Schriftstücke lemmatisiert, kommentiert, mit Metadaten versehen und in TEI/XML konvertiert.

Ausgangsmaterial für die projektbezogene Aufbereitung der Texte ist eine digitalisierte Ausgabe der Variae-Edition von Theodor Mommsen (MGH Auct. Ant. XII, Berlin 1894), die durch das Team der JGU mithilfe des EHuDesktop und mit Unterstützung des Teams Computational Historical Semantics der Johann Wolfgang Goethe-Universität Frankfurt(Prof. Dr. Bernhard Jussen) lemmatisiert wird.

Lemmatisieren bedeutet die semantische und morphologische Bestimmung einer Wortform und deren Rückführung auf ihre Grundform (Lemma bzw. Superlemma): z.B. lat. regem (dt. „den König“ zu lat. rex (dt. „der König“).

EHuDesktop, Lemmatization Editor

Die semantische Bestimmung einer Wortform ist insbesondere für die Unterscheidung von Homographen notwendig; z.B.

  • lat. pōpulus (dt. „die Pappel“) und lat. populus (dt. „das Volk“)
  • lat. regis (dt. „des Königs“) und lat. regis („du regierst“)
  • lat. legis (dt. „des Gesetzes“) und lat. legis (dt. „du liest“)
  • lat. mālus (dt. „der Apfelbaum“) und lat. mālus (dt. „der Mast“) sowie lat. malus (dt. „schlecht“)

Die morphologische Bestimmung bedeutet die Rückführung einer Wortform auf ihre Grundform und Bestimmung der Wortart unter Auszeichnung nach Kasus, Numerus, Genus, bzw. Person, Tempus, Modus, Genus verbi …

  • lat. artium: Genitiv, Plural, Feminin von lat. ars (dt. „die Kunst“)
  • lat. iunxerunt: 3. Person, Plural, Perfekt, Indikativ, Aktiv von lat. iungere (dt. „verbinden“)

… sowie unter Berücksichtigung unterschiedlicher graphischer Varianten:

  • lat. popvlvs auf lat. populus (dt. „das Volk“)
  • lat. copo auf lat. caupo (dt. „der Schankwirt“)

Gegenwärtig liegen 2 der 12 Bücher Variae sowie deren Praefatio (Liber I und III, 100 Schriftstücke) vollständig lemmatisiert, die übrigen teillemmatisiert und in TEI/XML-codierter Form für die weitere Bearbeitung vor: https://hudesktop.hucompute.org/index.jsp (Computational Historical Semantics der Johann Wolfgang Goethe-Universität Frankfurt).

Vollständig lemmatisierter Brief, hier Cassiod. Var. 1.1 (EHuDesktop, Lemmatization Editor)

Mithilfe der Anwendungen QAnnotate und TextGridLab wird jedes einzelne der 470 Schriftstücke aus den Variae unter Einbindung von Bildmaterial, digitalen Handschriften und Georeferenzen historisch-philologisch kommentiert.

Kommentar Cassiod. Var. 3.1 (TextGridLab)

Personenkommentar „Alarich II.“ (QAnnotate)

Darüber hinaus wird jedes einzelne Schriftstück der Variae mit Metadaten (tags) ausgezeichnet, d.h. mit Angaben zum Aussteller und Empfänger, zu Datierung, Inhalt, Textgattung sowie zu im Text erwähnten Orten, Personen, ethnischen, religiösen und soziale Gruppen. Aktuell ist der Liber Tertius der Variae (53 Schriftstücke) mit Metadaten angereichert.

Metadaten zu Cassiod. Var. 3.1 (QAnnotate)

Alle Dateien (lat. Text mit Metadaten, Lemmatisierung und Kommentierung) werden in TEI/XML-codierte Form überführt.

Cassiod. Var. 3.1 in TEI/XML-codierter Form (Oxygen-Editor)