Das Erstellen einer digitalen Edition der Variae des Cassiodor
Hierfür wird jedes einzelne der 470 Schriftstücke lemmatisiert, kommentiert, mit Metadaten versehen und in TEI/XML konvertiert.
Ausgangsmaterial für die projektbezogene Aufbereitung der Texte ist eine digitalisierte Ausgabe der Variae-Edition von Theodor Mommsen (MGH Auct. Ant. XII, Berlin 1894), die durch das Team der JGU mithilfe des EHuDesktop und mit Unterstützung des Teams Computational Historical Semantics der Johann Wolfgang Goethe-Universität Frankfurt(Prof. Dr. Bernhard Jussen) lemmatisiert wird.
Lemmatisieren bedeutet die semantische und morphologische Bestimmung einer Wortform und deren Rückführung auf ihre Grundform (Lemma bzw. Superlemma): z.B. lat. regem (dt. „den König“ zu lat. rex (dt. „der König“).

EHuDesktop, Lemmatization Editor
Die semantische Bestimmung einer Wortform ist insbesondere für die Unterscheidung von Homographen notwendig; z.B.
- lat. pōpulus (dt. „die Pappel“) und lat. populus (dt. „das Volk“)
- lat. regis (dt. „des Königs“) und lat. regis („du regierst“)
- lat. legis (dt. „des Gesetzes“) und lat. legis (dt. „du liest“)
- lat. mālus (dt. „der Apfelbaum“) und lat. mālus (dt. „der Mast“) sowie lat. malus (dt. „schlecht“)
Die morphologische Bestimmung bedeutet die Rückführung einer Wortform auf ihre Grundform und Bestimmung der Wortart unter Auszeichnung nach Kasus, Numerus, Genus, bzw. Person, Tempus, Modus, Genus verbi …
- lat. artium: Genitiv, Plural, Feminin von lat. ars (dt. „die Kunst“)
- lat. iunxerunt: 3. Person, Plural, Perfekt, Indikativ, Aktiv von lat. iungere (dt. „verbinden“)
… sowie unter Berücksichtigung unterschiedlicher graphischer Varianten:
- lat. popvlvs auf lat. populus (dt. „das Volk“)
- lat. copo auf lat. caupo (dt. „der Schankwirt“)
Gegenwärtig liegen 2 der 12 Bücher Variae sowie deren Praefatio (Liber I und III, 100 Schriftstücke) vollständig lemmatisiert, die übrigen teillemmatisiert und in TEI/XML-codierter Form für die weitere Bearbeitung vor: https://hudesktop.hucompute.org/index.jsp (Computational Historical Semantics der Johann Wolfgang Goethe-Universität Frankfurt).

Vollständig lemmatisierter Brief, hier Cassiod. Var. 1.1 (EHuDesktop, Lemmatization Editor)
Mithilfe der Anwendungen QAnnotate und TextGridLab wird jedes einzelne der 470 Schriftstücke aus den Variae unter Einbindung von Bildmaterial, digitalen Handschriften und Georeferenzen historisch-philologisch kommentiert.

Kommentar Cassiod. Var. 3.1 (TextGridLab)

Personenkommentar „Alarich II.“ (QAnnotate)
Darüber hinaus wird jedes einzelne Schriftstück der Variae mit Metadaten (tags) ausgezeichnet, d.h. mit Angaben zum Aussteller und Empfänger, zu Datierung, Inhalt, Textgattung sowie zu im Text erwähnten Orten, Personen, ethnischen, religiösen und soziale Gruppen. Aktuell ist der Liber Tertius der Variae (53 Schriftstücke) mit Metadaten angereichert.

Metadaten zu Cassiod. Var. 3.1 (QAnnotate)
Alle Dateien (lat. Text mit Metadaten, Lemmatisierung und Kommentierung) werden in TEI/XML-codierte Form überführt.

Cassiod. Var. 3.1 in TEI/XML-codierter Form (Oxygen-Editor)