Digitale Methoden

Historische Datenanalyse unter Einsatz digitaler Methoden

Das Lemmatisieren, Kommentieren, Metadatieren und Überführen der Variae in TEI/XML-codierte Form als einheitlichem Standard (Text Encoding Initiative) gewährleistet die Anwendbarkeit verschiedener digitaler Analysetools auf das Datenmaterial, was neue Forschungsperspektiven eröffnet.

Die Lemmatisierung der Schriftstücke verbessert der Trefferqualität von Suchanfragen: So lässt sich in einer Wortfeldsuche in einem lemmatisierten Text z.B. zwischen lat. populus (das Volk) und lat. pōpulus (die Pappel) unterscheiden. Ferner können bei Suchanfragen Kasusflexionen (lat. popul-orum), graphische Varianten (z.B. lat. popvlvs statt lat. populus) sowie syntaktische Bezüge (z.B. Kongruenz in Kasus, Numerus und Genus) berücksichtigt werden.

Dies ermöglicht wiederum genauere korpusbasierte linguistische Analysen. Beispielsweise können die drei unterschiedlichen Sprachniveaus, die Cassiodor in seiner Praefatio ankündigt, in Hinblick auf verschiedenste formale Parameter untersucht werden (z.B. hapax legomena, Type-Token-Ratio, Lexical Density). In einem weiteren Schritt können die so erbrachten Befunden mit qualitativen Eigenschaften der Briefe, d.h. mit ihren Metadaten, in Verbindung gebracht werden (z.B. mit dem Bildungsstand des Empfängers und/oder mit der Präsenz von inhaltlichen Digressionen).

Darüber hinaus erlaubt die Lemmatisierung der Variae eine statistische Auswertung, beispielsweise hinsichtlich von Wortverteilungen in den einzelnen Büchern, deren Visualisierung, aber auch Kookkurrenzanalysen. Hierbei handelt es sich um eine korpusanalytische Methode, mithilfe welcher das gemeinsame Auftreten von lexikalischen Einheiten (z.B. populus und Romanus) in Hinblick auf seine statistische Signifikanz untersucht werden können. Durch einen Vergleich mit anderen Textkorpora lassen sich zudem intertextuelle Bezüge Cassiodors nachweisen und sprachliche Entwicklungen des Spätlateins hin zum Mittellatein abbilden.

Kookkurrenzanalyse am Beispiel von lat. populus (EHuDesktop)

Ein Anreichern jedes einzelnen Schriftstückes mit Metadaten bereitet die Filterung der Variae nach verschiedenen Suchparametern vor, die sich miteinander kombinieren lassen. Dies ermöglicht ein von der jeweiligen Fragestellung abhängige zielgenaues Ansteuern einzelner Texte und Textteile, zum Beispiel aller Schreiben Theoderichs des Großen an Amtsträger in Ligurien aus der Zeit zwischen 507 und 513, die sich mit Fragen des Steuerwesens befassen.

Das Kommentieren z.B. der in den Variae genannten Personen erlaubt es, deren vielfältige Beziehungen hinsichtlich ihrer Qualität (politisch, wirtschaftlich, rechtlich, verwandtschaftlich etc.) und Quantität abzubilden, wobei durch den Einsatz digitaler Werkzeuge Überschneidungen und Devianzen in den verschiedenen Personennetzwerken visualisiert werden.

Personenkommentar „Alarich II.“ (QAnnotate) und kommentierter Brief an Alarich II.

Darüber hinaus ermöglicht das Taggen der Variae mit Informationen die Visualisierung relevanter Daten. Zu diesem Zweck werden die Annotationsdaten in ein Graphenmodell überführt, das die jeweiligen Beziehungen zwischen Briefen, Personen, ihre formalen und sozialen Klassifikationen sowie ihre raum- und zeitbezogenen Merkmale enthält. Dadurch lassen sich räumliche und relationale Beziehungen zwischen Personen und Briefen in Form geographischer und sozialer Netzwerke visualisieren. Darüber hinaus lassen sich über Filter- und Visualisierungseinstellungen nach den zuvor festgelegten Annotationskriterien Teilnetzwerke isolieren und Wechselbeziehungen zwischen den verschiedenen Klassifikationen verdeutlichen.

Visualisierung sozialer und geographischer Netzwerke mit Nodegoat