Skip to main content
Lehrkonzept

Thematologie und Topic Modeling

Author

Keywords: Thematologie, Topic Modeling, Computational Literary Studies, Textannotation, Reflektierte Textanalyse, Lehrkonzept, Bachelorstudium

How to Cite:

Jacke, Janina. 2026. Thematologie und Topic Modeling. Hg. von Axel Pichler und Nils Reiter. forTEXT 3, Nr. 1. Sonderausgabe: Reflektierte Textanalyse in der Hochschullehre (16. März): 1–19. doi:10.48694/fortext.4244.

34 Views

15 Downloads

Published on
2026-03-16

Peer Reviewed

Abstract

Die beschriebene Lehrveranstaltung zielt darauf ab, Bachelor-Studierende der Literaturwissenschaft in das literaturwissenschaftliche Arbeitsfeld der Thematologie einzuführen. Darüber hinaus erproben und reflektieren sie unterschiedliche digitale Textanalysemethoden (Konkordanz- und Kookkurrenzanalyse, manuelle Annotation und Topic Modeling), die im Rahmen thematologischer Fragestellungen eingesetzt werden können. Da Studierende in der Regel im Rahmen dieses Seminars erstmals mit digitalen Methoden in Kontakt kommen, liegt der Fokus darauf, reflektierte computergestützte Textanalyse zunächst einmal kennenzulernen und ihre Potenziale und Grenzen im Zusammenhang mit literaturwissenschaftlichen Erkenntnisinteressen zu eruieren.

Inhalt

  1. Einführung

  2. Gesamtablauf

  3. Tabellarische Sitzungsübersicht

  4. Sitzungen im Detail

  5. Reflexion

1 Einführung

Rahmenbedingungen

Das Seminar „Thematologie und Topic Modeling” wurde im Wintersemester 2024/2025 an der Christian-Albrechts-Universität zu Kiel synchron durchgeführt und war für 14 90-minütige Sitzungen konzipiert. Es wurde von ca. 20 Studierenden im dritten Bachelorjahr des Studiengangs Deutsch besucht. Die Studierenden konnten 4 LP (Teilnahme) oder 5 bzw. 9 LP (Prüfung) erwerben, mit einer ca. 12- bzw. ca. 15-seitigen Hausarbeit als Prüfungsleistung. Die Unterschiede in Bezug auf Leistungspunkte und Seitenzahl sind jeweils durch das Modul bedingt, in dem die Studierenden das Seminar belegen.

Voraussetzungen der Teilnehmenden

Das Seminar ist an Bachelor-Studierende der Literaturwissenschaft gerichtet und lässt sich in unterschiedlichen Studiengängen mit philologischem Anteil durchführen. Die Studierenden sollten gute Deutschkenntnisse sowie Grundkenntnisse hinsichtlich der Analyse und Interpretation literarischer Texte der drei Gattungen (Lyrik, Prosa, Drama) mitbringen. Darüber hinaus sollten sie Grundtechniken des wissenschaftlichen Arbeitens beherrschen und bereits eine literaturwissenschaftliche Hausarbeit mit selbst entwickelter Forschungsfrage geschrieben haben. Es werden keinerlei Programmierkenntnisse oder Vorerfahrung mit digitaler Textanalyse vorausgesetzt. Benötigt werden für das Seminar Laptop und Internetverbindung.

Durchführung der Lehrveranstaltung

Für die Durchführung des Seminars werden Beamer, Laptop und WLAN benötigt. Über eine Online-Plattform (hier: OpenOLAT) werden den Studierenden die unterschiedlichen Lernmaterialien zur Verfügung gestellt. Dazu gehören insbesondere Forschungstexte (zu Theorien, Methoden und literaturhistorischer Forschung auf dem Feld der Thematologie sowie zu den behandelten digitalen Textanalysemethoden), drei kurze literarische Übungstexte unterschiedlicher Gattungen sowie Handbücher, schriftliche Tutorials und Links zu Video-Tutorials für die verwendeten Tools. Darüber hinaus haben die Studierenden die Aufgabe, im Laufe der ersten Semesterwochen selbst ein literarisches Thema, einen Stoff oder ein Motiv zu wählen und einen (ca. 50 bis 100 Seiten langen) literarischen Text auszusuchen und zu beschaffen, der im Zusammenhang mit dem gewählten thematologischen Aspekt interessant ist. Die Texte werden ebenfalls über OpenOLAT für alle Seminarteilnehmer*innen zur Verfügung gestellt. Darüber hinaus sind die Studierenden dazu angehalten, gemeinfreien Texten, wenn möglich, den Vorzug zu geben. Da die Texte aber nur seminarintern genutzt werden und die Studierenden bei Nutzung des OLAT-Seminarraumes eine entsprechende Versicherung abgeben, ist auch die Arbeit mit anderen Texten möglich. Für die Studierenden gibt es wöchentliche Aufgaben zur Vorbereitung der Sitzungen. In den meisten Fällen handelt es sich dabei um das Lesen von Forschungstexten. Teilweise ist auch die Installation von bzw. Anmeldung bei den Tools erforderlich, die in der folgenden Sitzung genutzt werden.

Das Seminar kann mit einer Studienleistung (Teilnahme und Bearbeitung der Hausaufgaben) abgeschlossen werden oder mit einer Hausarbeit als Prüfungsleistung. Dabei ist die Vorgabe für die Hausarbeit, dass die Studierenden eigenständig eine Forschungsfrage mit thematologischem Fokus (etwa Untersuchung des Motivinventars bzw. der Motivstruktur oder ästhetische Umsetzung eines Themas) entwickeln sollen, der sie anhand von (je nach gewählten Methoden) mindestens zwei sinnvoll ausgewählten literarischen Texten nachgehen, mit einer abschließenden Einordnung in die relevante bisherige (thematologische) Forschung. Da das Seminar selbst einen methodischen bzw. methodologischen Fokus hat, gibt es keine vorgegebene Primärtext-Lektüre und die Studierenden haben im Hinblick auf die Textauswahl keine Vorgaben. Auch hinsichtlich der angewendeten Methoden obliegt es der Entscheidung der Studierenden, ob sie ihrer Forschungsfrage unter Hinzuziehung digitaler Methoden nachgehen möchten. Der Grund dafür besteht vor allem darin, dass in diesem Seminar für die Studierenden der Erstkontakt mit digitalen Textanalysemethoden stattfindet und zum Seminarende noch keine fundierte Kompetenz im Umgang mit den entsprechenden Tools vorausgesetzt werden kann.

2 Gesamtablauf

Das Seminar zielt darauf ab, die Studierenden mit den wichtigsten Zielen, Konzepten und Methoden des literaturwissenschaftlichen Arbeitsfelds der Thematologie vertraut zu machen und sie Möglichkeiten erproben zu lassen, traditionelle Forschungsmethoden reflektiert durch digitale Textanalysemethoden zu ergänzen. Nach der einführenden Sitzung, in der die Studierenden über Lernziele, Seminarplan und Prüfungsleistung informiert werden, gliedert sich das Seminar in zwei Blöcke:

Der erste Block umfasst vier Sitzungen und ist der Einführung in das Feld der Thematologie gewidmet, also der „systematische[n] und problemorientierte[n] Untersuchung literarischer Stoffe, Motive und Themen im diachronen […] Vergleich” (Lubkoll 2009, 747). Dabei sollen im Seminar zwei zentrale thematologische Erkenntnisinteressen im Fokus stehen: einerseits die Untersuchung des Themeninventars und der Themenstruktur von Texten, andererseits die Untersuchung der Fragen, wie ein konkretes Thema in literarischen Texten formal umgesetzt wird und wie der Text sich ggf. zu diesem Thema positioniert. Beide Varianten werden unter Berücksichtigung von Gattungsunterschieden gemeinsam exemplarisch (zunächst ohne Einsatz digitaler Textanalysemethoden) eingeübt – in diesem Rahmen werden auch Kriterien für die Korpuszusammenstellung und Methoden des Textvergleichs reflektiert.

Der zweite Block des Seminars umfasst acht Sitzungen. Nach einer kurzen Einführung in die computationelle Literaturwissenschaft werden hier unterschiedliche digitale Textanalysemethoden erprobt und reflektiert, die die literarische Themenforschung unterstützen können. Zum Einsatz kommen drei Methoden mit jeweils unterschiedlichen Lernzielen. Die erste eingesetzte Methode ist die Konkordanz- und Kookkurrenzanalyse mithilfe des Tools AntConc (Anthony 2024). Hier lernen die Studierenden erstmals den Zugang zu literarischen Texten über deren Wortmaterial kennen, erproben die Relevanz von Referenzkorpora und reflektieren Potenziale und Grenzen der Methode für thematologische Fragestellungen. Als zweite Methode kommt manuelle Annotation mit der Software CATMA zum Einsatz (Meister und Petris 2025). Die Studierenden erproben die Erstellung von Tagsets, Annotationsrichtlinien und Annotationen für die Analyse der Umsetzung eines konkreten Themas sowie die Analyse der Themenstruktur von Texten. Damit lernen sie die Vorzüge und Grenzen eines flexiblen kategorienbasierten Close-Reading-Zugangs kennen. Abschließend experimentieren die Studierenden drittens mit dem Topic Modeling als einer Methode, die die Arbeit mit großen Korpora erleichtert und in Aussicht stellt, Ergebnisse zu produzieren, die eng mit Forschungsfragen der Thematologie verbunden sind. Als Tool kommt der DARIAH Topics Explorer zum Einsatz (Simmler, Thorsten und Pielström 2019). Lernziele bestehen hier insbesondere darin, grundlegende Techniken zur Optimierung von Topics kennen zu lernen, zugleich aber auch die Unterschiede zwischen den thematologischen Konzepten Thema, Motiv und Stoff einerseits und dem Konzept des Topics zu reflektieren und das Topic Modeling als nicht-reproduzierbare Methode einschätzen zu lernen. Die Studierenden arbeiten frühzeitig mit bzw. an selbstgewählten Themenschwerpunkten und Texten und werden an die Entwicklung einer Forschungsfrage und die Erstellung eines Textkorpus herangeführt, an dem sie im Rahmen ihrer Hausarbeiten (mit oder ohne Einsatz digitaler Methoden) reflektierte Themenforschung betreiben.

3 Tabellarische Sitzungsübersicht

Sitzung Modus Thema Inhalt (Lern)ziel Vorbereitung für Studierende Lehrvorbereitung Arbeitsauftrag
1 Präsenz Einführung Übersicht Semesterplanung, Prüfungsleistung Lektüre von Lubkoll (2009)
2 Präsenz Was ist Thematologie? Theoretische Grundlagen der Thematologie Kennenlernen von Definitionen wichtiger Grundbegriffe Lubkoll (2009) Links zu digitalen Textsammlungen bereitstellen Lektüre von Grote (2017); Rakusa (2023); Hofmannsthal (1979) sowie Auswahl von Text und Thema/Motiv/Stoff
3 Präsenz Umsetzung eines Themas in lyrischen, epischen und dramatischen Texten Gattungsspezifische Analyse der Umsetzung von Themen Auffrischung von Textanalyse- und Interpretationskompetenzen Grote (2017); Rakusa (2023); Hofmannsthal (1979) Lektüre von Frenzel (1984)
4 Präsenz Themenstruktur in lyrischen, epischen und dramatischen Texten Analyse von Themeninventar und -struktur Methodenrekonstruktion aus Forschungstext; Kennenlernen von Themen-/Motivtypologie Frenzel (1984) Typologien von Kurwinkel und Jakobi (2023) und Wolpers (2002) auf Folien zusammenstellen Abgabe einer themenbezogenen Analyse- und Interpretationsskizze
5 Präsenz Korpuszusammenstellung und Textvergleich Kriterien der Korpusbildung; Methoden des Textvergleichs Kennenlernen von Varianten der Korpuskonstruktion und von Kriterien für produktiven Textvergleich Varianten der Korpuserstellung von Schöch (2017) auf Folien zusammenstellen Lektüre von Pichler und Reiter (2021)
6 Präsenz Einführung in die digitale Literaturwissenschaft Ziele und Methoden der digitalen Literaturwissenschaft; Operationalisierung literaturwissenschaftlicher Konzepte Vertrautmachen mit zergliedernder Arbeitsweise der computationellen Literaturwissenschaft Pichler und Reiter (2021) Korrektur der vor Sitzung 5 abgegebenen Analysen; Kurze Einführung in Erkenntnisinteressen und Arbeitsweisen der computationellen Literaturwissenschaft vorbereiten Installation von AntConc; Lektüre von Anthony (2024)
7 Präsenz Konkordanzanalyse I Einführung in die Konkordanzanalyse mit AntConc Kennenlernen der Funktionen von AntConc Installation von AntConc; Anthony (2024) Umwandlung der Primärtexte der Studierenden ins TXT-Format; kurze Einführung in Distant Reading vs. Close Reading in der Literaturwissenschaft vorbereiten Vorverarbeitetes Korpus herunterladen; Entwicklung von Ideen für sinnvolle Teilkorpora
8 Präsenz Konkordanzanalyse II Einsatz der Konkordanzanalyse für thematologische Fragestellungen; Arbeit mit Referenzkorpus Reflektierter Einsatz der Konkordanzanalyse Vorverarbeitetes Korpus herunterladen; Ideen für sinnvolle Teilkorpora Kurzen Einblick in das Tool Voyant vorbereiten Lektüre von Jacke (2024); Schauen von CATMA-Video-Tutorials; Anlegen eines CATMA-Accounts; Vorbereitung einer Fragestellung für Annotation
9 Präsenz Manuelle Annotation I Einführung in die manuelle Annotation mit CATMA Erstes Erstellen von Tagset, Annotationen und Annotationsrichtlinien Jacke (2024); CATMA-Video-Tutorials; CATMA-Account; Fragestellung für Annotation Weiterarbeit an Annotation, Tagset und Guidelines
10 Präsenz Manuelle Annotation II Einsatz der manuellen Annotation für thematologische Fragestellungen Reflektiertes Annotieren Probleme bei der Annotation dokumentieren Fertigstellung der Annotationen; Hochladen der Annotationsrichtlinien; Schauen von CATMA-Video-Tutorial zu Analysefunktionen
11 Präsenz Manuelle Annotation III Kennenlernen der Analysefunktionen von CATMA Analyse der Annotationen: Queries und Visualisierungen Schauen von CATMA-Video-Tutorial Lektüre von Horstmann (2024); Schauen eines Video-Tutorials zum DARIAH Topics Explorer; Installation des DARIAH Topics Explorers
12 Präsenz Topic Modeling I Kennenlernen der Methode des Topic Modeling; Einführung in den DARIAH Topics Explorer Grundverständnis der Methode des Topic Modeling; Experimentieren mit Erstellung von Topics Horstmann (2024); Video-Tutorials DARIAH Topics Explorer; Installation DARIAH Topics Explorers generische Stoppwortliste fürs Deutsche im Projektraum hinterlegen Entwicklung von Ideen für Fragestellung, Korpus und Methode für Hausarbeiten
13 Präsenz Topic Modeling II Reflexion der Methode des Topic Modeling; Diskussion möglicher Hausarbeitsthemen Verstehen der Relation von Themen und Topics; Verständnis der Relevanz von Preprocessing Ideen für Fragestellung, Korpus und Methode für Hausarbeiten Ergebnisse des Beitrags von Uglanova und Gius (2020) auf Folien zusammenstellen
14 Präsenz Abschluss/Resümee Zusammenfassung und Abschlussdiskussion

4 Sitzungen im Detail

1. Sitzung: Einführung

Die Teilnehmenden werden mit Lernzielen, Seminarplan und Studien- und Prüfungsleistungen vertraut gemacht. Zur Vorbereitung der kommenden Sitzung bekommen die Studierenden die Aufgabe, einen in die Thematologie einführenden Text zu lesen (Lubkoll 2009).

2. Sitzung: Was ist Thematologie?

Die Studierenden lernen Konzepte, Erkenntnisinteressen, Methoden und Korpora der literaturwissenschaftlichen Themenforschung kennen. Dazu rekapitulieren sie zunächst zu zweit anhand von drei Fragen den zu Hause gelesenen Text (ca. 10 Minuten): 1.) Was ist Thematologie? 2.) Welche zentralen Konzepte definiert Lubkoll? 3.) Welche Forderungen an thematologische Forschung formuliert Lubkoll?

Diese Fragen werden im Anschluss daran im Plenum diskutiert. Die Lehrperson dokumentiert die Diskussion an der Tafel. Die Studierenden lernen hier eine enge und eine weite Definition von „Thematologie” kennen, ebenso wie Definitionen und Beispiele für die Konzepte Thema, Motiv und Stoff. Theoretische Schwierigkeiten, die anhand der Definitionen diskutiert werden sollten, sind der vorherrschende Pluralismus von Definitionen für diese Konzepte sowie deren Unschärfe. Wichtig (insb. im Hinblick auf die spätere computationelle Analyse) ist die Erkenntnis, dass Themen interpretative Abstraktionen sind, die sich nicht notwendigerweise am Wortmaterial eines Textes festmachen lassen. Hauptsächlich entlang der von Lubkoll entwickelten engen Definition von Thematologie als „systematische und problemorientierte Untersuchung literarischer Stoffe, Motive und Themen im diachronen und interkulturellen Vergleich” (Lubkoll 2009, 747) werden als Forderungen an thematologische Forschung Systematik (Methodenreflexion, Korpuszusammenstellung), Ästhetik- und Problemorientierung (Interpretation und Kontextualisierung statt bloßer Deskription und Inventarisierung), Historizität und Interkulturalität herausgestellt und problematisiert.

Zur Vorbereitung der folgenden Sitzung erhalten die Studierenden die Aufgabe, drei kurze literarische Texte zu lesen: Hugo von Hofmannthals Gedicht Erfahrung (1891) (Hofmannsthal 1979), Wilfrid Grotes Mini-Drama Der Anfang vor dem Ende (1987) (Grote 2017) und Ilma Rakusas Erzählung Durch Schnee (2006) (Rakusa 2023). Außerdem sollen die Studierenden ein literarisches Thema, ein Motiv oder einen Stoff auswählen, das/der sie interessiert, ebenso wie einen passenden literarischen Text, der idealerweise 50 bis 100 Seiten umfasst und digital verfügbar ist. Den Studierenden werden in diesem Zusammenhang Links zu digitalen Textsammlungen zur Verfügung gestellt. Die Texte sollen bis zur nächsten Sitzung in den Projektraum geladen werden (unter Nennung des auswählenden Studierenden und des gewählten Themas/Motivs/Stoffes in der Beschreibung). Die Studierenden sollen den ausgewählten Text bis zur vierten Sitzung gelesen haben. Hintergrund dieser Aufgabe ist die Idee, dass die Studierenden im größten Teil des Seminars zur Erprobung der relevanten Methoden bereits an einem Thema/Motiv/Stoff bzw. einem Text arbeiten, der ihrem Interesse entspricht – es gibt (neben den drei kurzen Texte zur dritten Sitzung) keine Themen- oder Literaturvorgabe.

Aus den von den Teilnehmenden zusammengetragenen Texten ergibt sich dann auch ein (opportunistisches, heterogenes) Korpus, an dem korpusbasierte Methoden in einem ersten Zugang erprobt werden können. Die Studierenden haben im Verlauf des Semesters die Möglichkeit, zum gewählten Text und Thema/Motiv/Stoff eine Fragestellung für die Hausarbeiten zu entwickeln und ein passendes Korpus zusammenzustellen. Änderungen von Thema/Motiv/Stoff und Text sind aber auch möglich.

3. Sitzung: Untersuchung der Umsetzung eines Themas in lyrischen, epischen und dramatischen Texten

Die Studierenden frischen in dieser Sitzung ihre gattungsspezifische Analyse- und Interpretationskompetenz auf. Zum Einstieg nennt zunächst jede*r kurz den ausgewählten literarischen Text und das Thema, das Motiv oder den Stoff. Danach wird eine grobe Einteilungsoption thematologischer Fragestellungen eingeführt, die im weiteren Verlauf des Seminars immer wieder aufgegriffen wird: Zum einen kann untersucht werden, wie ein Motiv, Thema oder Stoff in einem literarischen Korpus umgesetzt wird – hier kann nach der formalen Umsetzung sowie nach der Rolle des Motivs/Themas/Stoffes im Zusammenhang mit einer möglichen Textbotschaft (im Sinne von Beardsleys thesis, Beardsley (1958, 409--419)) gefragt werden. Zum anderen können Motiv-/Stoff-/Themeninventars bzw. -struktur eines literarischen Korpus untersucht werden. In dieser Sitzung steht die erste Fragerichtung im Fokus. Lernziele sind hier die Auffrischung grundlegender Kategorien und Techniken der Textanalyse unter Berücksichtigung von Gattungsspezifika sowie eine Auseinandersetzung mit der Idee einer ‚Textbotschaft’.

Wichtiges Thema der drei vorbereitend gelesenen Texte ist Ehebruch. In drei Gruppen bearbeiten die Teilnehmenden je einen der Texte und diskutieren die folgenden Fragen (ca. 30 Minuten):

1.) Was ist das zentrale Thema des Textes? Können Sie Ihre Antwort begründen? 2.) Wie positioniert sich der Text zu dem Thema bzw. welche Rolle spielt es im Rahmen der ‚Botschaft’ des Werkes? Bitte begründen Sie! 3.) Welche Besonderheiten in der Art und Weise der Umsetzung des Themas lassen sich in dem Text feststellen? Aktivieren Sie Ihr (gattungsspezifisches) Textanalysewissen!

Im Plenum stellen die Gruppen ihre Ergebnisse vor. Anschließend werden die folgenden beiden Fragen diskutiert:

1.) In welchem Zusammenhang standen in Ihrer praktischen Gruppenarbeit Textanalyse und Interpretation? 2.) Lassen sich die drei Texte sinnvoll vergleichen?

Die Studierenden lernen hier zum einen, gattungsspezifische ästhetische Möglichkeiten der literarischen Umsetzung von Themen herauszuarbeiten und zu vergleichen. Zum anderen werden sie dazu angeregt, über die bloße Textdeskription hinauszugehen, zugleich aber ihre Interpretationsansätze an Deskription und Analyse zurückzubinden. Schließlich wird noch erste Aufmerksamkeit auf die Relevanz von bzw. Kriterien für gelungene Korpuskonstruktion gelenkt. Zur nächsten Sitzung lesen die Studierenden einen Forschungstext, der v.a. die inventarisierende Fragerichtung der Thematologie illustriert (Frenzel 1984).

4. Sitzung: Untersuchung der Themenstruktur in lyrischen, epischen und dramatischen Texten

In dieser Sitzung steht die inventarisierende bzw. strukturierende Fragerichtung der Thematologie bzw. Stoff- und Motivgeschichte im Fokus – exemplarisch anhand eines Forschungstextes und in der eigenen Anwendung. Im Plenum werden folgende Fragen zum vorbereiteten Forschungstext diskutiert:

1.) Was sind die Ziele und Methoden dieses Forschungstextes? 2.) Was sind die Ergebnisse? 3.) Was können wir im Rahmen unseres thematologischen Seminars damit anfangen?

Es soll hier herausgestellt werden, dass in dem Forschungstext viele Themen/Motive/Stoffe der Naturlyrik inventarisierend identifiziert, die Texte nicht in der Tiefe analysiert werden, aber auch auf Funktion und Wirkung der eingesetzten Motivik eingegangen und diese im Epochenkontext verortet wird. Die Vor- und Nachteile dieses Vorgehens werden diskutiert.

Die Lehrperson führt mit Folien eine Taxonomie zur Systematisierung von Themen/Motiven/Stoffen ein (orientiert an Kurwinkel und Jakobi (2023)) sowie Kategorien für die Analyse der Themen-, Motiv- und Stoffstruktur von Texten (orientiert an Wolpers (2002)).

Die Studierenden erhalten die Aufgabe, in Einzel- oder Partnerarbeit einen der drei kurzen literarischen Texte im Hinblick auf Themeninventar und -struktur zu untersuchen. Die Ergebnisse werden im Plenum verglichen und diskutiert. Hier geht es darum, eine alternative Schwerpunktsetzung kennen zu lernen: eine gründlichere und kategorienbasierte themenbezogene Analyse von wenigen Texten.

Die Studierenden erhalten die Hausaufgabe, für den von Ihnen individuell ausgewählten Text unter Nutzung der kennengelernten Techniken eine themenbezogene Analyse- und Interpretationsskizze mit selbstgewähltem Fokus zu schreiben und abzugeben. Die Lehrperson gibt diese vor Semesterende mit Anmerkungen versehen zurück.

5. Sitzung: Korpuszusammenstellung und Textvergleich

Die Studierenden sollen in dieser Sitzung die Vorteile und Schwierigkeiten korpusbasierten und textvergleichenden Arbeitens sowie Kriterien für Korpusbildung und Textvergleich kennen lernen. Dazu werden zunächst im Plenum die folgenden Fragen diskutiert:

1.) Welche Vorteile haben Textvergleiche? 2.) Nach welchen Kriterien erfolgt die Auswahl eines Vergleichstextes? 3.) Welche Vorteile haben größere Korpora? 4.) Nach welchen Kriterien könnte man Korpora zusammenstellen? 5.) Welche Arten von Ergebnissen kann man in Abhängigkeit von den Korpora (bzw. den Kriterien) herausbekommen?

Ziel dieser Diskussion besteht vor allem darin, ein Problembewusstsein zu entwickeln und zu erkennen, dass thematologische Fragestellungen auf eine gewisse Repräsentativität abzielen und korpusbasiertes Arbeiten erfordern, in der traditionellen Literaturwissenschaft allerdings kaum Kriterien der Korpusbildung reflektiert werden. Die Lehrperson führt mit Präsentationsfolien Varianten der Korpusbildung in den Digital Humanities ein (orientiert an Schöch (2017)). Im Anschluss werden folgende Fragen im Plenum diskutiert:

1.) Welche Gemeinsamkeiten und Unterschiede können Sie feststellen zwischen ‚unserer’ literaturwissenschaftlichen Perspektive und der Perspektive der Digital Humanities? 2.) Wie lassen sie sich erklären? 3.) Können wir etwas für die literaturwissenschaftliche Korpuszusammenstellung ‚mitnehmen’?

Es soll v.a. herausgestellt werden, dass sich die Kriterien der Korpuszusammenstellung an den Erkenntniszielen und den verwendeten Methoden orientieren sollten und dass bei inhaltlich motiviertem Erkenntnisinteresse (z.B. Untersuchung der historischen Entwicklung eines literarischen Themas) Probleme bei der Identifikation relevanter Texte auftreten können, die in Schöchs Ansatz noch nicht berücksichtigt werden. Schließlich wird noch diskutiert, wie bei einem Textvergleich vorgegangen werden kann. Hier soll gelernt werden, dass bei der Auswahl von Vergleichstexten für den traditionellen Textvergleich möglichst wenige und gut ausgewählte Parameter variieren sollten, damit die Ergebnisse interpretierbar bleiben. Außerdem sollten die Texte nach denselben Kriterien analysiert werden. Die Studierenden erhalten in Einzelarbeit (10 Minuten) die Aufgabe zu reflektieren, nach welchen Kriterien sie den ausgewählten Text für ihre Hausarbeit zu einem Korpus erweitern könnten. Einige der Ideen werden im Plenum vorgestellt. Zur nächsten Sitzung soll ein Forschungstext zur Operationalisierung in den Digital Humanities vorbereitet werden (Pichler und Reiter 2021).

6. Sitzung: Einführung in die digitale Literaturwissenschaft

Die Sitzung beginnt mit einer kurzen Einführung in Erkenntnisinteressen und Arbeitsweisen der computationellen Literaturwissenschaft. Die Studierenden tauschen sich im Anschluss in Gruppen über den vorbereiteten Forschungstext aus und diskutieren folgende Fragen (ca. 20 Minuten):

1.) Was sind die Ziele von Pichler und Reiter (2021)? 2.) Welche Methoden wen den sie an, um die Ziele zu erreichen? 3.) Was sind die Ergebnisse?

Im Anschluss werden die Ergebnisse im Plenum vorgestellt und diskutiert. Die Studierenden sollen hier die methodisch-reflektierte Vorgehensweise in der computationellen Literaturwissenschaft und deren Vorzüge und Grenzen kennen lernen. Im Fokus steht dabei der Versuch, von literaturwissenschaftlichen Erkenntnisinteressen auszugehen und diese in Teilschritte zu zergliedern. Im Plenum diskutierte Anschlussfragen lauten:

1.) Können wir das in Pichler/Reiter demonstrierte Vorgehen auf thematologische Fragstellungen anwenden? 2.) Wie würden Sie ansetzen?

Ein wichtiges Lernziel besteht hier darin zu erkennen, dass auch Teiloperationalisierungen bzw. die Nutzung digitaler Methoden als Heuristik im Zusammenhang mit literaturwissenschaftlichen Fragen sinnvoll sein können, wenn sie reflektiert eingesetzt werden. Zur nächsten Sitzung sollen die Studierenden das Programm AntConc auf ihren Laptops installieren und diese mitbringen. Zudem soll das Handbuch zur Nutzung von AntConc (Anthony 2024) gelesen werden.

7. Sitzung: Konkordanzanalyse I

Zum Einstieg erhalten die Studierenden von der Lehrperson eine kurze Einführung in das Themenfeld Distant Reading vs. Close Reading in der Literaturwissenschaft. Im Anschluss wird über Preprocessing gesprochen. Die Lehrperson hat alle von den Teilnehmer*innen ausgewählten und in den Projektraum hochgeladenen Texte vorbereitend ins TXT-Format umgewandelt. Die Teilnehmer*innen sollen jetzt ihre Texte öffnen und prüfen, ob sich in der Datei Wortmaterial befindet, das nicht in die Analyse eingehen soll. Dieses soll gelöscht werden und die aktualisierten Versionen werden in den Projektraum hochgeladen. In Einzel- oder Partnerarbeit befassen sich die Teilnehmer*innen jetzt mit AntConc und bearbeiten die folgenden drei Aufgaben (ca. 45 Minuten):

1.) Reflektieren Sie, welche Möglichkeiten es geben könnte, thematologische Fragestellungen in AntConc zu operationalisieren. 2.) Erstellen Sie in AntConc ein Korpus, das vorerst nur aus Ihrem Text besteht. Erkunden Sie das Wortmaterial des Textes. Gibt es Auffälligkeiten, die sich thematologisch weiter erkunden ließen? 3.) Stellen Sie eine Wortliste zusammen, die für das Thema/Motiv, das Sie untersuchen möchten, relevant sein könnten. Erkunden Sie das Vorkommen und die Besonderheiten dieser Wörter im Text mithilfe von AntConc. Potenziell interessante Beobachtungen werden im Plenum vorgestellt und diskutiert.

Ergebnisse und Schwierigkeiten werden im Plenum besprochen. Es geht in dieser Sitzung darum, dass die Studierenden einen ersten angeleiteten Versuch unternehmen, die Erkundung von Konkordanzen und Kookkurrenzen für thematologische Fragestellungen nutzbar zu machen. Für die folgende Sitzung sollen alle das bereinigte Textkorpus herunterladen und sich Gedanken dazu machen, welche Möglichkeiten es gibt, aus Teilmengen des Gesamtkorpus ein Ziel und ein Referenzkorpus zu erstellen.

8. Sitzung: Konkordanzanalyse II

Ziel der Sitzung ist das Erlernen eines differenzierteren und reflektierteren Einsatzes der Konkordanzanalyse. Es werden einige der zu Hause entwickelten Ideen zu sinnvollen Teilkorpora und die Funktion von Referenzkorpora besprochen. In Einzelarbeit legen die Studierenden ein Zielkorpus an, das den von ihnen gewählten Text enthält, sowie ein Referenzkorpus. Die Teilnehmer*innen untersuchen ihr Zielkorpus explorativ oder hypothesengetrieben mit thematologischem Fokus (ca. 40 Minuten). Die Lehrperson liefert einen kurzen Einblick in das Tool Voyant als niedrigschwellige Alternative zu AntConc. Dabei wird auch auf mögliche Tücken des methodisch sauberen Arbeitens mit AntConc eingegangen. Im Anschluss tauschen sich die Teilnehmer*innen anhand zweier Fragen zu zweit über die erprobte Methode aus:

1.) Haben Sie den Eindruck, dass die Konkordanz- und Kollokationsanalyse die thematologische Textarbeit bereichern kann? 2.) Wo sehen Sie relevante Stärken bzw. Schwächen?

Die Diskussion wird in dann in das Plenum überführt. Dabei sollte auch die Frage thematisiert werden, ob sich die Methode für beide der kennengelernten thematologischen Fragerichtungen eignet (siehe 3. Sitzung). Außerdem sollte darauf eingegangen werden, dass das Auftreten bestimmter Inhaltswörter weder ein notwendiges noch ein hinreichendes Kriterium für das Vorkommen bestimmter Themen ist. Für die nächste Sitzung soll ein Text zur Methode der manuellen Annotation gelesen (Jacke 2024) und es sollen vier CATMA-Video-Tutorials angesehen werden (forTEXT 2019d; forTEXT 2019e; forTEXT 2019f; forTEXT 2020a).1 Die Studierenden sollen einen CATMA-Account anlegen und sich überlegen, welche thematologischen Fragestellung sie in einem Close-Reading- bzw. Annotationssetting nachgehen wollen.

9. Sitzung: Manuelle Annotation I

In dieser Sitzung lernen die Studierenden Einsatzmöglichkeiten von Annotation für thematologische Analyse kennen und führen dafür vorbereitende Schritte aus. Die Teilnehmer*innen haben Gelegenheit, Fragen zum vorbereiteten Text zu stellen, und stellen ihre Ideen für annotationsbasierte thematologische Fragestellungen an ihre Texte vor. Im Anschluss wird CATMA gemeinsam erkundet, indem alle einem gemeinsamen Projekt beitreten, einen Text hochladen, eine Annotation Collection erstellen, sich anschauen, wie ein Tagset erstellt wird und wie das Annotieren funktioniert. Für die restliche Sitzung sollen die Studierenden drei Aufgaben anhand ihrer Fragestellung bearbeiten:

1.) Beginnen Sie, ein Tagset zu erstellen, mit dem Sie Ihre Frage zur Umsetzung eines Themas in Ihrem Text bearbeiten könnten. 2.) Arbeiten Sie dabei parallel an der Erstellung von Annotationsrichtlinien für Ihr Tagset, also einer (groben) Anleitung für die Anwendung des Tagsets. Laden Sie dafür aus dem OLAT-Raum das „Template Annotationsrichtlinien” (siehe Anhang: „A1_Template_Annotationsrichtlinien”) herunter, das Sie im Unterordner zu dieser Sitzung finden. 3.) Beginnen Sie mit der Annotation Ihres Textes (bzw. ggf. konkreter Textpassagen) unter Nutzung des Tagsets. Zu Hause soll weiter an der Annotation gearbeitet werden.

10. Sitzung: Manuelle Annotation II

Die Studierenden erlangen in dieser Sitzung weitere Praxiserfahrung im Annotieren. Es werden zum Einstieg eventuelle Probleme bei der Annotation besprochen. Einige Teilnehmer*innen stellen ihre Annotationsaufgabe, das Tagset und die Guidelines vor. Im Anschluss wird weiter individuell an der Annotation gearbeitet. Als Hausaufgabe wird die Annotation fertiggestellt und die aktualisierte Version der Annotationsrichtlinien wird in den Projektraum hochgeladen. Zudem soll als Hausaufgabe ein Video-Tutorial angeschaut werden, das die Analysefunktionen in CATMA erklärt (forTEXT 2020b).2

11. Sitzung: Manuelle Annotation III

Neben dem Kennenlernen der Analyse von Annotationen ist ein zentrales Lernziel dieser Sitzung die kritische Reflexion von Annotation als literaturwissenschaftliche Methode. Die Studierenden erhalten die Aufgabe, ihre Annotationen in CATMA mittels der dort vorhandenen Analyseoptionen zu erkunden (30 Minuten). Dafür werden ihnen drei grundlegende Optionen vorgestellt: die Erkundung von Annotationen im Annotate-Modul, die Nutzung von Queries (u.a. ‚Taglist’) sowie die Visualisierungsoptionen (insbesondere der Distributionsgraph). Abschließend wird diskutiert, ob Annotation eine sinnvolle Methode im Zusammenhang mit literaturwissenschaftlichen Fragen darstellt. Herauszuarbeitende Vorteile sind hier u.a. das systematische und flexible textnahe Arbeiten mittels Annotationskategorien, die auch interpretative Operationen zulassen. Ein Manko ist der Zeitaufwand, der sich aber ggf. durch kollaboratives Arbeiten abfangen lässt.

Als Hausaufgabe sollen die Teilnehmer*innen einen Einführungstext zur Methode des Topic Modeling lesen (Horstmann 2024), sich drei Video-Tutorials zum DARIAH Topics Explorer anschauen (forTEXT 2019a; forTEXT 2019b; forTEXT 2019c)3 und die Software auf ihren Laptops installieren.

12. Sitzung: Topic Modeling I

Die Studierenden lernen das Topic Modeling als Methode kennen. Dafür setzen sich zunächst zwei Teilnehmer*innen zusammen und rekapitulieren den vorbereiteten Text anhand von drei Fragen:

1.) Nach welchem Prinzip funktioniert (in einfachen Worten formuliert) Topic Modeling? 2.) Wie sieht der „Output” beim Topic Modeling aus? 3.) Welche besonderen Herausforderungen bringt diese Methode mit sich? Die Ergebnisse werden im Plenum diskutiert.

Gemeinsam wird der DARIAH Topics Explorer ausprobiert, wobei das Gesamtkorpus der von den Studierenden ausgewählten Texte verwendet wird. Die Lehrperson stellt unterschiedliche Methoden zur Verbesserung der Topics vor, die im verwendeten Tool verfügbar sind (v.a. Veränderung der Parameter „Anzahl der Topics” und „Anzahl der Durchläufe”, Veränderung des Korpus (z.B. Weglassen problematischer Texte), Bearbeitung der Stoppwort-Liste). Eine generische Stoppwortliste fürs Deutsche findet sich im Projektraum. Darüber hinaus wird angemerkt, dass im Rahmen anderer Software, deren Nutzung Programmierkenntnisse erfordert, weitere Möglichkeiten zur Optimierung von Topics zur Verfügung stehen (siehe Du 2022, 141--190 für Optimierungsmöglichkeiten). Die Teilnehmer*innen experimentieren im Folgenden mit der Optimierung der Topics. Ergebnisse werden im Plenum vorgestellt und diskutiert. Als Hausaufgabe zur nächsten Sitzung überlegen sich die Teilnehmer*innen ein mögliches Hausarbeitsthema und formulieren ihre thematologische Fragestellung, Ideen zum Korpus sowie das geplante Vorgehen.

13. Sitzung: Topic Modeling II

Die Methode des Topic Modeling wird in dieser Sitzung kritisch reflektiert, wobei u.a. die Relation zwischen literarischen Themen und Topics im Zentrum steht. Die Lehrperson stellt ein Beispiel vor, wie Topic Modeling in der literaturwissenschaftlichen Forschung zum Einsatz kommt und welche Rolle unterschiedlichen Varianten des Preprocessing für die Interpretierbarkeit der Topics zukommt (orientiert an Uglanova und Gius (2020)). Im Plenum werden das Potenzial und die Grenzen des Topic Modeling für thematologische Fragestellungen diskutiert. Eine besondere Rolle spielt dabei die Tatsache, dass die Potenziale der Methode in einer Lehrveranstaltung für Einsteiger*innen aufgrund fehlender Programmierkenntnisse nicht ausgeschöpft werden können. Die Studierenden stellen Ihre Ideen und Fragen zu Hausarbeitsthemen vor.

14. Sitzung: Abschluss/Resümee

Die Studierenden haben Gelegenheit, Fragen zu stellen. Von der Lehrperson werden folgende Diskussionsfragen eingebracht:

1.) Welche Arten von Fragestellungen werden im Rahmen der Thematologie bearbeitet? 2.) Wie lassen sich geeignete (Vergleichs-)Texte finden? 3.) Mit welchen Methoden lassen sich thematologische Fragestellungen Ihres Erachtens am besten bearbeiten? Warum?

Der Fokus sollte darauf liegen, herauszustellen, wie nicht-digitale und verschiedene kennengelernte digitale Methoden ineinandergreifen können, um thematologische Fragestellungen unterschiedlicher Ausrichtung zu bearbeiten. Darüber hinaus sollte auch diskutiert werden, welche Herangehensweisen und Perspektiven der digitalen Methoden sich auch im Rahmen nicht-digitaler Ansätze einbringen lassen.

5 Reflexion

Im Folgenden sollen zunächst noch einmal knapp die Gründe für die konzeptionellen und didaktischen Entscheidungen im Rahmen dieser Lehrveranstaltung zusammengefasst werden. Im Anschluss wird reflektiert, an welchen Stellen Modfikationspotenziale liegen. Die Grundidee der Lehrveranstaltung liegt darin, Studierenden der Literaturwissenschaft einen ersten Einblick in computationelle Methoden zur Literaturanalyse zu ermöglichen. Da am Durchführungsstandort bisher keinerlei anderes Lehrangebot auf diesem Feld vorhanden ist, sollten verschiedene Maximen umgesetzt werden:

1.) Das Seminar sollte niedrigschwellig gestaltet sein, Studierende sollten also noch nicht an das Programmieren herangeführt werden. Zudem ist der Einsatz digitaler Methoden in den als Prüfungsleistung verfassten Hausarbeiten nicht zwingend. 2.) Da die Studierenden im Seminar methodisch mit viel Neuem konfrontiert sind, sollten sie die Möglichkeit bekommen, den Untersuchungsgegenstand bereits im Seminar dem eigenen Interesse entsprechend zu wählen. Dabei konnte auch auf bereits bekannte Texte zurückgegriffen werden. 3.) Um ein authentisches Bild des potenziellen Nutzens digitaler Textanalysemethoden zu vermitteln, sollten keine vorfabrizierten ‚Pointen’ eingesetzt werden, sondern die Methoden ergebnisoffen auf von den Studierenden gewählte Texte angewendet und der Nutzen gemeinsam reflektiert werden. 4.) Es sollte darum gehen, Studierenden den (potenziellen) Nutzen digitaler Methoden für das literaturwissenschaftliche Arbeiten aufzuzeigen. Darum ist eine gründliche Reflexion der literaturwissenschaftlichen Grundlagen notwendig. Dies sollte konkret durch eine lose Orientierung am CRETA-Workflow der reflektierten Textanalyse umgesetzt werden (s.u.). Der CRETA-Workflow ist ein Best-Practice-Modell für den Einsatz reflektierter Textanalyse in den Digital Humanities, der von der CRETA-Arbeitsgruppe entwickelt wurde (Pichler und Reiter 2020; vgl. Pichler und Reiter 2026 in dieser Ausgabe) . 5.) Das Feld der Thematologie wurde ausgewählt, da durch das tendenziell korpusbasierte Vorgehen der Einsatz computationeller Methoden naheliegt. Außerdem ist die (scheinbare) Nähe zwischen Thema und Topic ein guter Ausgangspunkt, um Gemeinsamkeiten und Unterschiede zwischen traditionell-literaturwissenschaftlichen und stochastikbasierten Konzepten zu reflektieren. 6.) Um keinen zu einseitigen Eindruck von den Möglichkeiten digitaler Textanalyse zu vermitteln, sollten unterschiedliche und verschiedenartige Methoden eingeführt werden, die sich komplementär einsetzen lassen.

Ich möchte etwas genauer darauf eingehen, in welcher Weise der CRETA-Workflow Eingang in das Seminar gefunden hat und wie die Auswahl der Methoden begründet ist: Zentral ist im Seminar die Reflexion und Ausdifferenzierung von Erkenntniszielen der literarischen Themenforschung. Um Studierende mit wenig Erfahrung mit der methodisch-zergliedernden Verfahrensweise langsam an dieses Vorgehen heranzuführen, geschieht dies im ersten Block zunächst im nicht-digitalen Bereich. Im zweiten Block bietet die Konkordanzanalyse mit AntConc zum Einstieg die Möglichkeit, mit einem quasi-regelbasierten und damit für die Studierenden durchschaubaren Vorgehen an das Distant Reading heranzuführen und etwa zu erproben, ob im Rahmen der traditionellen, nicht-digitalen Herangehensweise festgestellte Themen mit konkreten Inhaltswort(kombination)en korrelieren. Unterschiedliche thematologische Fragerichtungen werden im Anschluss im Rahmen manueller Annotation mit CATMA operationalisiert, wobei den Studierenden ein jeweils selbstgewählter Text als Arbeits‚korpus’ dient. Eine ‚Minimalevaluation’ erfolgt hier v.a. durch Vergleich und Diskussion der Herangehensweisen und die Integration einer Iterationsschlaufe (Überarbeitung von Tagset, Guidelines und Annotationen). Darüber hinaus besteht die Möglichkeit, die manuelle Annotation mit den Ergebnissen der Konkordanzanalyse abzugleichen und die Vor- und Nachteile der Methoden abzuwägen.

Aufgrund der fehlenden Vorerfahrung mit digitaler Textanalyse wird nicht im engeren Sinne an, wohl aber mit Automatisierung gearbeitet: Für die Analyse von Themeninventar/-strukturierung wird mit der Methode des Topic Modeling mit dem DARIAH Topics Explorer experimentiert. Das Referenzkorpus bildet hier die Summe der individuell gewählten Einzeltexte. Auf diese Weise können (teil-)automatisch generierte Topics mit den jeweils manuell identifizierten Themen verglichen und dadurch zumindest teilweise evaluiert werden. Nachdem Potenzial und Kombinierbarkeit der verschiedenen nicht-digitalen und digitalen Textanalysemethoden im Seminar erprobt und diskutiert worden sind, entscheiden sich die Studierenden im Rahmen der Hausarbeiten für eine Forschungsfrage und eine Variante der Operationalisierung. Vor diesem Hintergrund erweitern sie in der Regel den zu Anfang individuell gewählten Text durch reflektierte Hinzufügung weiterer Texte zu einem Inhaltskorpus. Die Ergebnisse der Analyse werden voraussichtlich vornehmlich manuell inspiziert (im Seminar werden nur sehr niedrigschwellige Methoden der quantitativen Auswertung, z.B. in CATMA, vermittelt). Die Interpretation der Befunde, die im Seminar jeweils kursorisch erfolgt ist, soll in den Hausarbeiten unter Berücksichtigung thematologischer und literaturhistorischer Forschungsliteratur erfolgen.

Im Folgenden sollen die Nachteile der konzeptionellen didaktischen Entscheidungen reflektiert und Alternativoptionen aufgezeigt werden. Die größten Probleme bestanden m.E. darin, dass die Anforderungen tendenziell zu hoch für die Lerngruppe waren und es zugleich nicht immer gelungen ist, das Potenzial digitaler Textanalyseverfahren zu vermitteln. Beide Probleme sind durch technische Komplikationen verstärkt worden – insbesondere im Zusammenhang mit dem DARIAH Topics Explorer, den einige Studierende auf ihren Laptops nicht zum Laufen bringen konnten. Zur potenziellen Überforderung kann beitragen, dass in dem Seminar viel unterschiedlicher Lernstoff untergebracht ist, dem jeweils tendenziell nur wenig Zeit gewidmet werden kann: Neben dem Feld der computergestützten Textanalyse, mit dem die Studierenden zum ersten Mal konfrontiert werden, sind die meisten weder mit dem Feld der Thematologie noch mit dem Fokus auf theoretisches und methodisches Arbeiten in der Literaturwissenschaft vertraut. Eine Möglichkeit, dieses Problem abzumildern, wäre eventuell ein Anknüpfen an Inhalte aus dem literaturwissenschaftlichen Einführungskurs, also bspw. an narratologische Fragestellungen, sinnvoller gewesen. Auch die Methode des Topic Modeling selbst hat sich als wenig geeignet für Einsteiger*innen erwiesen. Zwar existieren niedrigschwellige Tools, aber zum einen fehlen dort wichtige Möglichkeiten der Feinjustierung, so dass die Studierenden kaum interpretierbare Topics produzieren konnten. Zum anderen gab es die bereits erwähnten technischen Probleme mit dem DARIAH Topics Explorer. Hier gäbe es unterschiedliche Möglichkeiten der Anpassung: Soll Thematologie als Untersuchungsfeld beibehalten werden, könnte das Topic Modeling entweder als Methode weggelassen werden oder es könnte als einzige digitale Methode (oder ggf. eine von zweien), dafür aber ausführlicher zum Einsatz kommen. In letzterem Fall bietet sich als Software entweder Orange an (Demšar u. a. 2013), das den Einsatz von Topic Modeling mit und ohne Einsatz von Coding erlaubt, oder ggf. die Arbeit mit Jupyter Notebooks, mit denen Studierende langsam auch an Programmieraufgaben herangeführt werden könnten.4

Schließlich waren die Studierenden tendenziell auch dadurch überfordert, dass sie fast von Beginn an mit eigenen Texten und Fragestellungen arbeiten sollten. Hier wäre auszuprobieren, ob stärkere Vorgaben und Aufgaben mit klaren Lösungen ggf. doch eine bessere Alternative zur freien Auswahl sein können. Striktere Vorgaben hätten zudem auch die Erstellung eines thematisch stärker kuratierten Korpus ermöglicht, auf dessen Basis dann wiederum ggf. besser interpretierbare Topics generiert worden wären. Auch die geplante engere Verschränkung der Methoden (z.B. die Überprüfung von Topics mittels manueller Annotation) wäre durch die Vorgabe von gemeinsamen Annotationsaufgaben, die sich unter den Teilnehmer*innen aufteilen und anschließend aggregieren lassen, wahrscheinlich besser umzusetzen gewesen. Neben der Überforderung (durch Neues, zu viel Lernstoff und zu viel Eigenleistung), und teilweise wahrscheinlich durch auch diese bedingt, waren die Studierenden tendenziell vom Mehrwert der digitalen Methoden enttäuscht. Konkret ging es darum, dass die Ergebnisse der Konkordanz- und Kollokationsanalyse sowie des Topic Modeling nur in einigen Fällen interessante Ergebnisse produziert haben und diese Ergebnisse jeweils nur als Heuristik fungierten, also Ideen für textuelle Besonderheiten oder Interpretationshypothesen geliefert haben, die potenziell für thematologische Fragestellungen interessant sind. Im Fall der manuellen Annotation bestand die Enttäuschung dagegen darin, dass sich das Vorgehen nicht nennenswert vom nicht-digitalen Arbeiten unterscheidet. Die Abwägung besserer Strukturierungs- und Analysefunktionen gegen die technischen Herausforderungen fiel auf Seite der Studierenden deswegen oft gegen die Nutzung von digitalen Methoden in den Hausarbeiten aus. Möglichkeiten wären hier zum einen – entgegen der ursprünglichen Erwägung – die Vorbereitung von ‚Pointen’ der Methoden, so dass diese, angewandt auf bestimmte Texte, sehr aussagekräftige und hilfreiche Ergebnisse erzielen. Zum anderen könnte die intensivere Auseinandersetzung der Studierenden mit den digitalen Methoden dadurch erzwungen werden, dass ihr Einsatz in den Hausarbeiten obligatorisch ist. Persönlich würde ich diese beiden Maßnahmen jedoch eher nicht einsetzen – denn die Erkenntnis, dass digitale Methoden nicht automatisch bedeutsame Ergebnisse erzielen, kann auch als ein Lernerfolg betrachtet werden. Darüber hinaus wäre zu überlegen, ob die Nutzung von LLMs zur Herausstellung von literarischen Themen in das Seminar inkludiert werden könnte. In diesem Zusammenhang ließe sich dann das Verhältnis von ‚beeindruckenden’ Ergebnissen und methodischer Nachvollziehbarkeit (und, in der Konsequenz, die wissenschaftliche Nützlichkeit computergestützter Methoden) noch pointierter reflektieren.

Als positiv erwiesen hat sich in der vorgestellten Lehrveranstaltung die enge Verbindung von literaturwissenschaftlicher Theorie- und Methodenreflexion mit der Erprobung digitaler Textanalysemethoden, die m.E. auch den Kern der reflektierten Textanalyse darstellt. So haben die Studierenden beispielsweise vermehrt zurückgemeldet, dass sie die systematisierenden und strukturierenden Verfahrensweisen, die sie insbesondere im Zusammenhang mit der Erstellung von Tagsets und der manuellen Annotation kennen gelernt haben, zukünftig stärker in ihre literaturwissenschaftlichen Arbeiten einbeziehen wollen.5

Literaturverzeichnis

Anthony, Laurence. 2024. AntConc (Windows, MacOS, Linux) Build 4.3.1. https://www.laurenceanthony.net/software/antconc/releases/AntConc431/help.pdf (zugegriffen: 26. Januar 2026).

Beardsley, Monroe C. 1958. Aesthetics. Problems in the Philosophy of Criticism. 2. Aufl. Indianapolis/Cambridge: Hackett.

Demšar, Janez, Tomaž Curk, Aleš Erjavec, Črt Gorup, Tomaž Hočevar, Mitar Milutinovič, Martin Možina, u. a. 2013. Orange: Data Mining Toolbox in Python. Journal of Machine Learning Research 14, Nr. 71: 2349–2353. http://jmlr.org/papers/v14/demsar13a.html (zugegriffen: 21. Januar 2026).

Du, Keli. 2022. Zum Verständnis des LDA Topic Modeling: eine Evaluation aus Sicht der Digital Humanities. Dissertation, Würzburg: Julius-Maximilians-Universität Würzburg.

forTEXT. 2019a. Tutorial: DARIAH Topics Explorer Installieren. Topic Modeling Und Literaturanalyse. Februar. doi: 10.5281/zenodo.10371074,.

———. 2019b. Tutorial: DARIAH Topics Explorer Zur Literaturanalyse Nutzen. Topic Modeling Und Literaturanalyse. Februar. doi: 10.5281/zenodo.10372228,.

———. 2019c. Tutorial: Drei Methoden Für Bessere Topics Beim Topic Modeling. Topic Modeling Und Literaturanalyse. März. doi: 10.5281/zenodo.10378213,.

———. 2019d. Tutorial: CATMA 6 Zur Digitalen Annotation Nutzen. Manuelle Annotation Und Literaturanalyse. Oktober. doi: 10.5281/zenodo.10353556,.

———. 2019e. Tutorial: Projektmanagement in CATMA 6. Manuelle Annotation Und Literaturanalyse. November. doi: 10.5281/zenodo.10353713,.

———. 2019f. Tutorial: Tagsets in CATMA 6 Anlegen. Manuelle Annotation Und Literaturanalyse. Dezember. doi: 10.5281/zenodo.10377968,.

———. 2020a. Tutorial: In CATMA 6 Annotieren. Manuelle Annotation Und Literaturanalyse. Januar. doi: 10.5281/zenodo.10353910,.

forTEXT. 2020b. Tutorial: Analysieren und visualisieren mit CATMA. Februar. doi: 10.5281/zenodo.10276637, https://zenodo.org/records/10276637.

Frenzel, Elisabeth. 1984. Stufen der deutschen Naturlyrik von Brockes bis Eichendorff. Erkenntnis und poetische Erfassung der außermenschlichen Umwelt. In: Motive und Themen romantischer Naturdichtung. Textanalysen und Traditionszusammenhänge, hg. von Theodor Wolpers, 190–200. Göttingen: Vandenhoeck & Ruprecht.

Grote, Wilfrid. 2017. Der Anfang vor dem Ende. In: MiniDramen, hg. von Karlheinz Braun, 135–136. 9. Aufl. Frankfurt a. M.: Verlag der Autoren.

Hofmannsthal, Hugo von. 1979. Erfahrung. In: Gesammelte Werke in zehn Einzelbänden, Band 1: Gedichte, Dramen:117–118. Frankfurt a. M.: Fischer.

Horstmann, Jan. 2024. Methodenbeitrag: Topic Modeling. Hg. von Evelyn Gius 1, Nr. 8. doi: 10.48694/FORTEXT.3717, https://www.fortext-hefte.de/article/id/3717/ (zugegriffen: 21. Januar 2026).

Jacke, Janina. 2024. Methodenbeitrag: Manuelle Annotation. forTEXT 1, Nr. 4 (August). doi: 10.48694/fortext.3748, https://www.fortext-hefte.de/article/id/3748/ (zugegriffen: 15. März 2025).

Kurwinkel, Tobias und Stefanie Jakobi. 2023. Thematologie im 21. Jahrhundert: Die transmediale Motivanalyse. Textpraxis 21, Nr. 2. doi: 10.17879/19958492841, https://miami.uni-muenster.de/Record/9719a6bc-4d67-48c0-a2a1-5aa94c28430b (zugegriffen: 15. März 2025).

Lubkoll, Christine. 2009. Thematologie. In: Methodengeschichte der Germanistik, hg. von Jost Schneider, 747–762. De Gruyter.

Meister, Malte und Marco Petris. 2025. CATMA. https://doi.org/10.5281/zenodo.1470118.

Pichler, Axel und Nils Reiter. 2020. Reflektierte Textanalyse. In: Reflektierte algorithmische Textanalyse, hg. von Nils Reiter, Axel Pichler, und Jonas Kuhn, 43–60. De Gruyter, 20. Juli. doi: 10.1515/9783110693973-003, https://www.degruyter.com/document/doi/10.1515/9783110693973-003/html (zugegriffen: 21. Januar 2026).

———. 2021. Zur Operationalisierung literaturwissenschaftlicher Begriffe in der algorithmischen Textanalyse. Eine Annäherung über Norbert Altenhofers hermeneutische Modellinterpretation von Kleists Das Erdbeben in Chili. JLT Articles 15, Nr. 1-2. http://www.jltonline.de/index.php/articles/article/view/1124 (zugegriffen: 11. Dezember 2023).

———. 2026. Reflektierte Textanalyse. Hg. von Axel Pichler und Reiter Nils. forTEXT 3, Nr. 1 (März): 1–7. doi: 10.48694/fortext.4263, https://journal.fortext.org/article/id/4263/.

Rakusa, Ilma. 2023. Durch Schnee. In: Kürzestgeschichten, hg. von Christine Hummel, 97–100. Stuttgart: Reclam.

Schöch, Christof. 2017. Aufbau von Datensammlungen. In: Digital Humanities. Eine Einführung, hg. von Fotis Jannidis, Hubertus Kohle, und Malte Rehbein, 223–226. Stuttgart: Metzler.

Simmler, Severin, Vitt Thorsten und Steffen Pielström. 2019. Topic Modeling with Interactive Visualizations in a GUI Tool. DataverseNL. doi: 10.34894/ENV3TX, https://doi.org/10.34894/ENV3TX (zugegriffen: 23. Januar 2026).

Uglanova, Inna und Evelyn Gius. 2020. The Order of Things. A Study on Topic Modelling of Literary Texts. In: Proceedings of the Workshop on Computational Humanities Research (CHR 2020), hg. von Folgert Karsdorp, Barbara McGillivray, Adina Nerghes, und Melvin Wevers, 57–76. http://ceur-ws.org/Vol-2723/long7.pdf.

Wolpers, Theodor. 2002. Wege der Göttinger Motiv- und Themenforschung. In: Ergebnisse und Perspektiven der literaturwissenschaftlichen Motiv- und Themenforschung, 41–112. Göttingen: Vandenhoeck & Ruprecht.

Notes

  1. Siehe auch: https://portal.fortext.org/ressourcen/videos/tutorials/manuelle-annotation-und-literaturanalyse (abgerufen am 25.11.2025). [^]
  2. Siehe auch: https://portal.fortext.org/ressourcen/videos/tutorials/manuelle-annotation-und-literaturanalyse (abgerufen am 25.11.2025). [^]
  3. Siehe auch: https://portal.fortext.org/ressourcen/videos/tutorials/topic-modeling-und-literaturanalyse (abgerufen am 25.11.2025). [^]
  4. Hier ist Jupyter4NFDI (https://base4nfdi.de/projects/jupyter4nfdi) eine geeignete Infrastruktur, um Notebooks für Nutzende zur Verfügung zu stellen. [^]
  5. Ich danke den Gutachtern Florian Barth und Julian Schröter für ihre hilfreichen Anmerkungen. [^]