<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3716</article-id>
<title-group>
<article-title>Lehrmodul: Topic Modeling mit dem DARIAH Topics Explorer
lehren</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0001-8047-2232</contrib-id>
<name>
<surname>Horstmann</surname>
<given-names>Jan</given-names>
</name>
<email>dh@jan-horstmann.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Münster</institution>
</institution-wrap>
</aff>
</contrib-group>
<pub-date date-type="pub" publication-format="electronic" iso-8601-date="2024-07-10">
<day>10</day>
<month>7</month>
<year>2024</year>
</pub-date>
<volume>1</volume>
<issue>8</issue>
<issue-title>Topic Modeling</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 22.07.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/lehrmodule/topic-modeling-mit-dem-dariah-topics-explorer-lehren">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2019-07-22">
<day>22</day>
<month>07</month>
<year>2019</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 22.07.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/lehrmodule/topic-modeling-mit-dem-dariah-topics-explorer-lehren">fortext.net</ext-link></p>
<sec id="eckdaten-des-lehrmoduls">
  <title>Eckdaten des Lehrmoduls</title>
  <list list-type="bullet">
    <list-item>
      <p>Thema der Sitzung: Themen und Topics bei Friedrich Schiller und
      Wilhelm Hauff</p>
    </list-item>
    <list-item>
      <p>Lernziele: Kenntnisse über die Methode des
      <xref alt="Topic Modeling" rid="glossary-topic-modeling">Topic
      Modeling</xref>, sicherer Umgang mit dem DARIAH Topics Explorer,
      kritische Bewertung der Methode, Autoren- und Epochenkenntnisse
      (Sturm und Drang, Weimarer Klassik, Romantik)</p>
    </list-item>
    <list-item>
      <p>Phasen: Einführende Begriffsdiskussion (Themen vs. Topics),
      Vorstellung und Diskussion der Methode, Demonstration der
      Toolfunktionen, Gruppenarbeit, Gruppenpräsentationen</p>
    </list-item>
    <list-item>
      <p>Sozialformen: Diskussion, Vortrag, Gruppenarbeit</p>
    </list-item>
    <list-item>
      <p>Medien/Materialien: Alle Lernenden müssen einen Laptop haben,
      auf dem der DARIAH Topics Explorer installiert ist; Lehrende
      benötigen einen Laptop und Beamer</p>
    </list-item>
    <list-item>
      <p>Dauer des Lehrmoduls: 2 x 90 Minuten</p>
    </list-item>
    <list-item>
      <p>Schwierigkeitsgrad des Tools: leicht bis mittel</p>
    </list-item>
  </list>
</sec>
<sec id="bausteine">
  <title>Bausteine</title>
  <list list-type="bullet">
    <list-item>
      <p>Verlaufsraster des Lehrmoduls: Aus welchen Phasen setzt sich
      das Lehrmodul zusammen? Dem Verlaufsplan entnehmen Sie Inhalte und
      Schwerpunkte.</p>
    </list-item>
    <list-item>
      <p>Anwendungsbeispiel: Anhand welcher Texte unterrichten Sie Topic
      Modeling? Leiten Sie die Studierenden dazu an, Themen in den
      Dramen Friedrich Schillers und den Prosawerken Wilhelm Hauffs zu
      explorieren.</p>
    </list-item>
    <list-item>
      <p>Verlauf der Unterrichtseinheit(en): Wie sieht die konkrete
      Ausgestaltung der Phasen aus und welche Arbeitsschritte werden
      vorgenommen? Erfahren Sie, wie die Unterrichtseinheit strukturiert
      ist und welche Beispielaufgaben Sie Ihren Studierenden stellen
      können.</p>
    </list-item>
    <list-item>
      <p>Lösungen zu den Beispielaufgaben: Hat die Lerngruppe die
      Beispielaufgaben richtig gelöst? Hier erfahren Sie, wie Sie die
      Antworten erhalten.</p>
    </list-item>
  </list>
  <p>Alle Materialien zu dieser Sitzung stellen wir Ihnen auf
  <ext-link ext-link-type="uri" xlink:href="https://zenodo.org/records/12530205">Zenodo</ext-link>
  zum Download bereit
  (<xref alt="forTEXT 2019e" rid="ref-fortextTopicModelingMit2019" ref-type="bibr">forTEXT
  2019e</xref>).</p>
</sec>
<sec id="verlaufraster-des-lehrmoduls">
  <title>Verlaufraster des Lehrmoduls</title>
  <table-wrap>
    <table>
      <colgroup>
        <col width="20%" />
        <col width="20%" />
        <col width="20%" />
        <col width="20%" />
        <col width="20%" />
      </colgroup>
      <thead>
        <tr>
          <th>Phase</th>
          <th>Impulse des/der Lehrenden</th>
          <th>Erwartete Aktivität der Lernenden</th>
          <th>Sozialform</th>
          <th>Medien / Materialien</th>
        </tr>
      </thead>
      <tbody>
        <tr>
          <td>Vorab und Einstieg (<italic>ca. 15 Minuten</italic>)</td>
          <td>Was unterscheidet die Begriffe Thema, Stoff, Motiv, Topos
          und Topic?</td>
          <td>Vorab: Methodeneintrag Topic Modeling
          (<xref alt="Horstmann 2024a" rid="ref-horstmannMethodenbeitragTopicModeling2018" ref-type="bibr">Horstmann
          2024a</xref>) und Lerneinheit Topic Modeling mit dem DARIAH
          Topics Explorer
          (<xref alt="Horstmann 2024b" rid="ref-horstmannLerneinheitTopicModeling2019" ref-type="bibr">Horstmann
          2024b</xref>); Beteiligung an der Diskussion</td>
          <td>Diskussion im Plenum</td>
          <td>Beamer, Laptop</td>
        </tr>
        <tr>
          <td>Problematisierung (<italic>ca. 15 Minuten</italic>)</td>
          <td>Warum ist ein Topic kein Thema? Wie funktioniert Topic
          Modeling?</td>
          <td>Beteiligung an der Diskussion; Rückbezug auf
          Methodeneintrag</td>
          <td>Diskussion im Plenum</td>
          <td>Beamer, Laptop</td>
        </tr>
        <tr>
          <td>Erarbeitung (<italic>ca. 60 Minuten</italic>)</td>
          <td>Vorstellung der Toolfunktionen; Betreuung der
          Kleingruppen</td>
          <td>Hands-on Topic Modeling in Kleingruppen; Vorbereitung
          einer Präsentation als Hausaufgabe</td>
          <td>Lehrvortrag und Gruppenarbeit</td>
          <td>Beamer, Laptop, DARIAH Topics Explorer, zwei Korpora, zwei
          Stoppwortlisten</td>
        </tr>
        <tr>
          <td>Sicherung (<italic>ca. 50 Minuten</italic>)</td>
          <td>Betreuung der Gruppen</td>
          <td>gegenseitige Präsentation der
          Gruppenarbeitsergebnisse</td>
          <td>Gruppenarbeit</td>
          <td>Laptops, DARIAH Topics Explorer, zwei Korpora, zwei
          Stoppwortlisten</td>
        </tr>
        <tr>
          <td>Reflexion &amp; Transfer (<italic>ca. 40
          Minuten</italic>)</td>
          <td>Diskussion von Schwierigkeiten, Impulse für Transfer
          geben</td>
          <td>Ergebnisse und Schwierigkeiten aus den
          Gruppenpräsentationen diskutieren</td>
          <td>Diskussion im Plenum</td>
          <td>Beamer, Laptops</td>
        </tr>
      </tbody>
    </table>
  </table-wrap>
  <p>Das Verlaufsraster steht als
  <ext-link ext-link-type="uri" xlink:href="https://zenodo.org/records/12530205">PDF-Datei</ext-link>
  zum Download auf Zotero
  (<xref alt="forTEXT 2019e" rid="ref-fortextTopicModelingMit2019" ref-type="bibr">forTEXT
  2019e</xref>) zur Verfügung.</p>
</sec>
<sec id="anwendungsbeispiel">
  <title>1. Anwendungsbeispiel</title>
  <p>In zwei Seminarsitzungen werden Sie die Methode Topic Modeling
  (<xref alt="Horstmann 2024a" rid="ref-horstmannMethodenbeitragTopicModeling2018" ref-type="bibr">Horstmann
  2024a</xref>) lehren, die ein probabilistisches Verfahren zur
  thematischen Exploration größerer Textsammlungen ist. Die Studierenden
  probieren die Methode an einem Dramenkorpus (vgl.
  <xref alt="Korpus" rid="glossary-korpus">Korpus</xref>) von Friedrich
  Schiller und einer Sammlung von Erzählungen Wilhelm Hauffs mithilfe
  des DARIAH Topics Explorers
  (<xref alt="Schumacher 2024" rid="ref-schumacherToolbeitragDARIAHTopics2018" ref-type="bibr">Schumacher
  2024</xref>) praktisch in Kleingruppen aus und präsentieren ihre
  Ergebnisse.</p>
</sec>
<sec id="verlauf-der-unterrichtseinheiten">
  <title>2. Verlauf der Unterrichtseinheiten</title>
  <sec id="vorarbeiten">
    <title>2.1 Vorarbeiten</title>
    <p>Die Studierenden sollten vorab den Methodeneintrag Topic Modeling
    (<xref alt="Horstmann 2024a" rid="ref-horstmannMethodenbeitragTopicModeling2018" ref-type="bibr">Horstmann
    2024a</xref>) und den Tooleintrag DARIAH Topics Explorer
    (<xref alt="Schumacher 2024" rid="ref-schumacherToolbeitragDARIAHTopics2018" ref-type="bibr">Schumacher
    2024</xref>) gelesen, sowie die Lerneinheit Topic Modeling mit dem
    DARIAH Topics Explorer
    (<xref alt="Horstmann 2024b" rid="ref-horstmannLerneinheitTopicModeling2019" ref-type="bibr">Horstmann
    2024b</xref>) durchgearbeitet haben. Hilfreich wäre es zudem, sie
    die Tutorialvideos Topic Modeling und Literaturanalyse
    (<xref alt="forTEXT 2019b" rid="ref-fortextTutorialDARIAHTopics2019a" ref-type="bibr">forTEXT
    2019b</xref>;
    <xref alt="forTEXT 2019a" rid="ref-fortextTutorialDARIAHTopics2019" ref-type="bibr">forTEXT
    2019a</xref>;
    <xref alt="forTEXT 2019c" rid="ref-fortextTutorialDreiMethoden2019" ref-type="bibr">forTEXT
    2019c</xref>) sowie die Fallstudie „Themen von Autoren und
    Autorinnen der Literatur des 19. Jahrhunderts“ schauen zu lassen
    (<xref alt="forTEXT 2019d" rid="ref-fortextThemenAutorenUnd2019" ref-type="bibr">forTEXT
    2019d</xref>). Im Zuge der Lerneinheit wird das Tool bereits
    installiert, sodass etwaige technische Schwierigkeiten bereits vor
    der Sitzung adressiert und behoben werden können. Außerdem sollten
    Sie Ihren Studierenden vorab das vom TextGrid Repository
    (<xref alt="Horstmann 2024c" rid="ref-horstmannRessourcenbeitragTextGridRepository2018" ref-type="bibr">Horstmann
    2024c</xref>) stammende Schillerkorpus und das Hauffkorpus sowie die
    von uns vorbereitete Stoppwortliste für das Schillerkorpus und die
    <xref alt="Stoppwortliste" rid="glossary-stoppwortliste">Stoppwortliste</xref>
    für das Hauffkorpus auf der eLearning-Plattform Ihrer Institution
    zur Verfügung stellen. Die Materialien erhalten Sie auf
    <ext-link ext-link-type="uri" xlink:href="https://zenodo.org/records/12530205">Zenodo</ext-link>
    (<xref alt="forTEXT 2019e" rid="ref-fortextTopicModelingMit2019" ref-type="bibr">forTEXT
    2019e</xref>). Möchten Sie mit anderen digitalen Textsammlungen
    arbeiten, können Sie sich diese bspw. im TextGrid Repository
    (<xref alt="Horstmann 2024c" rid="ref-horstmannRessourcenbeitragTextGridRepository2018" ref-type="bibr">Horstmann
    2024c</xref>) oder im Deutschen Textarchiv (DTA)
    (<xref alt="Horstmann und Kern 2024" rid="ref-horstmannRessourcenbeitragDeutschesTextarchiv2018" ref-type="bibr">Horstmann
    und Kern 2024</xref>) selbst zusammenstellen. Das Korpus muss
    mindestens zehn Texte enthalten, damit der Topics Explorer arbeiten
    kann, und die Texte sollten alle das gleiche Format haben. Der
    Topics Explorer kann TXT- (vgl.
    <xref alt="Reintext-Version" rid="glossary-reintext-version">Reintext-Version</xref>)
    und TEI-XML-Dateien (vgl.
    <xref alt="TEI" rid="glossary-tei">TEI</xref>;
    <xref alt="XML" rid="glossary-xml">XML</xref>) verarbeiten. Die
    Beispielaufgaben in diesem Lehrmodul beziehen sich auf das Schiller-
    und das Hauffkorpus. Sollten Sie Ihre Seminarsitzungen nicht in
    einem Computerlabor abhalten, erinnern Sie Ihre Studierenden daran,
    einen eigenen Laptop mitzubringen. Eine 1:1-Ausstattung ist
    sinnvoll, da sich der Umgang mit dem Topics Explorer durch
    eigenhändiges Ausprobieren am besten vermitteln lässt. Es sollten
    auf keinen Fall mehr als zwei Studierende an einem Gerät arbeiten.
    Je nachdem, welchen Lehrstil Sie persönlich präferieren, kann es
    sinnvoll sein, für den Einstieg in die Stunde Folien vorzubereiten,
    die die Diskussion über Topics und Themen mit Anschauungsbeispielen
    und wichtigen Schlagwörtern befördern. Wir haben Ihnen beispielhaft
    ein paar Folien für den Einstieg entworfen, die Sie nutzen oder
    weiter ausarbeiten können. Auch diese Folien erhalten Sie auf
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10276975">Zenodo</ext-link>
    (<xref alt="forTEXT 2019e" rid="ref-fortextTopicModelingMit2019" ref-type="bibr">forTEXT
    2019e</xref>).</p>
  </sec>
  <sec id="einstieg-und-problematisierung">
    <title>2.2 Einstieg und Problematisierung</title>
    <p>Um den beiden Unterrichtseinheiten (die vermutlich mit einer
    Woche Unterbrechung abgehalten werden) einen inneren Zusammenhang zu
    verleihen, sollten Sie zu Beginn transparent machen, welche
    Lernziele in den beiden Sitzungen erreicht werden sollen und was die
    Lerngruppe in den einzelnen Sitzungen erwartet.</p>
    <list list-type="bullet">
      <list-item>
        <p>Es sollen Kenntnisse über die Methode des Topic Modeling und
        ein sicherer Umgang mit dem DARIAH Topics Explorer vermittelt
        werden.</p>
      </list-item>
      <list-item>
        <p>Die Studierenden sollen einerseits die Methode kritisch
        bewerten, andererseits aber auch Autoren- und Epochenkenntnisse
        (über Sturm und Drang, Weimarer Klassik und Romantik) erwerben.
        Sie können hierbei selbst Schwerpunkte setzen.</p>
      </list-item>
    </list>
    <p>In einem literaturwissenschaftlichen Seminar bietet es sich an,
    nach Nennung der Lernziele mit einem Rückbezug auf die fachliche
    Tradition zu beginnen. Auf diese Weise werden
    literaturwissenschaftliche Fachkompetenzen vermittelt und Vorwissen
    aktiviert. Beim Topic Modeling kann dies über die Diskussion von
    Fachbegriffen geschehen. Sie starten mit einer aktivierenden
    Diskussion: Fragen Sie die Studierenden nach den Themen der bereits
    im Seminar behandelten Primärtexte oder nach den Themen von Texten,
    die Sie vorab ausgewählt haben. Sinnvoll ist es hierbei, Texte aus
    unterschiedlichen Epochen und Gattungen auszuwählen, die jedoch das
    gleiche Thema behandeln (so ist z. B. das Thema „Streben nach Macht“
    in so unterschiedlichen Werken wie Schillers <italic>Maria
    Stuart</italic> als auch in Martins <italic>A Song of Ice and
    Fire</italic> zentral). Fragen Sie dann nach den Begriffen Stoff,
    Motiv und Topos in Verbindung mit den von Ihnen ausgewählten Texten
    und kontrastieren in der Diskussion die Begriffe. Dabei sollte
    deutlich werden, dass die Begriffe zwar unterschiedliche Aspekte von
    textlichen Inhalten beschreiben, die Begriffsverwendung auch in der
    Fachwissenschaft jedoch nicht einheitlich ist.
    Auf Grundlage dieser Begrifflichkeiten diskutieren Sie die
    Dimensionen des Topic-Begriffs und mit Rückbezug auf den
    Methodeneintrag Topic Modeling
    (<xref alt="Horstmann 2024a" rid="ref-horstmannMethodenbeitragTopicModeling2018" ref-type="bibr">Horstmann
    2024a</xref>) die grundsätzlichen Annahmen, die diesem Verfahren
    zugrunde liegen. In dieser Phase der Unterrichtseinheit können Sie
    zudem Beispiele von Topics zeigen, die auf bestimmten Texten oder
    Textsammlungen basieren (die im Methodeneintrag angegebenen
    Sekundärtexte und auch unsere Einstiegsfolien liefern Ihnen hierfür
    bei Bedarf Material). Geben Sie den Studierenden im Rahmen der
    ersten Unterrichtsphase die Gelegenheit, Fragen zu stellen und
    Schwierigkeiten, die sie mit dem Methodeneintrag hatten, zu
    diskutieren. Nach etwa einer halben Stunde sollten Sie langsam in
    die Erarbeitungsphase überleiten, indem Sie z. B. explizit nach den
    Erfahrungen fragen, welche die Studierenden mit der Lerneinheit
    Topic Modeling mit dem DARIAH Topics Explorer
    (<xref alt="Horstmann 2024b" rid="ref-horstmannLerneinheitTopicModeling2019" ref-type="bibr">Horstmann
    2024b</xref>) hatten.</p>
  </sec>
  <sec id="erarbeitung">
    <title>2.3 Erarbeitung</title>
    <p>Mit Rückbezug auf die angesprochenen Schwierigkeiten aus der
    Lerneinheit führen Sie die Studierenden mit Unterstützung des
    Beamers einmal an Ihrem eigenen Gerät durch die einzelnen Module des
    DARIAH Topics Explorers. Geben Sie den Studierenden auch hierbei die
    Möglichkeit, Verständnisschwierigkeiten anzusprechen, um diese im
    Plenum beheben zu können. Dieser Vortrag sollte maximal 15 Minuten
    in Anspruch nehmen, damit für die anschließende Arbeit in
    Kleingruppen noch genügend Zeit bleibt.
    Teilen Sie nun die Studierenden in Kleingruppen von 2-3 Personen
    ein. Größere Gruppen sind bei der gemeinsamen Arbeit mit digitalen
    Tools nur sinnvoll, wenn diese Tools selbst eine Funktion für
    kollaboratives Arbeiten haben. Da dies beim DARIAH Topics Explorer
    nicht der Fall ist, sollten möglichst alle Gruppenmitglieder an
    ihrem eigenen Laptop arbeiten, wobei gruppenintern trotzdem im
    Peer-to-Peer-Modus zusammengearbeitet wird. Die eine Hälfte dieser
    Kleingruppen wird sich im Folgenden mit dem Schillerkorpus, die
    andere mit dem Hauffkorpus auseinandersetzen. Achten Sie auf eine
    ausgewogene Aufteilung.</p>
    <p>Geben Sie den Gruppen folgende Arbeitsaufträge an die Hand:</p>
    <p><bold><italic>Aufgabe 1</italic></bold>: Welches Dokument ist das
    umfangreichste in Ihrem Korpus?</p>
    <p><bold><italic>Aufgabe 2</italic></bold>: Bei welchen
    Einstellungen (Topicmenge und Iterationen) erhalten Sie Topics, die
    konsistente Themen abbilden? Stimmt die algorithmische Angabe
    (Log-likelihood) mit Ihrem persönlichen Eindruck überein?</p>
    <p><bold><italic>Aufgabe 3</italic></bold>: Schauen Sie sich die
    bereitgestellte Stoppwortliste an. Welche interpretatorischen
    Vorannahmen werden durch den Ausschluss der dort aufgeführten Wörter
    getroffen? Warum werden dort bspw. Figurennamen aufgeführt?
    Betrachten Sie auch die vom DARIAH Topics Explorer bereitgestellte
    Stoppwortliste für deutsche Texte. Welche der dort aufgeführten
    Wörter sollten in Bezug auf Schiller und/oder Hauff nicht „gestoppt“
    werden?</p>
    <p><bold><italic>Aufgabe 4</italic></bold>: Finden Sie Topics, die
    besonders dokumentspezifisch sind oder Dokumente, die ein bestimmtes
    Topic besonders stark abbilden? Was könnten Gründe dafür sein und
    was sind Vor- oder Nachteile einer solchen Verteilung?</p>
    <p><bold><italic>Aufgabe 5</italic></bold>: Woran können Sie anhand
    Ihrer Topics erkennen, welcher Gattung Ihr Korpus zugehört?</p>
    <p><bold><italic>Aufgabe 6</italic></bold>: Modellieren Sie ein
    Topic zum Thema Liebe und eins zum Thema Natur. Finden Sie hier
    autoren- oder gar epochentypische Konstellationen wieder?</p>
    <p>Stehen Sie den Kleingruppen während der Erarbeitungsphase für
    Nachfragen zur Verfügung bzw. verschaffen Sie sich einen eigenen
    Überblick über den Stand der Gruppenarbeiten. Der erste Teil des
    Lehrmoduls endet nun. Zu diesem Zeitpunkt haben die Studierenden
    sich zunächst im Rahmen einer Diskussion mit den
    literaturwissenschaftlichen Fachinhalten „Thema“ und „Topic“
    auseinandergesetzt. Darüber hinaus haben sie die Methode des Topic
    Modeling kennengelernt und anhand des DARIAH Topic Explorers selber
    ausprobiert. Beenden Sie die Sitzung, indem Sie auf Inhalte der
    nächsten Seminareinheit verweisen. Bis zur nächsten Sitzung sollen
    die Gruppen die Fragen beantwortet und eine ca. 10-minütige
    Präsentation mit Anschauungsmaterial (Exportfunktionen des Topics
    Explorers) sowie eine ausformulierte Musterlösung zu den Aufgaben
    vorbereitet haben. Die Erarbeitungsphase endet damit nicht mit dem
    Schluss der ersten Sitzung, sondern bildet ebenso die Grundlage der
    Hausaufgaben.</p>
  </sec>
  <sec id="sicherung">
    <title>2.4 Sicherung</title>
    <p>Die zweite Sitzung beginnt mit den Präsentationen der
    Arbeitsergebnisse der Kleingruppen. Diese finden nicht im Plenum
    statt, um eine zeitintensive und mehrfache Vorstellung ähnlicher
    oder gleicher Arbeitsergebnisse zu umgehen. Jeweils zwei
    Kleingruppen, die sich mit Schiller beschäftigt haben, und zwei
    Kleingruppen, die sich mit Hauff beschäftigt haben, bilden Teams und
    stellen sich ihre Ergebnisse gegenseitig vor (ca. 20 Minuten). Dabei
    sollen die Studierenden Erkenntnisse, Herausforderungen und
    Problemstellungen diskutieren, um eine gemeinsame Kurzpräsentation
    und Musterlösung zu erarbeiten. Die Methode Topic Modeling sollte in
    den neu zusammengesetzten Gruppen kritisch reflektiert werden, wobei
    die in der Erarbeitungsphase ausgeführten Aufgaben als Rahmen für
    diese Diskussionen fungieren.
    Sie selbst gehen in dieser Phase von Gruppe zu Gruppe, hören bei den
    Diskussionen zu und geben Impulse. Diese Impulse sollten sowohl
    traditionell literaturwissenschaftlicher Art sein (Epochen-,
    Gattungs- und Autorenkenntnisse sind hier besonders relevant) als
    auch vor dem Hintergrund der Ihnen zur Verfügung gestellten
    Lösungsvorschläge für die Beispielaufgaben gegeben werden. Achten
    Sie darauf, dass in allen Gruppen eine Ergebnissicherung stattfindet
    – inhaltlicher Art wie auch in Bezug auf exportierte Daten aus dem
    Topics Explorer. Für die Gruppendiskussionen sollten Sie insgesamt
    ca. 50 Minuten veranschlagen.</p>
  </sec>
  <sec id="transfer-reflexion">
    <title>2.5 Transfer &amp; Reflexion</title>
    <p>In den letzten 40 Minuten der Sitzung sollten schließlich die in
    der Sicherungsphase zu Tage getretenen Probleme und Erkenntnisse ins
    Plenum getragen und zusammenfassend diskutiert werden. Auf
    freiwilliger Basis sollte sich mindestens eine Schiller- und eine
    Hauff-Gruppe bereit erklären, ihre Ergebnisse zu präsentieren,
    sodass die anderen Gruppen kritisch dazu Stellung nehmen können. Die
    kurzen Vorträge (ca. 10 Minuten) sollten exportierte Grafiken
    enthalten und über Erwartungen und Überraschungen im Prozess des
    Topic Modelings informieren. Welche methodischen wie
    literaturhistorischen und gattungsspezifischen Erkenntnisse haben
    die Studierenden gewonnen? Was sind Gemeinsamkeiten und Unterschiede
    im Schiller- und Hauff-Korpus? Was wären alternative bzw.
    traditionelle Wege gewesen, um diese Erkenntnisse zu erlangen?
    Welche Textsammlungen würden die Studierenden außerdem gerne mit dem
    Topics Explorer untersuchen? Wenn die Diskussion sich zäh gestalten
    sollte, können Sie weitere Gruppen auffordern, ihre Ergebnisse zu
    präsentieren – auch wenn es hierbei stellenweise zu Wiederholungen
    kommen kann. Die erarbeiteten Musterlösungen können Sie zudem als
    Seminarleistung einsammeln.
    Abschließend geben Sie Impulse für einen Transfer der erlernten
    Methodik. Fragen Sie, wie die Methode in etwaigen zu erstellenden
    Hausarbeiten oder in Bezug auf andere im Seminar behandelte Werke
    oder Fragestellungen fruchtbar gemacht werden kann. Betonen Sie
    dabei die Relevanz einer Kombination von traditionellem Fachwissen
    mit der neu erlernten Methode. Ein
    <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
    Reading</xref>-Verfahren wie das Topic Modeling kann z. B. den Blick
    auf einen Autor/eine Autorin, eine Epoche oder eine Gattung schärfen
    und erweitern. Kenntnisse, die man bei der intensiven – bspw.
    diskursanalytisch ausgerichteten – Lektüre eines Textes erwirbt,
    können durch Methoden des Distant Reading in einem größeren Kontext
    gespiegelt, verfeinert, evtl. sogar revidiert werden. Der Computer
    gibt nicht auf Knopfdruck literaturwissenschaftliches Fachwissen
    aus; vielmehr sollte der interpretatorisch überformte
    Modellierungsprozess im Topic Modeling als Pendant und mithin als
    Ergänzung (vgl.
    <xref alt="Scalable Reading" rid="glossary-scalable-reading">Scalable
    Reading</xref>) zum traditionellen
    <xref alt="Close Reading" rid="glossary-close-reading">Close
    Reading</xref> gesehen werden.</p>
  </sec>
</sec>
<sec id="lösungen-zu-den-beispielaufgaben">
  <title>3. Lösungen zu den Beispielaufgaben</title>
  <p>Die Lösungen zu dieser Einheit erhalten Sie auf
  <ext-link ext-link-type="uri" xlink:href="https://zenodo.org/records/12530205">Zenodo</ext-link>
  (<xref alt="forTEXT 2019e" rid="ref-fortextTopicModelingMit2019" ref-type="bibr">forTEXT
  2019e</xref>).</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>Materialien zum Lehrmodul auf Zenodo:
      <ext-link ext-link-type="uri" xlink:href="https://zenodo.org/records/12530205">https://zenodo.org/records/12530205</ext-link>
      (Letzter Zugriff: 19.09.2024)</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-close-reading">Close
      Reading</styled-content></term>
      <def>
        <p>Close Reading bezeichnet die sorgfältige Lektüre und
        Interpretation eines einzelnen oder weniger Texte. Close Reading
        ist in der digitalen Literaturwissenschaft außerdem mit der
        manuellen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        textueller Phänomene verbunden (vgl. auch
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref> als Gegenbegriff).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-csv">CSV</styled-content></term>
      <def>
        <p>CSV ist die englische Abkürzung für <italic>Comma Separated
        Values</italic>. Es handelt sich um ein Dateiformat zur
        einheitlichen Darstellung und Speicherung von einfach
        strukturierten Daten mit dem Kürzel <monospace>.csv</monospace>
        , sodass diese problemlos zwischen IT-Systemen ausgetauscht
        werden können. Dabei sind alle Daten zeilenweise angeordnet.
        Alle Zeilen wiederum sind in einzelne Datenfelder aufgeteilt,
        welche durch Trennzeichen wie Semikola oder Kommata getrennt
        werden können. In Programmen wie Excel können solche Textdateien
        als Tabelle angezeigt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-distant-reading">Distant
      Reading</styled-content></term>
      <def>
        <p>Distant Reading ist ein Ansatz aus den digitalen
        Literaturwissenschaften, bei dem computationelle Verfahren auf
        häufig große Mengen an Textdaten angewandt werden, ohne dass die
        Texte selber gelesen werden. Meist stehen hier quantitative
        Analysen im Vordergrund, es lassen sich jedoch auch qualitative
        <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>
        quantitativ vergleichen. Als Gegenbegriff zu
        <xref alt="Close Reading" rid="glossary-close-reading"><italic>Close
        Reading</italic></xref> wurde der Begriff insbesondere von
        Franco Moretti (2000) geprägt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-korpus">Korpus</styled-content></term>
      <def>
        <p>Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural
        für „das Korpus“) sind typischerweise nach Textsorte, Epoche,
        Sprache oder Autor*in zusammengestellt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lda">LDA</styled-content></term>
      <def>
        <p>LDA steht für <italic>Latent Dirichlet Allocation </italic>
        und ist ein generatives, statistisches
        Wahrscheinlichkeitsmodell, welches zum
        <xref alt="Topic Modeling" rid="glossary-topic-modeling">Topic
        Modeling</xref> angewendet werden kann. Bei der LDA werden auf
        Grundlage eines Wahrscheinlichkeitsmodells Wortgruppen aus
        Textdokumenten erstellt. Dabei wird jedes Dokument als eine
        Mischung von verborgenen Themen betrachtet und jedes Wort einem
        Thema zugeordnet. Wortreihenfolgen und Satzzusammenhänge spielen
        dabei keine Rolle.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup">Markup
      (Textauszeichung)</styled-content></term>
      <def>
        <p>Die Textauszeichnung (eng. <italic>Markup</italic>) fällt in
        den Bereich der Daten- bzw. Textverarbeitung, genauer in das
        Gebiet der Textformatierung, welche durch
        <xref alt="Auszeichnungssprachen" rid="glossary-markup-language">Auszeichnungssprachen</xref>
        wie <xref alt="XML" rid="glossary-xml">XML</xref> implementiert
        wird. Dabei geht es um die Beschreibung, wie einzelne Elemente
        eines Textes beispielsweise auf Webseiten grafisch dargestellt
        werden sollen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z. B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic>, oder „Wortart“
        auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-reintext-version">Reintext-Version</styled-content></term>
      <def>
        <p>Die Reintext-Version ist die Version eines digitalen Textes
        oder einer Tabelle, in der keinerlei Formatierungen
        (Kursivierung, Metadatenauszeichnung etc.) enthalten sind.
        Reintext-Formate sind beispielsweise TXT, RTF und
        <xref alt="CSV" rid="glossary-csv">CSV</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-scalable-reading">Scalable
      Reading</styled-content></term>
      <def>
        <p>Die Kombination aus
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref>- und
        <xref alt="Close Reading" rid="glossary-close-reading">Close
        Reading</xref>-Methoden, angewandt auf einen
        Untersuchungsgegenstand, wird als Scalable Reading
        bezeichnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-stoppwortliste">Stoppwortliste</styled-content></term>
      <def>
        <p>Stoppwörter sind hochfrequente Wörter, meist Funktionswörter,
        die, aufgrund ihrer grammatisch bedingten Häufigkeit,
        beispielsweise die Ergebnisse von inhaltlichen oder thematischen
        Analysen verzerren können. Deshalb werden diese Wörter,
        gesammelt in einer Stoppwortliste, bei digitalen Textanalysen
        meist nicht berücksichtigt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-tei">TEI</styled-content></term>
      <def>
        <p>Die <italic>Text Encoding Initiative</italic> (TEI) ist ein
        Konsortium, das gemeinsam einen Standard für die Darstellung von
        Texten in digitaler Form entwickelt. Die TEI bietet
        beispielsweise Standards zur Kodierung von gedruckten Werken und
        zur Auszeichnung von sprachlichen Informationen in
        maschinenlesbaren Texten (siehe auch
        <xref alt="XML" rid="glossary-xml">XML</xref> und
        <xref alt="Markup" rid="glossary-markup">Markup</xref>).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-topic-modeling">Topic
      Modeling</styled-content></term>
      <def>
        <p>Das Topic Modeling ist ein statistisches, auf
        Wahrscheinlichkeitsrechnung basierendes, Verfahren zur
        thematischen Exploration größerer Textsammlungen. Das Verfahren
        erzeugt „Topics“ zur Abbildung häufig gemeinsam vorkommender
        Wörter in einem Text. Für die Durchführung können verschiedene
        Algorithmen und Modelle wie das
        <xref alt="LDA" rid="glossary-lda">LDA</xref> verwendet
        werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-xml">XML</styled-content></term>
      <def>
        <p>XML steht für <italic>Extensible Markup Language</italic> und
        ist eine Form von
        <xref alt="Markup Language" rid="glossary-markup-language">Markup
        Language</xref>, die sowohl computer- als auch menschenlesbar
        und hochgradig anpassbar ist. Dabei werden Textdateien
        hierarchisch strukturiert dargestellt und Zusatzinformationen i.
        d. R. in einer anderen Farbe als der eigentliche (schwarz
        gedruckte) Text dargestellt. Eine standardisierte Form von XML
        ist das <xref alt="TEI" rid="glossary-tei">TEI</xref>-XML.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-fortextTutorialDARIAHTopics2019">
    <mixed-citation>forTEXT. 2019a. Tutorial: DARIAH Topics Explorer
    installieren. Topic Modeling und Literaturanalyse. 11. Februar. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10371074">10.5281/zenodo.10371074</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10371074">https://doi.org/10.5281/zenodo.10371074</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-fortextTutorialDARIAHTopics2019a">
    <mixed-citation>———. 2019b. Tutorial: DARIAH Topics Explorer zur
    Literaturanalyse nutzen. Topic Modeling und Literaturanalyse. 25.
    Februar. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10372228">10.5281/zenodo.10372228</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10372228">https://doi.org/10.5281/zenodo.10372228</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-fortextTutorialDreiMethoden2019">
    <mixed-citation>———. 2019c. Tutorial: Drei Methoden für bessere
    Topics beim Topic Modeling. Topic Modeling und Literaturanalyse. 11.
    März. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10378213">10.5281/zenodo.10378213</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10378213">https://doi.org/10.5281/zenodo.10378213</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-fortextThemenAutorenUnd2019">
    <mixed-citation>———. 2019d. Themen von Autoren und Autorinnen der
    Literatur des 19. Jahrhunderts. 25. März. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10276975">10.5281/zenodo.10276975</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10276975">https://doi.org/10.5281/zenodo.10276975</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-fortextTopicModelingMit2019">
    <mixed-citation>———. 2019e. Topic Modeling mit dem DARIAH Topics
    Explorer lehren. 22. Juli. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10518659">10.5281/zenodo.10518659</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://zenodo.org/records/12530205">https://zenodo.org/records/12530205</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannLerneinheitTopicModeling2019">
    <mixed-citation>Horstmann, Jan. 2024b. Lerneinheit: Topic Modeling
    mit dem DARIAH Topics Explorer. Hg. von Evelyn Gius.
    <italic>forTEXT</italic> 1, Nr. 8. Topic Modeling (7. Oktober). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3729">10.48694/fortext.3729</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/lerneinheiten/topic-modeling-mit-dem-dariah-topics-explorer">https://fortext.net/routinen/lerneinheiten/topic-modeling-mit-dem-dariah-topics-explorer</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragTopicModeling2018">
    <mixed-citation>———. 2024a. Methodenbeitrag: Topic Modeling. Hg. von
    Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 8. Topic Modeling (7.
    Oktober). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3717">10.48694/fortext.3717</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/topic-modeling">https://fortext.net/routinen/methoden/topic-modeling</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannRessourcenbeitragTextGridRepository2018">
    <mixed-citation>———. 2024c. Ressourcenbeitrag: TextGrid Repository.
    Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 11.
    Bibliografie (30. November). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3794">10.48694/fortext.3794</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/ressourcen/textsammlungen/textgrid-repository">https://fortext.net/ressourcen/textsammlungen/textgrid-repository</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannRessourcenbeitragDeutschesTextarchiv2018">
    <mixed-citation>Horstmann, Jan und Alexandra Kern. 2024.
    Ressourcenbeitrag: Deutsches Textarchiv (DTA). Hg. von Evelyn Gius.
    <italic>forTEXT</italic> 1, Nr. 11. Bibliografie (30. November).
    doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3791">10.48694/fortext.3791</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/ressourcen/textsammlungen/deutsches-textarchiv-dta">https://fortext.net/ressourcen/textsammlungen/deutsches-textarchiv-dta</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-schumacherToolbeitragDARIAHTopics2018">
    <mixed-citation>Schumacher, Mareike. 2024. Toolbeitrag: DARIAH
    Topics Explorer. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1,
    Nr. 8. Topic Modeling (7. Oktober). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3728">10.48694/fortext.3728</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/dariah-topics-explorer">https://fortext.net/tools/tools/dariah-topics-explorer</ext-link>.</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
