<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3774</article-id>
<title-group>
<article-title>Schulunterricht: Textvisualisierung mit Voyant
unterrichten</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0002-1707-284X</contrib-id>
<name>
<surname>Flüh</surname>
<given-names>Marie</given-names>
</name>
<email>marie.flueh@uni-hamburg.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Hamburg</institution>
</institution-wrap>
</aff>
</contrib-group>
<pub-date date-type="pub" publication-format="electronic" iso-8601-date="2024-08-07">
<day>7</day>
<month>8</month>
<year>2024</year>
</pub-date>
<volume>1</volume>
<issue>5</issue>
<issue-title>Textvisualisierung</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 07.10.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/schulunterricht/textvisualisierung-mit-voyant-unterrichten">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2019-10-07">
<day>07</day>
<month>10</month>
<year>2019</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 07.10.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/schulunterricht/textvisualisierung-mit-voyant-unterrichten">fortext.net</ext-link></p>
<sec id="eckdaten-der-unterrichtseinheit">
  <title>Eckdaten der Unterrichtseinheit</title>
  <list list-type="bullet">
    <list-item>
      <p>Thema der Sitzung: Themen und Motive in Gedichten von der
      Klassik bis zur Gegenwart – ein digitaler Einstieg in die Analyse
      von Gedichten</p>
    </list-item>
    <list-item>
      <p>Klassenstufe: Sekundarstufe II, Literaturunterricht im Fach
      Deutsch</p>
    </list-item>
    <list-item>
      <p>Phasen: Einführung in die Methodik der quantitativen
      Textanalyse anhand einer
      <xref alt="Wordcloud" rid="glossary-wordcloud">Wordcloud</xref> zu
      Friedrich Schillers Ballade <italic>Die Bürgschaft</italic> (1798)
      und kritische Diskussion der Visualisierung; Einführung in die
      Arbeit mit dem Textanalysetool Voyant (Lehrvortrag und
      Präsentation eines Tutorials über Funktionen von Voyant);
      Organisation der Partnerarbeit; Präsentation und Diskussion der
      Ergebnisse im Plenum</p>
    </list-item>
    <list-item>
      <p>Einbettung der Stunde in die Unterrichtseinheit: Interpretation
      lyrischer Texte, Einstieg in Unterrichtseinheit zur Lyrikanalyse,
      Distant Reading (vgl.
      <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
      Reading</xref>) mit repräsentativen Gedichten von der Klassik bis
      zur Gegenwart</p>
    </list-item>
    <list-item>
      <p>Sozialformen: Vortrag, Diskussion im Plenum, Partnerarbeit</p>
    </list-item>
    <list-item>
      <p>Medien/Materialien: Lernende sollten max. zu zweit an einem PC
      arbeiten, Lehrende benötigen einen Laptop und Beamer. Alle von uns
      bereitgestellten Materialien erhalten sie unter:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/10519367">https://web.archive.org/save/https://zenodo.org/records/10519367</ext-link></p>
    </list-item>
    <list-item>
      <p>Dauer der Unterrichtseinheit: 90 Minuten</p>
    </list-item>
    <list-item>
      <p>Schwierigkeitsgrad des Tools: einfach</p>
    </list-item>
  </list>
  <sec id="fachliche-lernziele">
    <title>Fachliche Lernziele:</title>
    <list list-type="bullet">
      <list-item>
        <p>Sprachliche Handlungsfähigkeit: Ergebnispräsentation in Form
        strukturierter Vorträge, Reflexion über Sprache, indem
        sprachliche Einheiten und inhaltliche Schwerpunkte lyrischer
        Texte zunächst mit Voyant herausgefiltert (vgl.
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>) und isoliert betrachtet und anschließend in
        Nahsicht (vgl.
        <xref alt="Close Reading" rid="glossary-close-reading">Close
        Reading</xref>) detailliert sowie kontextsensitiv untersucht
        werden</p>
      </list-item>
      <list-item>
        <p>Auseinandersetzung mit Texten und Medien: Auseinandersetzung
        mit literarischen Texten in digitaler Form, Texterschließung
        hier als analytische quantitative Korpusanalyse (vgl.
        <xref alt="Korpus" rid="glossary-korpus">Korpus</xref>) und
        „Blick von oben“ auf repräsentative, poetische Texte</p>
      </list-item>
      <list-item>
        <p>Aufbau von Methodenkompetenz: Kennen und Anwenden des
        Textanalystools Voyant, Auswertung von Grafiken und
        statistischen Daten, kritische Reflexion der Ergebnisse,
        Erstellen von Interpretationshypothesen</p>
      </list-item>
      <list-item>
        <p>Aufbau von Orientierungswissen: Die Schüler*innen lernen
        erste Besonderheiten der Gattung Lyrik aus der Zeit der Klassik
        bis zum beginnenden 20. Jhd. kennen</p>
      </list-item>
    </list>
  </sec>
  <sec id="kmk-lernziele">
    <title>KMK-Lernziele:</title>
    <list list-type="bullet">
      <list-item>
        <p>Suchen und Verarbeiten (Auswerten und Bewerten): Daten
        analysieren, auswerten, interpretieren und kritisch bewerten</p>
      </list-item>
      <list-item>
        <p>Produzieren und Präsentieren: Nutzung von Voyant als
        technisches Bearbeitungswerkzeug zur Textvisualisierung;
        Erkennen der Bedeutung von Urheberrecht und geistigem Eigentum
        literarischer Texte</p>
      </list-item>
      <list-item>
        <p>Problemlösen und Handeln: Bedarfsgerechter Einsatz von Voyant
        als Werkzeug zur Textanalyse; Erkennen und Formulieren der
        algorithmischen Struktur von Voyant</p>
      </list-item>
      <list-item>
        <p>Analysieren und Reflektieren: Nutzung und kritische Bewertung
        von Voyant als Gestaltungsmittel, Verstehen und Reflektieren der
        Medien in der digitalen Welt; Erkennen und Bewerten der Chancen
        und Risiken des Gebrauchs von Distant-Reading-Verfahren</p>
      </list-item>
    </list>
  </sec>
</sec>
<sec id="bausteine">
  <title>Bausteine</title>
  <list list-type="bullet">
    <list-item>
      <p>Verlaufsraster der Unterrichtseinheit: Aus welchen Phasen setzt
      sich die Unterrichtsstunde zusammen? Dem Verlaufsplan entnehmen
      Sie Inhalte und Schwerpunkte.</p>
    </list-item>
    <list-item>
      <p>Anwendungsbeispiel: Anhand welcher Texte führen Sie in die
      digitale Analyse von Gedichten ein? Leiten Sie die Lerngruppe dazu
      an, mit einem Textanalysetool eine literarische Großform digital
      zu untersuchen.</p>
    </list-item>
    <list-item>
      <p>Verlauf der Unterrichtseinheit(en): Wie sieht die konkrete
      Ausgestaltung der Phasen aus und welche Arbeitsschritte werden
      vorgenommen? Erfahren Sie, wie die Unterrichtseinheit strukturiert
      ist und welche Beispielaufgaben Sie Ihren Schüler*innen stellen
      können.</p>
    </list-item>
    <list-item>
      <p>Lösungen zu den Beispielaufgaben: Hat die Lerngruppe die
      Beispielaufgaben richtig gelöst? Hier finden Sie Antworten.</p>
    </list-item>
  </list>
</sec>
<sec id="verlaufraster-der-unterrichtseinheit">
  <title>Verlaufraster der Unterrichtseinheit</title>
  <table-wrap>
    <table>
      <colgroup>
        <col width="20%" />
        <col width="20%" />
        <col width="20%" />
        <col width="20%" />
        <col width="20%" />
      </colgroup>
      <thead>
        <tr>
          <th>Phase</th>
          <th>Impulse des/der Lehrenden</th>
          <th>Erwartete Aktivität der Lernenden</th>
          <th>Sozialform</th>
          <th>Medien / Materialien</th>
        </tr>
      </thead>
      <tbody>
        <tr>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>Vorab und Einstieg</td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>(ca. <italic>10 Min.</italic>)</td>
          <td>Präsentation der Wordcloud und Leitung der Diskussion</td>
          <td>Interpretation der Wordcloud, Abgleich mit eigenen
          Lektüreerfahrungen</td>
          <td>Diskussion im Plenum</td>
          <td>Beamer/Smart­board, Laptop, PowerPoint-Präsentation
          Voyant</td>
        </tr>
        <tr>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>Problematisierung</td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>(ca. <italic>15 Min.</italic>)</td>
          <td>Impuls: Wie werden Wordclouds erstellt? Hinleitung zum
          Paradigma Distant Reading, Vortrag und Videopräsentation</td>
          <td>Mutmaßungen/Erklärungen über die Zusammensetzung</td>
          <td>Diskussion im Plenum, Lehrvortrag</td>
          <td>Beamer/Smart­board, Laptop, PowerPoint-Präsentation
          Voyant</td>
        </tr>
        <tr>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>Erarbeitung</td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>(ca. <italic>40 Min.</italic>)</td>
          <td>Gruppeneinteilung, technische Fragen beantworten,
          Koordination der Toolauswahl, um Überschneidungen zu
          vermeiden</td>
          <td>Lösen der Aufgaben auf dem Arbeitsblatt „Literatur digital
          erforschen“, Vorbereitung eines Kurzvortrags, in dem ein Tool
          aus der Voyant-Toolsuite und die Ergebnisse der Korpusanalyse
          vorgestellt werden</td>
          <td>Partnerarbeit</td>
          <td>Arbeitsbogen
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/10519367">„forTEXT_Textvisualisierung_Voyant_AB.pdf“</ext-link>
          (<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
          2019</xref>), PC-Ausstattung 1:2, Beamer, Laptop</td>
        </tr>
        <tr>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>Sicherung</td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>(ca. <italic>20 Min.</italic>)</td>
          <td>Leitung Ergebnisvergleich, Sammlung an der Tafel: Welche
          Aussagen werden über das Korpus gemacht?</td>
          <td>Vorstellung der Ergebnisse</td>
          <td>Vortrag, Diskussion im Plenum</td>
          <td>Smartboard, Tafel oder Whiteboard</td>
        </tr>
        <tr>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>Reflexion &amp; Transfer</td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
        <tr>
          <td>(<italic>Hausaufgabe oder Folgestunde</italic>)</td>
          <td>Überleitung zum Close Reading</td>
          <td>Lesen unterschiedlicher Gedichte</td>
          <td>Einzelarbeit</td>
          <td>Gedicht aus Korpus in ausgedruckter Form</td>
        </tr>
        <tr>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
          <td></td>
        </tr>
      </tbody>
    </table>
  </table-wrap>
  <p>Das Verlaufsraster stellen wir Ihnen als
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/10519367">PDF-Datei
  („forTEXT_Textvisualisierung_Voyant_LM_Verlaufsraster.pdf“)</ext-link>
  auf Zenodo zur
  Verfügung(<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
  2019</xref>).</p>
</sec>
<sec id="anwendungsbeispiel">
  <title>1. Anwendungsbeispiel</title>
  <p>Die hier skizzierte Doppelstunde ist die erste Stunde einer
  Unterrichtseinheit in der Sekundarstufe II zum Thema Lyrikanalyse, die
  einen festen Bestandteil des schulischen Kerncurriculums für das Fach
  Deutsch darstellt. Im Literaturunterricht der gymnasialen Oberstufe
  für das Fach Deutsch ist die Auseinandersetzung mit Werken von
  Autor*innen, die epochemachend waren, vorgesehen. Neben dem Aufbau von
  Orientierungswissen über Werk und Wirken kanonisierter Autor*innen
  sollen in der Oberstufe anhand unterschiedlicher Textgattungen
  fachspezifische Kompetenzen aufgebaut werden. Als verbindliche
  Referenztexte, anhand derer die Interpretation literarischer Texte der
  Gattung Lyrik unterrichtet werden können, werden repräsentative
  Gedichte von der Klassik bis zur Gegenwart angeführt. An diese
  Rahmenbedingungen knüpft die Konzeption der Unterrichtsstunde „Themen
  und Motive in Gedichten von der Klassik bis zur Gegenwart – Ein
  digitaler Einstieg in die Analyse von Gedichten“ an.
  Im Hintergrund der Voyant-Tools stehen zwei Ansätze: Distant Reading
  und Textvisualisierung
  (<xref alt="Horstmann und Stange 2024" rid="ref-horstmannMethodenbeitragTextvisualisierung2018" ref-type="bibr">Horstmann
  und Stange 2024</xref>). Distant-Reading-Verfahren eignen sich sowohl
  für die Exploration großer Textmengen (z. B. das gesamte Œuvre von
  Autor*innen) als auch für die Analyse vergleichsweise kleiner
  Textmengen (wie einzelner Werke). Im Kern geht es um die statistische
  Auswertung – d. h. die quantitative Analyse – von Textdaten.
  Textvisualisierung ist ein Teilbereich der Informationsvisualisierung.
  Diese befasst sich mit der visuellen Repräsentation komplexer Texte
  und der Anpassung dieser Darstellungsformen durch interaktive
  Softwares wie Voyant
  (<xref alt="Flüh 2024a" rid="ref-fluhToolbeitragVoyant2018" ref-type="bibr">Flüh
  2024a</xref>). Beide Methoden werden in diesem Fall eingesetzt, um ein
  aus 40 Gedichten bestehendes Lyrikkorpus zu explorieren und Hypothesen
  über Besonderheiten und häufig vorkommende Themen in lyrischen Texten
  zu bilden. Um das Textkorpus zu erstellen, wurden u. a. die folgenden
  Anthologien konsultiert: Bode
  (<xref alt="2018" rid="ref-bodeDeutscheGedichteAnthologie2018" ref-type="bibr">2018</xref>);
  Detering
  (<xref alt="2007" rid="ref-deteringReclamsGrossesBuch2007" ref-type="bibr">2007</xref>);
  Gnüg und Möhrmann
  (<xref alt="1999" rid="ref-gnugFrauenLiteraturGeschichte1999a" ref-type="bibr">1999</xref>);
  Hahn
  (<xref alt="2008" rid="ref-hahnStechapfelGedichteFrauen2008" ref-type="bibr">2008</xref>).
  Die einzelnen und individuell auswählbaren Voyant-Tools visualisieren
  die Ergebnisse dieser quantitativen Textanalyse auf ganz
  unterschiedliche Art und Weise. Essentiell ist also nicht nur ein
  sicherer Umgang mit dem Tool unter Einbezug unterschiedlicher
  Funktionalitäten, sondern v. a. auch die kritische Auswertung der
  Grafiken und die Ableitung von Interpretationshypothesen.
  Bei der Arbeit mit Voyant im Schulunterricht sollten immer
  Fragestellungen ausgewählt werden, die selbstständig bearbeitet und
  beantwortet werden können. Hierzu zählen z. B. Fragen nach
  übergeordneten Textinhalten (wie Themen und Motiven), der Entwicklung
  einer Figur und Personenbeziehungen oder der sprachlichen Gestaltung.
  Ein Mehrwert für Ihren Literaturunterricht entsteht dann, wenn auf
  Grundlage der statistischen Auswertung Muster erkennbar werden und
  Interpretationshypothesen gebildet werden können. Hierbei gilt: Die
  Ergebnisse einer rein quantitativen Abfrage reichen nicht aus, um
  stichhaltige Aussagen über die Konzeption lyrischer Texte zu machen.
  Sie eignen sich aber, um die Aufmerksamkeit auf bestimmte
  Textphänomene zu lenken, das Interesse für Besonderheiten lyrischer
  Texte zu wecken, den kritischen Umgang mit der Auswertung
  statistischer Erhebungen zu üben, eine Methode des Distant Readings
  kennenzulernen und v. a. um ausgehend von der Entdeckung eines
  auffälligen und interessanten Textphänomens in die tiefergehende
  Interpretation und Analyse von Gedichten einzusteigen.
  Der Zeitraum, aus dem die Werke in dieser Unterrichtseinheit stammen,
  umfasst – abgeleitet aus dem Hamburger Lehrplan für Gymnasien – die
  Jahre von 1786 bis zur Gegenwart. Eine Aufschlüsselung der
  Zusammensetzung des Lyrikkorpus und das gesamte für die
  Unterrichtseinheit benötigte Korpus als TXT-Datei (vgl.
  <xref alt="Reintext-Version" rid="glossary-reintext-version">Reintext-Version</xref>)
  finden Sie hier und am Ende der Unterrichtseinheit (Material:
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/12530163">„forTEXT_Textvisualisierung_Voyant_Zusammensetzung_Lyrikkorpus.pdf“</ext-link>
  und
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/12530163">„forTEXT_Textvisualisierung_Voyant_Lyrikkorpus.txt“</ext-link>
  (<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
  2019</xref>)). Die Stunde zielt darauf ab, mittels einer quantitativen
  Textanalyse und Textvisualisierung einen spielerischen und
  epochenübergreifenden Überblick über Themen, Motive und Schreibweisen
  der Lyrik der letzten Jahrhunderte zu gegeben.
  Für die erste Auseinandersetzung mit der digitalen Methode der
  quantitativen Textvisualisierung untersuchen Sie in der
  Einstiegsstunde zunächst ein mittelgroßes Textkorpus aus 40 Gedichten
  mithilfe von Voyant, die aus unterschiedlichen Anthologien ausgewählt
  wurden. Bei der Zusammensetzung des Textkorpus, das Sie auf
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/12530163">Zenodo</ext-link>
  (<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
  2019</xref>) herunterladen können, haben wir darauf geachtet, dass
  Autor*innen der enthaltenen Texte mehr als 70 Jahre verstorben sind.
  Dadurch gelten ihre Texte als gemeinfrei. Ist dies der Fall, können
  die Texte problemlos unter Wahrung des Urheberrechts für Ihren digital
  unterstützten Schulunterricht verwendet werden. Im Rahmen einer kurzen
  Einführung, in der Sie das Korpus und die Methode vorstellen (siehe
  Material Präsentation:
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/12530163">„forTEXT_Textvisualisierung_Voyant_Praesentation.pdf“</ext-link>
  (<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
  2019</xref>)), weisen Sie auf diesen Aspekt hin, damit sich auch die
  Schüler*innen über die geltenden rechtlichen Rahmenbedingungen bewusst
  sind, die es bei jeglicher Form der digitalen Arbeit mit literarischen
  Texten zu bedenken gilt.
  Wenn Sie in Ihrem Unterricht ein eigens zusammengestelltes Korpus
  verwendet möchten, z. B. zu einer anderen Gattung, sollten Sie die
  folgenden Aspekte beachten:</p>
  <list list-type="bullet">
    <list-item>
      <p>Um ein möglichst repräsentatives und für die quantitative
      Textanalyse geeignetes Textkorpus zu schaffen – also eine gute
      Stichprobe auszuwählen –, gelten dieselben Rahmenbedingungen wie
      in der Statistik: Die Ausgangsbedingungen entscheiden maßgeblich
      über die Aussagekraft des Ergebnisses. Wird schon bei der Auswahl
      eine Verzerrung eingeführt, schlägt sich das im Ergebnis nieder.
      Hierfür sollten Sie Ihre Schüler*innen sensibilisieren, wofür sich
      z. B. eine fachübergreifende Zusammenarbeit mit den Kolleg*innen
      aus der Mathematik umsetzen ließe.</p>
    </list-item>
    <list-item>
      <p>Einer Verzerrung der Daten (in der Statistik als systematische
      Fehler oder auch Bias bekannt) lässt sich u. a. durch eine
      zufällig gewählte Stichprobe entgegenwirken. Dennoch repräsentiert
      die Stichprobe nicht die Gesamtheit der Lyrik von der Klassik bis
      zur Moderne. Hierfür wäre ein deutlich größeres Textkorpus
      notwendig, das sich z. B. im Rahmen einer größer angelegten
      Projektarbeit erstellen und untersuchen ließe.</p>
    </list-item>
    <list-item>
      <p>Um weitere Verzerrungen zu vermeiden, sollten Sie bei der
      Korpuserstellung stets auf eine ausgewogene Verteilung zwischen
      Gedichten, die aus weiblicher Feder stammen, und solchen, die von
      Männern verfasst wurden, achten. Um eine ausgewogene
      Datengrundlage zu schaffen, sollten Sie darüber hinaus darauf
      achten, dass der jeweilige Einzeltextumfang nicht zu stark vom
      durchschnittlichen Umfang aller Texte abweicht.</p>
    </list-item>
  </list>
</sec>
<sec id="verlauf-der-unterrichtseinheiten">
  <title>2. Verlauf der Unterrichtseinheiten</title>
  <sec id="vorarbeiten">
    <title>2.1 Vorarbeiten</title>
    <p>Bevor Sie Voyant in Ihrem Fachunterricht einsetzen, sollten Sie
    die grundlegenden Funktionalitäten kennen und beherrschen. Hierfür
    empfiehlt es sich, den Toolbeitrag zu Voyant
    (<xref alt="Flüh 2024a" rid="ref-fluhToolbeitragVoyant2018" ref-type="bibr">Flüh
    2024a</xref>) zu lesen und im Anschluss die Lerneinheit zu Voyant
    (<xref alt="Flüh 2024b" rid="ref-fluhLerneinheitTextvisualisierungMit2019" ref-type="bibr">Flüh
    2024b</xref>) Schritt für Schritt durchzuführen. Um vertiefendes
    Fachwissen über die Möglichkeiten der Textvisualisierung
    (<xref alt="Horstmann und Stange 2024" rid="ref-horstmannMethodenbeitragTextvisualisierung2018" ref-type="bibr">Horstmann
    und Stange 2024</xref>) aufzubauen, nutzen Sie den entsprechenden
    Methodeneintrag.
    Das beschriebene Lernszenario ist für Schüler*innen der
    Sekundarstufe II bestimmt, da die Benutzeroberfläche (vgl.
    <xref alt="GUI" rid="glossary-gui">GUI</xref>) und v. a. das
    <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://voyant-tools.org/docs/#!/guide/tools">Voyant-Handbuch</ext-link>,
    welches Informationen über die Funktionen der unterschiedlichen
    Tools beinhaltet, nur englischsprachig zur Verfügung steht. Die
    Unterrichtseinheit richtet sich also an eine Lerngruppe, die auf
    Englischkenntnisse zurückgreifen kann.
    Bevor Sie die Stunde eröffnen, ist es sinnvoll, das Textkorpus
    „<ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/12530163">forTEXT_Textvisualisierung_Voyant_Lyrikkorpus.txt</ext-link>“
    (<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
    2019</xref>) zentral auf dem Schulserver (vgl.
    <xref alt="Server" rid="glossary-server">Server</xref>) zu
    hinterlegen, sodass die Schüler*innen von ihrem Computer aus darauf
    zugreifen und es in Voyant hochladen können. Die Unterrichtsstunde
    sollte im Computerlabor durchgeführt werden. Sofern Sie über eine
    entsprechende Ausstattung an Laptops und auch in Ihrem Klassenraum
    über eine stabile WLAN-Verbindung verfügen, können Sie die Stunde
    natürlich auch hier durchführen. An einem Computer sollten nicht
    mehr als zwei Personen arbeiten, damit möglichst jedes
    Gruppenmitglied Arbeitsschritte mit Voyant umsetzen kann.
    Ihre Schüler*innen sollten vorbereitend den Kommentar
    „<ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://lebelieberliterarisch.de/franco-moretti-distant-reading/">Franco
    Moretti ”Distant Reading” – Ein Lektüre-Kommentar</ext-link>“ von
    Mareike Schumacher gelesen und als Hausaufgabe eine Definition von
    Distant Reading ausgearbeitet haben. Hieran knüpfen Sie in der
    Einstiegsphase der Unterrichtsstunde an. Um den Artikel
    herunterladen zu können und ihn an Ihre Schüler*innen verteilen zu
    können, bedarf es einer kostenfreien Anmeldung bei ZEITonline.
    Sofern Sie den Artikel an die gesamte Lerngruppe verteilen möchten,
    ohne sich anzumelden, senden wir Ihnen den Artikel zusammen mit den
    Musterlösungen zu.</p>
  </sec>
  <sec id="einstieg-und-problematisierung">
    <title>2.2 Einstieg und Problematisierung</title>
    <p>Ein visueller Impuls eignet sich, um die Motivation der
    Schüler*innen für ein Thema zu wecken und um abstrakte
    Unterrichtsgegenstände zu veranschaulichen. Das gilt nicht nur für
    die Naturwissenschaften, wo Grafiken und Schaubilder beinahe
    allgegenwärtig sind, sondern auch für den Literaturunterricht.
    Gerade die sprachliche Besonderheit literarischer Texte macht es für
    Schüler*innen nicht selten schwierig, in den Texten „verborgene“
    abstrakte Inhalte – wie Informationen über den Inhalt oder nur
    implizit vermittelte Bedeutung – zu erkennen. Eine Visualisierung
    der Texte kann dabei helfen, in einem ersten Schritt das Augenmerk
    auf die Besonderheiten eines Textes zu richten, die sich in einem
    zweiten Schritt näher untersuchen lassen.
    Für den geplanten Einstieg eignet sich ein Text, der den
    Schüler*innen – z. B. aus einer bereits abgeschlossenen
    Unterrichtseinheit – schon bekannt ist. In dieser Unterrichtseinheit
    verwenden wir eine Wordcloud von Friedrich Schillers Ballade
    <italic>Die Bürgschaft</italic> (siehe Abb. 1 und in der
    Präsentation
    <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/12530163">„forTEXT_Textvisualisierung_Voyant_Praesentation.pdf“</ext-link>
    (<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
    2019</xref>) enthalten).</p>
    <fig>
      <caption><p>Wordcloud zu Friedrich Schillers <italic>Die
      Bürgschaft</italic> (1799)</p></caption>
      <graphic mimetype="image" mime-subtype="png" xlink:href="Wordcloud_Die_Burgschaft_p.png" />
    </fig>
    <p>Nutzen Sie das bestehende Wissen der Lerngruppe (Wissen über
    Inhalt und Konzeption der Ballade) und beziehen es auf den neuen
    Unterrichtsgegenstand (Textvisualisierung). Im Kern geht es darum,
    deutlich zu machen, dass Distant Reading ein Paradigma von
    Analyseverfahren bezeichnet, mit denen große Mengen an Textdaten
    ausgewertet werden, ohne dass der Text vorher gelesen wurde. Im
    Rahmen der Einführung überprüft die Lerngruppe die Zuverlässigkeit
    dieses Ansatzes. Leiten Sie nun eine Diskussion über die
    Visualisierung an, indem Sie die Schüler*innen Hypothesen über die
    Bedeutung der Visualisierung anstellen lassen und darüber
    diskutieren, ob die eigenen Lektüreerfahrungen sich mit der
    Wordcloud in Verbindung bringen lassen oder nicht. Hierbei sollte
    außerdem das aus dem Artikel erschlossene Wissen über den Distant
    Reading-Ansatz in die Diskussion einbezogen werden. Außerdem sollte
    deutlich werden, dass die Wordcloud nur ein mögliches Ergebnis
    darstellt, hinter dem eine quantitative Auswertung des Textes steht.
    Leiten Sie die Schüler*innen außerdem dazu an, die Visualisierung
    auch kritisch zu bewerten. Hier ist schließlich ein lyrischer Text,
    der zuvor in minutiöser Kleinarbeit analysiert und interpretiert
    wurde, in einzelne Teile zerlegt worden. Die ästhetische Wirkung,
    die sich beim Lesen der Ballade entfalten kann, geht hier
    verloren.</p>
    <boxed-text>
    </boxed-text>
    <p>Mögliche <bold>Leitfragen und Impulse</bold> (Folie 3) – neben
    der Aufforderung zur Beschreibung der Wordcloud – sind:</p>
    <list list-type="bullet">
      <list-item>
        <p>Wie könnte die Wordcloud entstanden sein?</p>
      </list-item>
      <list-item>
        <p>Beschreiben Sie, inwieweit Wordcloud und eigene
        Lektüreerfahrungen zueinander passen.</p>
      </list-item>
      <list-item>
        <p>Gibt es ein nicht-digitales Verfahren, um eine Wordcloud zu
        entwerfen?</p>
      </list-item>
    </list>
    <p>Von der Vorstellung und Diskussion über eine hier exemplarisch
    vorgestellte Form der Textvisualisierung leiten Sie nun durch einen
    kurzen Impulsvortrag über zu der konkreten Umsetzung dieser Methode.
    In einem kurzen Lehrvortrag bereiten Sie die Schüler*innen auf die
    nächste Unterrichtsphase vor. Der Vortrag beinhaltet eine kurze
    Vorstellung des Lyrikkorpus (Folie Nr. 4) und der Vorstellung von
    Voyant. Hierfür spielen Sie das Voyant-Video vor (Folie Nr. 5), um
    die Lerngruppe mit den grundlegenden Funktionen von Voyant vertraut
    zu machen.</p>
  </sec>
  <sec id="erarbeitung">
    <title>2.3 Erarbeitung</title>
    <p>Anschließend teilen Sie die gesamte Schulklasse in Zweiergruppen
    ein und verteilen das Arbeitsblatt (Material:
    <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/10519367">„forTEXT_Textvisualisierung_Voyant_AB.pdf“</ext-link>
    (<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
    2019</xref>)), dessen Bearbeitung mit zentralen Funktionen von
    Voyant vertraut macht. Das Arbeitsblatt ist so konzipiert, dass
    zunächst die grundlegenden Funktionalitäten des Textanalysetools
    vermittelt werden und die Schüler*innen mit den
    Standardeinstellungen arbeiten. Weisen Sie Ihre Schüler*innen darauf
    hin, die Lösungen schriftlich in Stichworten festzuhalten, damit
    sich die Ergebnisse in einem späteren Teil der Stunde noch
    vergleichen und diskutieren lassen. Während die Schüler*innen die
    Aufgaben bearbeiten, nehmen Sie eine zurückhaltende Position ein.
    Interpretationshypothesen sollten eigenständig entwickelt werden,
    während bei technischen Problemen oder Fragestellungen Ihre
    Expertise gefragt ist.</p>
  </sec>
  <sec id="sicherung">
    <title>2.4 Sicherung</title>
    <p>In der Sicherungsphase stellen einige Zweiergruppen ihre
    Textanalyselandschaft und ihre Interpretationshypothesen vor
    (Aufgabe 6). Hierbei werden die zentralen Interpretationshypothesen
    von der nicht vortragenden Person an der Tafel, dem Smart- oder
    Whiteboard festgehalten. Der Vortrag sollte nicht länger als fünf
    Minuten dauern. Bei einer geschätzten Klassengröße von 20
    Schüler*innen werden nicht alle Gruppen ihre Ergebnisse präsentieren
    können. Lassen Sie also drei bis vier Gruppen ausführlich vortragen
    und leiten dann die Frage nach weiteren, noch nicht genannten
    Interpretationshypothesen an das Plenum weiter und ergänzen das
    Tafelbild um neue Vorschläge.</p>
  </sec>
  <sec id="transfer-reflexion">
    <title>2.5 Transfer &amp; Reflexion</title>
    <p>In der letzten Phase geht es darum, die erstellten
    Visualisierungen und die daraus abgeleiteten Interpretationen mit
    den tatsächlichen Lektüreerfahrungen in Verbindung zu setzen. Die
    Interpretationshypothesen sollen nun durch die tatsächliche Lektüre
    der Gedichte überprüft werden. Teilen Sie hierzu an jede Gruppe ein
    Gedicht aus (Material:
    <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/10519367">„forTEXT_Textvisualisierung_Voyant_Material_Close_Reading.zip“</ext-link>
    (<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
    2019</xref>)) und lassen dieses in Ruhe lesen. Sollte die Zeit nicht
    mehr ausreichen, können Sie die folgenden Aufgaben als Hausaufgabe
    formulieren:</p>
    <list list-type="bullet">
      <list-item>
        <p>In welchen Gedichten kommen die Most Frequent Words „o“ (33),
        „leben“ (24), „gott“ (23) und „ach“ vor?</p>
      </list-item>
      <list-item>
        <p>Auf welche Art und Weise lassen sich die von dir vorgestellte
        Visualisierung und das gelesene Gedicht in Beziehung zueinander
        setzen?</p>
      </list-item>
      <list-item>
        <p>Wie verändert sich die Wahrnehmung der Texte, wenn du sie
        liest?</p>
      </list-item>
    </list>
    <p>Einige der Gedichte sind kürzer als andere. Achten Sie bei der
    Verteilung der Gedichte also darauf, dass einige Gruppen ggf. zwei
    Gedichte erhalten. Besprechen Sie in der nächsten Stunde gemeinsam
    die Beispielaufgaben, ob die Interpretationshypothesen standhalten
    oder nicht. Im Unterrichtsgespräch sollten außerdem die Grenzen der
    quantitativen Textanalyse thematisiert werden. Für die
    Interpretation der Textvisualisierungen gilt: Es stehen weder der
    Lesegenuss noch die durch die Gedichte vermittelte ästhetische
    Wirkung im Vordergrund. Wenn Sie die Lektüreerfahrungen der
    Schüler*innen besprechen, sollte deutlich werden, dass es sich bei
    Distant- und Close-Reading-Verfahren um zwei völlig unterschiedliche
    Paradigmen handelt. Ersteres nähert sich der Interpretation
    lyrischer Texte durch eine vornehmlich quantitative Auswertung.
    Aspekte der ästhetischen Wirkung und zahlreiche gattungstypische
    Textmerkmale wie z. B. die Versstruktur – welche im Korpus ja
    entfernt wurde – spielt bei diesem Ansatz keine Rolle. Bei der
    genauen Lektüre der Gedichte sollte aber deutlich werden, dass die
    Art und Weise der Rezeption nicht zuletzt durch das Versmaß bestimmt
    wird. Der Blick „von oben“ auf die Textmenge vermag Motive und
    Themen zu verdeutlichen, die in lyrischen Texten epochenübergreifend
    vorkommen. Daraus lassen sich durchaus erste
    Interpretationshypothesen ableiten. Die Frage danach, welche
    Textmerkmale und -strukturen dazu führen, dass z. B. <italic>Die
    Bürgschaft</italic> bei Leser*innen ein Gefühl der Rührung entstehen
    lässt oder auf welche Art und Weise das Versmaß die Rezeption
    lyrischer Texte beeinflusst, sollte im Anschluss thematisiert
    werden.</p>
  </sec>
</sec>
<sec id="lösungen-zu-den-beispielaufgaben">
  <title>3. Lösungen zu den Beispielaufgaben</title>
  <p>Die Lösungsvorschläge erhalten Sie auf
  <ext-link ext-link-type="uri" xlink:href="https://zenodo.org/records/12530163">Zenodo</ext-link>
  (<xref alt="forTEXT 2019" rid="ref-fortextTextvisualisierungMitVoyant2019" ref-type="bibr">forTEXT
  2019</xref>).</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>Arbeitsmaterialien zur Unterrichtseinheit:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://zenodo.org/records/12530163">https://web.archive.org/save/https://zenodo.org/records/12530163</ext-link>
      (Letzter Zugriff: 18.06.2024)</p>
    </list-item>
    <list-item>
      <p>Kommentar „Franco Moretti“Distant Reading” - Ein
      Lektüre-Kommentar”:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://lebelieberliterarisch.de/franco-moretti-distant-reading/">https://web.archive.org/save/https://lebelieberliterarisch.de/franco-moretti-distant-reading/</ext-link>
      (Letzter Zugriff: 18.06.2024)</p>
    </list-item>
    <list-item>
      <p>Voyant-Handbuch:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://voyant-tools.org/docs/#!/guide/tools">https://web.archive.org/save/https://voyant-tools.org/docs/#!/guide/tools</ext-link>
      (Letzter Zugriff: 18.06.2024)</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-close-reading">Close
      Reading</styled-content></term>
      <def>
        <p>Close Reading bezeichnet die sorgfältige Lektüre und
        Interpretation eines einzelnen oder weniger Texte. Close Reading
        ist in der digitalen Literaturwissenschaft außerdem mit der
        manuellen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        textueller Phänomene verbunden (vgl. auch
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref> als Gegenbegriff).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-commandline">Commandline</styled-content></term>
      <def>
        <p>Die Commandline (engl. <italic>command line
        interface</italic> (CLI)), auch Kommandozeile, Konsole, Terminal
        oder Eingabeaufforderung genannt, ist die direkteste Methode zur
        Interaktion eines Menschen mit einem Computer. Programme ohne
        eine grafische Benutzeroberfläche
        (<xref alt="GUI" rid="glossary-gui">GUI</xref>) werden i. d. R.
        durch Texteingabe in die Commandline gesteuert. Um die
        Commandline zu öffnen, klicken Sie auf Ihrem Mac „cmd“ +
        „space“, geben „Terminal“ ein und doppelklicken auf das
        Suchergebnis. Bei Windows klicken Sie die Windowstaste + „R“,
        geben „cmd.exe“ ein und klicken Enter.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-csv">CSV</styled-content></term>
      <def>
        <p>CSV ist die englische Abkürzung für <italic>Comma Separated
        Values</italic>. Es handelt sich um ein Dateiformat zur
        einheitlichen Darstellung und Speicherung von einfach
        strukturierten Daten mit dem Kürzel <monospace>.csv</monospace>
        , sodass diese problemlos zwischen IT-Systemen ausgetauscht
        werden können. Dabei sind alle Daten zeilenweise angeordnet.
        Alle Zeilen wiederum sind in einzelne Datenfelder aufgeteilt,
        welche durch Trennzeichen wie Semikola oder Kommata getrennt
        werden können. In Programmen wie Excel können solche Textdateien
        als Tabelle angezeigt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-data-mining">Data
      Mining</styled-content></term>
      <def>
        <p>Data Mining gehört zum Fachbereich
        <xref alt="Information Retrieval" rid="glossary-information-retrieval">Information
        Retrieval</xref> und bezieht sich auf die systematische
        Anwendung computergestützter Methoden, die darauf abzielt, in
        vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu
        erkennen. Textbasierte Formen des Data Minings sind u. a.
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>,
        <xref alt="Web Mining" rid="glossary-web-mining">Web
        Mining</xref> und
        <xref alt="Opinion Mining" rid="glossary-opinion-mining">Opinion
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-distant-reading">Distant
      Reading</styled-content></term>
      <def>
        <p>Distant Reading ist ein Ansatz aus den digitalen
        Literaturwissenschaften, bei dem computationelle Verfahren auf
        häufig große Mengen an Textdaten angewandt werden, ohne dass die
        Texte selber gelesen werden. Meist stehen hier quantitative
        Analysen im Vordergrund, es lassen sich jedoch auch qualitative
        <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>
        quantitativ vergleichen. Als Gegenbegriff zu
        <xref alt="Close Reading" rid="glossary-close-reading"><italic>Close
        Reading</italic></xref> wurde der Begriff insbesondere von
        Franco Moretti (2000) geprägt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-gui">GUI</styled-content></term>
      <def>
        <p>GUI steht für <italic>Graphical User Interface</italic> und
        bezeichnet eine grafische Benutzeroberfläche. Ein GUI ermöglicht
        es, Tools mithilfe von grafischen Schaltflächen zu bedienen, um
        somit beispielsweise den Umgang mit der
        <xref alt="Commandline" rid="glossary-commandline">Commandline</xref>
        zu umgehen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-information-retrieval">Information
      Retrieval</styled-content></term>
      <def>
        <p>Die Teildisziplin der Informatik, das Information Retrieval,
        beschäftigt sich mit der computergestützten Suche und
        Erschließung komplexer Informationen in meist unstrukturierten
        Datensammlungen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-korpus">Korpus</styled-content></term>
      <def>
        <p>Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural
        für „das Korpus“) sind typischerweise nach Textsorte, Epoche,
        Sprache oder Autor*in zusammengestellt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z.B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-opinion-mining">Opinion
      Mininig</styled-content></term>
      <def>
        <p>Unter Opinion Mining, oder Sentiment Analysis, versteht man
        die Analyse von Stimmungen oder Haltungen gegenüber einem Thema,
        durch die Analyse natürlicher Sprache. Das Opinion Mining gehört
        zu den Verfahren des
        <xref alt="Text Minings" rid="glossary-text-mining">Text
        Minings</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic>, oder „Wortart“
        auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-reintext-version">Reintext-Version</styled-content></term>
      <def>
        <p>Die Reintext-Version ist die Version eines digitalen Textes
        oder einer Tabelle, in der keinerlei Formatierungen
        (Kursivierung, Metadatenauszeichnung etc.) enthalten sind.
        Reintext-Formate sind beispielsweise TXT, RTF und
        <xref alt="CSV" rid="glossary-csv">CSV</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-server">Server</styled-content></term>
      <def>
        <p>Ein Server kann sowohl hard- als auch softwarebasiert sein.
        Ein hardwarebasierter Server ist ein Computer, der in ein
        Rechnernetz eingebunden ist und der so Ressourcen über ein
        Netzwerk zur Verfügung stellt. Ein softwarebasierter Server
        hingegen ist ein Programm, das einen spezifischen Service
        bietet, welcher von anderen Programmen (Clients) lokal oder über
        ein Netzwerk in Anspruch genommen wird.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-text-mining">Text
      Mining</styled-content></term>
      <def>
        <p>Das Text Mining ist eine textbasierte Form des
        <xref alt="Data Minings" rid="glossary-data-mining">Data
        Minings</xref>. Prozesse &amp; Methoden, computergestützt und
        automatisch Informationen bzw. Wissen aus unstrukturierten
        Textdaten zu extrahieren, werden als Text Mining
        zusammengefasst.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-web-mining">Web
      Mining</styled-content></term>
      <def>
        <p>Unter Web Mining versteht man die Anwendung von Techniken des
        <xref alt="Data Mining" rid="glossary-data-mining">Data
        Mining</xref> zur Extraktion von Informationen aus dem World
        Wide Web. Das Web Mining ist ein Teilbereich des Data Minings
        und zählt zu einem der wichtigsten Anwendungsgebiete für das
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-wordcloud">Wordcloud</styled-content></term>
      <def>
        <p>Eine <italic>Wordcloud</italic>, oder auch Schlagwortwolke,
        ist eine Form der Informationsvisualisierung, beispielsweise von
        Worthäufigkeiten in einem Text oder einer Textsammlung. Dabei
        werden unterschiedlich gewichtete Wörter, wie die häufigsten
        Wörter, i.d.R. größer oder auf andere Weise hervorgehoben
        dargestellt. Die horizontale/vertikale Ausrichtung und die Farbe
        der dargestellten Wörter hat meistens allerdings keinen
        semantischen Mehrwert.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-bodeDeutscheGedichteAnthologie2018">
    <mixed-citation>Bode, Dietrich. 2018. <italic>Deutsche Gedichte.
    Eine Anthologie</italic>. Stuttgart: Reclam.</mixed-citation>
  </ref>
  <ref id="ref-deteringReclamsGrossesBuch2007">
    <mixed-citation>Detering, Heinrich. 2007. <italic>Reclams grosses
    Buch der deutschen Gedichte. Vom Mittelalter bis ins 21.
    Jahrhundert</italic>. Stuttgart: Reclam.</mixed-citation>
  </ref>
  <ref id="ref-fluhLerneinheitTextvisualisierungMit2019">
    <mixed-citation>Flüh, Marie. 2024b. Lerneinheit: Textvisualisierung
    mit Voyant. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 5.
    Textvisualisierung (7. August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3773">10.48694/fortext.3773</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/lerneinheiten/textvisualisierung-mit-voyant">https://fortext.net/routinen/lerneinheiten/textvisualisierung-mit-voyant</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-fluhToolbeitragVoyant2018">
    <mixed-citation>———. 2024a. Toolbeitrag: Voyant. Hg. von Evelyn
    Gius. <italic>forTEXT</italic> 1, Nr. 5. Textvisualisierung (7.
    August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3775">10.48694/fortext.3775</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/voyant">https://fortext.net/tools/tools/voyant</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-fortextTextvisualisierungMitVoyant2019">
    <mixed-citation>forTEXT. 2019. Textvisualisierung mit Voyant
    unterrichten. 7. Oktober. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.5281/zenodo.10519366">10.5281/zenodo.10519366</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://zenodo.org/records/12530163">https://zenodo.org/records/12530163</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-gnugFrauenLiteraturGeschichte1999a">
    <mixed-citation>Gnüg, Hiltrud und Renate Möhrmann. 1999.
    <italic>Frauen Literatur Geschichte. Schreibende Frauen vom
    Mittelalter bis zur Gegenwart</italic>. Stuttgart:
    Metzler.</mixed-citation>
  </ref>
  <ref id="ref-hahnStechapfelGedichteFrauen2008">
    <mixed-citation>Hahn, Ulla. 2008. <italic>Stechäpfel. Gedichte von
    Frauen aus drei Jahrtausenden</italic>. Stuttgart:
    Reclam.</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragTextvisualisierung2018">
    <mixed-citation>Horstmann, Jan und Jan-Erik Stange. 2024.
    Methodenbeitrag: Textvisualisierung. Hg. von Evelyn Gius.
    <italic>forTEXT</italic> 1, Nr. 5. Textvisualisierung (7. August).
    doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3772">10.48694/fortext.3772</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/textvisualisierung">https://fortext.net/routinen/methoden/textvisualisierung</ext-link>.</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
