<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3772</article-id>
<title-group>
<article-title>Methodenbeitrag: Textvisualisierung</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0001-8047-2232</contrib-id>
<name>
<surname>Horstmann</surname>
<given-names>Jan</given-names>
</name>
<email>dh@jan-horstmann.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0009-0004-7264-2843</contrib-id>
<name>
<surname>Stange</surname>
<given-names>Jan-Erik</given-names>
</name>
<email>janerikstange@me.com</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Münster</institution>
</institution-wrap>
</aff>
</contrib-group>
<pub-date date-type="pub" publication-format="electronic" iso-8601-date="2024-08-07">
<day>7</day>
<month>8</month>
<year>2024</year>
</pub-date>
<volume>1</volume>
<issue>5</issue>
<issue-title>Textvisualisierung</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 05.10.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/textvisualisierung">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2018-10-05">
<day>05</day>
<month>10</month>
<year>2018</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 05.10.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/textvisualisierung">fortext.net</ext-link></p>
<sec id="definition">
  <title>1. Definition</title>
  <p>Die Textvisualisierung als Teilbereich der
  Informationsvisualisierung befasst sich mit der visuellen
  Repräsentation komplexer Textdaten und der Manipulierbarkeit dieser
  Repräsentation durch interaktive Softwareinterfaces
  (<xref alt="Card, Mackinlay und Shneiderman 1999" rid="ref-cardReadingsInformationVisualization1999" ref-type="bibr">Card,
  Mackinlay und Shneiderman 1999</xref>). Visuelle Darstellungen können
  neue Einsichten in Textdaten und deren innere Zusammenhänge liefern.
  Textvisualisierungen unterstützen sowohl die Kommunikation von
  Forschungsergebnissen als auch die explorative Analysetätigkeit.
  Hierbei sind grundlegend drei verschiedene Arten von Daten zu
  unterscheiden, die für die Visualisierung herangezogen werden
  können:</p>
  <list list-type="order">
    <list-item>
      <p>Der unbearbeitete Text, aus dem mithilfe statistischer
      Verfahren oder Natural Language Processing Datensätze generiert
      (vgl. <xref alt="Text Mining" rid="glossary-text-mining">Text
      Mining</xref>) werden. Ein Beispiel hierfür ist die Berechnung von
      Worthäufigkeiten.</p>
    </list-item>
    <list-item>
      <p>Mit Zusatzinformationen (vgl.
      <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>),
      d. h. mit manuell oder automatisch erzeugten Annotationen (vgl.
      <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>)
      angereicherter Text.</p>
    </list-item>
    <list-item>
      <p>Textexterne Metadaten (wie Erscheinungsdatum,
      Autor*innenangaben, Titel etc.) oder andere Daten, die sich mit
      Annotationen verknüpfen lassen (etwa Geokoordinaten mit
      annotierten Ortsnennungen).</p>
    </list-item>
  </list>
  <p>In der Praxis kommen zudem häufig auch Kombinationen dieser
  verschiedenen Datenarten zum Einsatz, die mit unterschiedlichen
  Visualisierungen jeweils unterschiedliche Perspektiven auf den Text
  (oder die Textsammlung) ermöglichen.</p>
</sec>
<sec id="anwendungsbeispiel">
  <title>2. Anwendungsbeispiel</title>
  <fig>
    <caption><p>Abb. 1: Figurennetzwerke für Arthur Schnitzlers Dramen
    <italic>Liebelei</italic> (links) und <italic>Reigen</italic>
    (rechts). Quelle:
    <ext-link ext-link-type="uri" xlink:href="https://dracor.org/ger">https://dracor.org/ger</ext-link></p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Figurennetzwerke_Schnitzler-p.png" />
  </fig>
  <p>Sie erforschen Figurenkonstellationen in deutschsprachigen Dramen
  um 1900. Um deutlich zu machen, dass die Interaktionen der Figuren in
  den einzelnen Dramen sehr unterschiedlicher Art sind, entscheiden Sie
  sich, die Figurenkonstellationen als Netzwerke zu visualisieren und
  einander gegenüber zu stellen. Auch Betrachter*innen, die
  beispielsweise Arthur Schnitzlers <italic>Reigen</italic> nicht
  gelesen haben, wird so die besondere Interaktionsstruktur dieses
  Dramas augenfällig. Weil Sie außerdem deutlich machen wollen, wann im
  Verlauf der Dramen die jeweiligen Figuren auftreten, entscheiden Sie
  sich für eine Visualisierung der Figurendistribution über den
  Textverlauf als Balkendiagramm. Für den <italic>Reigen</italic> sieht
  das beispielsweise so aus:</p>
  <fig>
    <caption><p>Abb. 2: Stacked Barchart für die Figuren in Arthur
    Schnitzlers <italic>Reigen</italic>. Erzeugt mit
    <ext-link ext-link-type="uri" xlink:href="https://voyant-tools.org">https://voyant-tools.org</ext-link></p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Stacked_Barchart_Reigen-p.png" />
  </fig>
  <p>Viele weitere Visualisierungsmöglichkeiten werden Ihnen einen
  jeweils anders gearteten Blick auf Ihre Textsammlung (vgl.
  <xref alt="Korpus" rid="glossary-korpus">Korpus</xref>) oder einzelne
  Texte darin ermöglichen. Je nach Fragestellung sind einzelne
  Visualisierungsmöglichkeiten mehr oder weniger geeignet. Hermeneutisch
  anspruchsvollere Fragen lassen sich häufig in der Kombination
  möglichst reichhaltiger Textannotationen mit den statistischen
  Textdaten selbst verfolgen und Visualisierungen dieser kombinierten
  unterschiedlichen Datentypen halten häufig literaturwissenschaftlich
  relevante Erkenntnisse bereit.</p>
</sec>
<sec id="literaturwissenschaftliche-tradition">
  <title>3. Literaturwissenschaftliche Tradition</title>
  <p>Die Vorteile, die es mit sich bringt, (textliche) Phänomene zu
  visualisieren und damit zu veranschaulichen, wurden in der Literatur
  (und dann auch in der Literaturwissenschaft) schon früh erkannt. Schon
  Goethe stellte in seinen <italic>Naturwissenschaftlichen
  Schriften</italic> zur Erkenntnisfunktion von visuellen Eindrücken
  fest: „Das Ohr ist stumm, der Mund ist taub; aber das Auge vernimmt
  und spricht. In ihm spiegelt sich von außen die Welt, von innen der
  Mensch“
  (<xref alt="Goethe 1987" rid="ref-goetheGoethesWerke188719191987" ref-type="bibr">Goethe
  1987</xref> WA II, 5 (2), 12).
  Solange es Texte gibt, wurden diese mit bildlichen Darstellungen
  kombiniert und zu diesen in Bezug gesetzt, besonders kunstvoll in der
  Buchmalerei der Spätantike und des Mittelalters, die mit ihren
  Bordüren und Drolerien weit über verzierte Initialen hinaus ging und
  Textinhalt und Verzierung eng miteinander verknüpfte. Wenn eine
  zeitgenössische Autorin wie Cornelia Funke ihre Bücher mit
  Illustrationen der darin vorkommenden Figuren und Orte versieht, führt
  sie diese Tradition fort. Aber auch bereits die Verwendung
  unterschiedlicher Schriftarten oder -farben (wie beispielsweise in
  Michael Endes Roman <italic>Die unendliche Geschichte</italic> [1979])
  oder die häufige Verwendung von Kursivierungen in John Irvings Romanen
  gibt visuellen Elementen die Möglichkeit, Textinhalte semantisch
  anzureichern
  (<xref alt="Kammer 2014" rid="ref-kammerVisualitatUndMaterialitat2014" ref-type="bibr">Kammer
  2014</xref>). Künstlerisch in das Zentrum der Aufmerksamkeit gestellt
  wird die Verbindung von Text und Bild in der ihrerseits auf eine lange
  Tradition zurückblickenden visuellen Dichtung
  (<xref alt="Adler und Ernst 1987" rid="ref-adlerTextAlsFigur1987" ref-type="bibr">Adler
  und Ernst 1987</xref>), bei der die räumliche Verortung von Wörtern
  oder Wortgruppen bereits zur Aussage des jeweiligen Gedichtes
  beiträgt.
  Diese Formen von Text-Bild-Relationen beziehen sich jedoch auf
  literarische Primärtexte und nicht selten auf die Präsentation des
  gesamten Textes. Definieren wir Textvisualisierung jedoch als visuelle
  <italic>Repräsentation</italic> von Textdaten, wie wir es oben getan
  haben, tritt die Sekundärliteratur in den Fokus der Aufmerksamkeit,
  innerhalb derer diese Repräsentation i. d. R. stattfindet.
  Die visuelle Repräsentation von Textdaten (oder auch von
  Metatextdaten) findet in der literaturwissenschaftlichen Forschung
  mehrere Vorgänger. Einige davon sind so alltäglich, dass sie uns kaum
  noch als Textvisualisierung bewusst werden, wie z. B. in der
  Versanalyse, in der es standardisierte Darstellungsweisen bspw. für
  Hebungen, Senkungen und Zäsuren in der Versfußnotation oder für
  akzentuierte Silben, Pausen, Taktgrenzen etc. in der
  Silbenakzentnotation gibt.</p>
  <fig>
    <caption><p>Abb. 3: Visualisierung einer lyrischen Sequenz aus
    Goethes Drama <italic>Pandora</italic>; Mellmann
    (<xref alt="2007, 88" rid="ref-mellmannVersanalyse2007" ref-type="bibr">2007,
    88</xref>)</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Mellmann_2007-p.png" />
  </fig>
  <p>Ebenso häufig werden Figurenkonstellationen als Netzwerke
  visualisiert. Eder
  (<xref alt="2007, 239" rid="ref-ederFigurenkonstellation2007" ref-type="bibr">2007,
  239</xref>) nennt als mögliche Ebenen der Verbindungen zwischen den
  einzelnen Figuren 1. handlungsfunktionale Verhältnisse, 2.
  körperliche, psychische, soziale, symbolische Ähnlichkeiten und
  Kontraste und 3. die „Positionen innerhalb einer
  Aufmerksamkeitshierarchie“. Damit beschreibt er nichts anderes als die
  Knoten (= Figuren) und Kanten (= Verbindungen) in einer
  Netzwerkvisualisierung (vgl. Netzwerkanalyse
  (<xref alt="Schumacher 2024b" rid="ref-schumacherMethodenbeitragNetzwerkanalyse2018" ref-type="bibr">Schumacher
  2024b</xref>)). Die im Anwendungsbeispiel oben dargestellten Netzwerke
  zeigen jedoch noch eine andere Form von Verbindungen, nämlich die
  Kopräsenz von Figuren im jeweiligen Drama. In der Dicke der Kanten
  spiegelt sich dann die von Eder benannte Aufmerksamkeitshierarchie.
  Ähnlich werden gelegentlich auch Abstammungsverhältnisse literarischer
  Figuren nicht nur sprachlich erläutert, sondern visuell als Stammbaum
  dargestellt. Dies geschieht auch mit einzelnen Überlieferungsstufen
  älterer Texte wie des Nibelungenliedes:</p>
  <fig>
    <caption><p>Abb. 4: Stammbaum des Nibelungenlieds bei Heusler
    (<xref alt="1955, 49" rid="ref-heuslerNibelungensageUndNibelungenlied1955" ref-type="bibr">1955,
    49</xref>)</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Heusler_1955-p.png" />
  </fig>
  <p>Häufig nutzt die Forschung auch abstrahierende Darstellungen z. B.
  von Kommunikationsverhältnissen (wie sie besonders in der
  Erzähltheorie beliebt sind) oder veranschaulichende Visualisierungen
  von Zusammenhängen struktureller oder kategorialer Merkmale (wie bspw.
  von bildhafter vs. bildlicher Versprachlichung von Schmerz in
  literarischen Texten als Baumdiagramm).</p>
  <fig>
    <caption><p>Abb. 5: Visualisierung von Autor- und
    Erzählkommunikation, Schmid
    (<xref alt="2007, 176" rid="ref-schmidTextadressat2007" ref-type="bibr">2007,
    176</xref>)</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Schmid_2007-p.png" />
  </fig>
  <fig>
    <caption><p>Abb. 6: Visualisierung der Typen von
    Schmerzbeschreibung, Koller
    (<xref alt="2000, 129" rid="ref-kollerUnbildlicheBildlicheUnd2000" ref-type="bibr">2000,
    129</xref>)</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Koller_2000-p.png" />
  </fig>
  <p>Ebenfalls werden in der Forschung Karten oder topografische
  Repräsentationen von sprachlich erzeugtem Raum bzw. der Bewegung in
  diesem Raum erstellt und reflektiert – so vergleicht bspw. Ryan
  (<xref alt="2003" rid="ref-ryanCognitiveMapsConstruction2003" ref-type="bibr">2003</xref>)
  Visualisierungen kognitiver Karten auf Grundlage von García Márquez’
  Roman <italic>Crónica de una muerte anunciada</italic> (1981), und
  Piatti
  (<xref alt="2008" rid="ref-piattiGeografieLiteraturSchauplatze2008" ref-type="bibr">2008</xref>)
  mappt in ihrer Monografie – der 17 Karten beiliegen – fiktive
  Handlungsräume auf tatsächliche Georäume.
  Gelegentlich kommt es zudem vor, dass literarische Ekphrasen in der
  zugehörigen Forschungsliteratur visualisiert werden, d. h.
  ursprünglich sprachlich beschriebene Bilder erfahren eine direkte
  visuelle Umsetzung, gelegentlich auch in abstrahierter Form wie bspw.
  das Schild des Achilles – eine der ältesten und berühmtesten Ekphrasen
  überhaupt – bei Willcock
  (<xref alt="1976, 210" rid="ref-willcockCompanionIliadBased1976" ref-type="bibr">1976,
  210</xref>):</p>
  <fig>
    <caption><p>Abb. 7: Abstrahierende Visualisierung von Achilles’
    Schild bei Willcock
    (<xref alt="1976, 210" rid="ref-willcockCompanionIliadBased1976" ref-type="bibr">1976,
    210</xref>)</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Willcock_1976-p.png" />
  </fig>
  <p>Es lässt sich in der traditionelleren Literaturwissenschaft eine
  klare Tendenz hin zu qualitativen Textvisualisierungen ausmachen. In
  den Digital Humanities sind es vor allem die quantitativen Strukturen
  von Textdaten, die visualisiert werden. Die digitale
  Literaturwissenschaft ist momentan daher darum bemüht,
  Visualisierungsmöglichkeiten zu entwickeln, die qualitative und
  quantitative Aspekte der Textdaten fruchtbar miteinander verknüpfen
  (vgl. z. B. das Projekt
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://threedh.net/">3DH</ext-link>),
  und in diesem Bereich gibt es noch viel Entwicklungspotenzial.</p>
</sec>
<sec id="diskussion">
  <title>4. Diskussion</title>
  <p>Wenngleich analoge Visualisierungen, wie wir gesehen haben, auf
  eine längere Tradition zurückblicken, so müssen Textvisualisierungen
  im Sinne der im ersten Abschnitt angeführten Definition als digitale,
  textdatengetriebene Visualisierungen als ein relativ junges Phänomen
  in der Literaturwissenschaft verstanden werden. Da die visuelle
  Repräsentation quantitativer Textdaten im Analogen einen erheblich
  größeren Aufwand bedeuten würde, ermöglichen die digitalen Methoden
  neue Perspektiven. Der Hauptvorteil, der durch das digitale Medium
  geschaffen wird, besteht in der direkten Interaktion und der dadurch
  geschaffenen Möglichkeit der Exploration. Seifert u. a.
  (<xref alt="2014" rid="ref-seifertVisualAnalysisKnowledge2014" ref-type="bibr">2014</xref>)
  beschreiben Textvisualisierung als „an effective enabler for
  exploratory analysis, making it a powerful tool for gaining insight
  into unexplored data sets.“ Darüberhinaus erlaubt Interaktivität
  flüssige Bewegungen zwischen Übersichtsdarstellungen, der Darstellung
  von Teilbereichen und Details
  (<xref alt="Shneiderman 1996" rid="ref-shneidermanEyesHaveIt1996" ref-type="bibr">Shneiderman
  1996</xref>).
  Das Setzen von Filtern, das Selektieren von Teilbereichen, das
  Nebeneinanderstellen dieser verschiedenen Perspektiven auf die Daten
  ermöglicht es, auf schnelle Art und Weise Vergleiche herzustellen und
  Schlussfolgerungen zu ziehen
  (<xref alt="Card, Mackinlay und Shneiderman 1999" rid="ref-cardReadingsInformationVisualization1999" ref-type="bibr">Card,
  Mackinlay und Shneiderman 1999</xref>). Die kognitive Belastung
  beschränkt sich hierbei auf ein Minimum, da die Textvisualisierung
  (bzw. allgemeiner Informationsvisualisierung) sich die herausragenden
  Fähigkeiten des visuellen Wahrnehmungssystems des Menschen zunutze
  macht
  (<xref alt="Ware 2012" rid="ref-wareInformationVisualizationPerception2012" ref-type="bibr">Ware
  2012</xref>).
  Die Vorteile digitaler Textvisualisierung treten dabei nicht nur im
  <italic>Distant Reading</italic> (vgl.
  <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
  Reading</xref>) hervor, auch wenn dieser Bereich in den vergangenen
  Jahren eine vermehrte Aufmerksamkeit in der Anwendung von
  Visualisierungstechniken gefunden hat. Auch die im Zusammenhang mit
  einem <italic>Distant Reading</italic> (vgl.
  <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
  Reading</xref>) digital erstellten Annotationen (Manuelle Annotation
  (<xref alt="Jacke 2024" rid="ref-jackeMethodenbeitragManuelleAnnotation2018" ref-type="bibr">Jacke
  2024</xref>)) sind besonders bei einer hohen Anzahl von Annotationen
  in ihrem Zusammenhang nicht mehr übersichtlich darzustellen.
  Textvisualisierung kann hier eingesetzt werden, um eine komprimierte
  Übersichtsdarstellung zu geben, die nach unterschiedlichen Kriterien
  strukturiert werden kann.
  Typische Anwendungsbereiche von Textvisualisierungen im
  <italic>Distant Reading</italic> sind beispielsweise stilometrische
  Analysen (Stilometrie
  (<xref alt="Horstmann 2024a" rid="ref-horstmannMethodenbeitragStilometrie2024" ref-type="bibr">Horstmann
  2024a</xref>)), <italic>Häufigkeitsanalysen</italic> (von Wörtern,
  N-Gramms (vgl.
  <xref alt="N-Gramm" rid="glossary-n-gramm">N-Gramm</xref>),
  Annotationen), Darstellungen von Verteilungen von Wörtern oder
  Annotationen über Textlängen, zeitliches Erscheinen von Werken einer
  Textsammlung, Netzwerkdiagramme von Figuren, Geovisualisierungen von
  Ortsnennungen in Texten oder Verteilung von Themen über eine
  Textsammlung im Topic Modeling. Abbildung 8 zeigt beispielhaft
  Visualisierungen für diese unterschiedlichen Anwendungsfälle.</p>
  <fig>
    <caption><p>Abb. 8: Visualisierungsbeispiele: Topic Cloud,
    Distributionsgraphen und stilometrische Analyse</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Visualisierungsbeispiele-p.png" />
  </fig>
  <p>Eine Übersicht über gängige Visualisierungsformen in der digitalen
  Literaturwissenschaft in den Bereichen <italic>Close Reading</italic>
  und <italic>Distant Reading</italic> geben Jänicke u. a.
  (<xref alt="2015" rid="ref-janickeCloseDistantReading2015" ref-type="bibr">2015</xref>).
  Der Einsatz von Visualisierungen in der digitalen
  Literaturwissenschaft und den Digital Humanities generell wird jedoch
  auch kritisch betrachtet. Ein häufig geäußerter Einwand bezieht sich
  auf die visuelle Darstellung von Ergebnissen
  literaturwissenschaftlicher Arbeit als vermeintlich objektive Fakten.
  Drucker
  (<xref alt="2011" rid="ref-druckerHumanitiesApproachesGraphical2011" ref-type="bibr">2011</xref>)
  schlägt etwa vor, die geisteswissenschaftliche Konstruiertheit
  („constructedness“) von Daten stärker zu berücksichtigen (in diesem
  Zusammenhang spricht sie von „capta“ statt „data“) und geeignete
  visuelle Darstellungsformen zu verwenden, die in der Lage sind,
  typische literaturwissenschaftliche Deutungsdimensionen wie
  Unsicherheit und Mehrdeutigkeit zu kommunizieren. Zunehmend lässt sich
  ein Zusammenwachsen (vgl.
  <xref alt="Scalable Reading" rid="glossary-scalable-reading">Scalable
  Reading</xref>) des vormaligen Gegensatzpaares quantitativ/qualitativ
  feststellen. Quantitativ erzeugte Daten werden so etwa durch
  unterschiedliche Visualisierungen einer kritischen Betrachtungsweise
  zugänglich, während qualitative Daten in der distanzierten Übersicht
  dargestellt einen schnellen Zugriff auf die zugrundeliegenden
  annotierten Textstellen erlauben.
  Auch wenn einfach zu benutzende generische Visualisierungstools
  grundsätzlich zu begrüßen sind, so stellen sie auch eine gewisse
  Gefahr da. Gerade bei fehlenden Grundlagenkenntnissen im Bereich der
  Text- bzw. Informationsvisualisierung können Visualisierungen
  unwissentlich zu einer Verzerrung der produzierten Ergebnisse führen,
  z. B. durch die Verwendung eines Kuchendiagramms für Prozentwerte, die
  nicht Teile eines Ganzen darstellen. Außerdem können Farben
  unglücklich eingesetzt, Datenattribute mit wenig geeigneten visuellen
  Variablen repräsentiert oder ganz generell Visualisierungsformen
  verwendet werden, die eine bestimmte Datenstruktur voraussetzen und
  bei abweichenden Strukturen eine verzerrende Aussage zur Folge haben
  können.
  Insgesamt lässt sich konstatieren, dass das Potenzial interaktiver
  Textvisualisierungstools noch nicht ausgeschöpft ist. So wird
  Textvisualisierung in der Praxis vornehmlich als Repräsentation eines
  vermeintlichen Endergebnisses eines Forschungsprozesses eingesetzt,
  während der Prozess selbst, den häufig die Produktion einer Vielzahl
  von Visualisierungen und deren Interpretation ausmacht, ignoriert
  wird. Die Stärke von Visualisierungen nicht nur zu kommunizieren,
  sondern auch Exploration zu ermöglichen und das Entstehen von
  Schlussfolgerungen zu befördern, wird hier nur im Prozess für die
  Forschenden sichtbar, nicht jedoch für das spätere Publikum der
  Forschungsarbeit. Ein vermehrter Einsatz von Visualisierungen auch als
  wesentlicher Teil der Argumentation steht derzeit noch aus.</p>
</sec>
<sec id="technische-grundlagen">
  <title>5. Technische Grundlagen</title>
  <p>Die Bandbreite an Software, mit der sich Textvisualisierungen
  erzeugen lassen, ist groß. Grundlegend lassen sich generische Tools
  und Programmiersprachen unterscheiden. Generische Tools bieten
  unterschiedliche Standardvisualisierungsformen an, für ihre Nutzung
  sind in der Regel keine tiefergehenden Programmierkenntnisse
  notwendig. Programmiersprachen hingegen erlauben statistische
  Auswertungen oder eine sprachliche Analyse von Texten und/oder eine
  Ausgabe berechneter Daten in unterschiedlichen Visualisierungen.
  In ihrer einfachsten Variante erlauben generische Tools eine
  unmittelbare automatische Analyse und Visualisierung von Texten. Ein
  solches Beispiel ist die niederschwellige Webapplikation Voyant
  (<xref alt="Flüh 2024" rid="ref-fluhToolbeitragVoyant2018" ref-type="bibr">Flüh
  2024</xref>), die beispielsweise mithilfe von <italic>Distant
  Reading</italic> (vgl.
  <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
  Reading</xref>) Worthäufigkeiten visualisiert oder Verteilungen von
  Wörtern über den Gesamttext als Liniendiagramme darstellt. Manuell
  erstellte Annotationen in digitalen Texten lassen sich mit Tools wie
  CATMA
  (<xref alt="Schumacher 2024a" rid="ref-schumacherToolbeitragCATMA2019" ref-type="bibr">Schumacher
  2024a</xref>) analysieren und auf verschiedene Weisen visualisieren.
  Einige Programmiersprachen haben sich für die Textanalyse und
  -visualisierung in der Praxis besonders bewährt. Mit
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.r-project.org">R</ext-link>
  lassen sich beispielsweise <italic>Topic Models</italic> generieren
  (mehr zu Topic Modeling siehe Horstmann
  (<xref alt="2024b" rid="ref-horstmannMethodenbeitragTopicModeling2018" ref-type="bibr">2024b</xref>))
  und in Form von <italic>Word Clouds</italic> visualisieren.
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.python.org">Python</ext-link>
  ist besonders für die Textanalyse im Bereich <italic>Natural Language
  Processing</italic> geeignet und erlaubt mit entsprechenden
  Bibliotheken auch eine Visualisierung der erzeugten Daten.
  Mit der Javascript-Bibliothek
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://d3js.org">D3</ext-link>
  lassen sich unterschiedlichste Datensätze (nicht nur Textdaten) in
  vorgefertigten Visualisierungen darstellen, aber auch vollkommen neue
  Visualisierungen erstellen. Die Anwendung aller dieser Sprachen
  erfordert Programmierkenntnisse im Allgemeinen und grundlegende bis
  fortgeschrittene Kenntnisse der jeweiligen Sprache im Speziellen. Für
  eine Vielzahl dieser Tools existiert im Web eine umfangreiche Sammlung
  an Tutorials und Dokumentationen, die als Lernmaterial genutzt werden
  können. Weiterführende Literatur und Links finden Sie am Ende des
  Artikels. Für einen adäquaten Einsatz von Visualisierungstools ist die
  Kenntnis einiger Grundprinzipien der Textvisualisierung entscheidend.
  Zunächst sollten Sie sich fragen, was für Daten Sie repräsentieren
  möchten. Abhängig davon, was Sie an einem Text oder einer Textsammlung
  analysieren möchten, arbeiten Sie mit unterschiedlichen Datensätzen
  (siehe Abschnitt 1). Normalerweise besteht ein Datensatz aus einzelnen
  Entitäten (in der Regel Zeilen in der Datentabelle), die sich wiederum
  aus einzelnen Datenattributen zusammensetzen. Menge und Art der
  Attribute haben Einfluss auf die Visualisierungstypen, die für Ihre
  Visualisierung in Betracht kommen.
  Man unterscheidet drei grundlegende Datenattribute: quantitativ,
  kategorisch (auch: nominal) und ordinal. Unter quantitativen Daten
  versteht man numerische Daten, mit denen Berechnungen angestellt
  werden können, wie beispielsweise die Häufigkeit von Wörtern in einem
  Text. Geografische oder zeitliche Daten können als Sonderform
  quantitativer Daten betrachtet werden, die gewissen formalen
  Beschränkungen unterliegt. Im Gegensatz dazu spricht man von
  kategorischen Daten, wenn diese nicht-numerisch sind und voneinander
  unabhängige Werte darstellen. Ein Beispiel hierfür sind etwa die
  unterschiedlichen Namen der Figuren in einem Text. Ordinale Daten
  ähneln kategorischen Daten, unterscheiden sich aber durch die in Ihnen
  zum Ausdruck kommende Reihenfolge. Eine Bewertung wie „klein, mittel,
  groß“ fällt beispielsweise unter diese Bezeichnung. Die bei den
  jeweiligen Datenattributen auftretenden Werte können zudem Relationen
  untereinander haben, die ebenfalls im Datensatz kodiert sein können.
  Um diese unterschiedlichen Datenattribute zu repräsentieren, stehen
  verschiedene sogenannte „Visuelle Variablen“
  (<xref alt="Bertin 1974" rid="ref-bertinGraphischeSemiologieDiagramme1974" ref-type="bibr">Bertin
  1974</xref>) zur Verfügung, von denen die wichtigsten in Abbildung 9
  aufgeführt sind.</p>
  <fig>
    <caption><p>Abb. 9: Visuelle Variablen nach Bertin
    (<xref alt="1974, 51" rid="ref-bertinGraphischeSemiologieDiagramme1974" ref-type="bibr">1974,
    51</xref>)</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Bertin1974-p.png" />
  </fig>
  <p>Im einzelnen sind dies: Form, Größe, Helligkeitswert, Muster,
  Farbe, Richtung und Position. Um visuelle Variablen und Gestaltgesetze
  sinnvoll anwenden zu können, sind einige Regeln zu beachten. Je nach
  Datenattribut sind visuelle Variablen unterschiedlich gut geeignet, um
  Datenwerte zu repräsentieren: Während sich z. B. die visuelle Variable
  Farbe besonders eignet, um kategorische Werte darzustellen, so ist sie
  nicht geeignet, um quantitative Werte zu kodieren. In der
  untenstehenden Tabelle ist eine Übersicht über sinnvolle Kodierungen
  als visuelle Variablen der einzelnen Datenattribute in Spalten
  abgebildet (mit von oben nach unten abnehmender Eignung). Die
  genannten visuellen Variablen wurden durch weitere ergänzt, die in
  Spezialfällen zur Anwendung kommen können. Im Normalfall ist die oben
  dargestellte Auswahl von sieben Variablen ausreichend.</p>
  <fig>
    <caption><p>Abb. 10: Eignung ausgewählter visueller Variablen für
    verschiedene Datenattribute, von oben nach unten abnehmend
    (<xref alt="Mackinlay 1986" rid="ref-mackinlayAutomatingDesignGraphical1986" ref-type="bibr">Mackinlay
    1986</xref>)</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Mackinlay_PerceptualTask-p.png" />
  </fig>
  <p>Visualisierungen, die Relationen darstellen, wie beispielsweise
  Netzwerke oder Hierarchien, orientieren sich an den sog.
  Gestaltgesetzen. Für die Textvisualisierung sind hier besonders die
  Gesetze <italic>Nähe, Ähnlichkeit, Verbundenheit</italic> und
  <italic>Gemeinsame Regionen</italic> wichtig:</p>
  <fig>
    <caption><p>Abb. 11: Gestaltgesetze nach Wertheimer 1923. Quelle:
    <ext-link ext-link-type="uri" xlink:href="https://userinterfacedesign.ch/gestaltgesetze/">https://userinterfacedesign.ch/gestaltgesetze/</ext-link></p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="infografik_userinterfacedesign_gestaltgesetze_01-p.png" />
  </fig>
  <p>Auch im Bereich der <italic>Interaktion</italic> haben sich im
  Laufe der Zeit einige Techniken etabliert, deren Eignung sich in der
  Praxis besonders bewährt hat Normalerweise gestatten generische Tools
  nur sehr eingeschränkt eine Beeinflussung der Interaktionen, die mit
  einer Textvisualisierung möglich sind. Auch in <italic>R</italic> und
  <italic>Python</italic> findet die Interaktion eher auf Code-Ebene
  statt. Die Gestaltung und Programmierung eines vollständigen
  User-Interfaces, bei dem die Interaktionen frei zu bestimmen sind,
  kann in der Regel nur unter Beteiligung von Programmierer*innen und
  Designer*innen mit Webtechnologien wie
  <xref alt="HTML" rid="glossary-html">HTML</xref>/CSS und Javascript
  umgesetzt werden. Dennoch sollen die wichtigsten wissenschaftlichen
  Erkenntnisse kurz vorgestellt werden.
  Ein Prinzip, das sich in der Praxis immer wieder bewährt hat, ist das
  sogenannte <italic>Shneiderman’s Visual Information Seeking
  Mantra</italic>: „Overview first, zoom and filter, then
  details-on-demand“
  (<xref alt="Shneiderman 1996" rid="ref-shneidermanEyesHaveIt1996" ref-type="bibr">Shneiderman
  1996</xref>). Visualisierungen sollten zunächst einen Überblick über
  die Daten vermitteln, durch Interaktionen wie Zoomen und Filtern die
  Auswahl eines Teilbereiches erlauben und schließlich
  Detailinformationen für einzelne Datenpunkte bei Bedarf anzeigen (z.
  B. durch einen Mausklick).
  Ein weiteres Prinzip ist das <italic>Semantic Zooming</italic>.
  Hierbei handelt es sich um eine hilfreiche Strukturierung zoombarer
  Interfaces, wie sie z. B. von Google Maps eingesetzt werden: Mit jeder
  Zoomstufe, die man weiter hineinzoomt, werden mehr Details auf der
  Karte angezeigt. Auf diese Weise lässt sich vermeiden, dass sich eine
  Vielzahl von visuellen Elementen oder Beschriftungen überlagert, die
  auf einer bestimmten Zoomstufe noch gar nicht relevant ist.
  Bei mehreren Visualisierungen, die durch die Daten miteinander in
  Verbindung stehen, bietet sich schließlich
  <italic>Brushing+Linking</italic> als Prinzip an, um die Verbindung
  auch visuell deutlich zu machen. Mit <italic>Brushing</italic> wird
  die Auswahl eines Teilbereichs der Daten einer Visualisierung
  bezeichnet, mit <italic>Linking</italic> die Hervorhebung dieser Daten
  in anderen verknüpften Visualisierungen, die den gleichen Datensatz
  mit einer anderen Perspektive repräsentieren (z. B. andere
  Datendimensionen oder ein gänzlich anderer Visualisierungstyp). Eine
  Vielzahl von Websites und Infografiken geben grundlegende
  Hilfestellung zur Auswahl geeigneter Visualisierungen. Durch Eingabe
  von Informationen zu Ihrem Datensatz (oder das Verfolgen von Pfaden in
  einer Baumstruktur) schränken Sie die Zahl in Frage kommender
  Visualisierungen schrittweise ein.</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>3DH-Projekt:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://web.archive.org/save/http://threedh.net/">https://web.archive.org/save/https://web.archive.org/save/http://threedh.net/</ext-link>
      (Letzter Zugriff: 26.06.2024)</p>
    </list-item>
  </list>
  <sec id="generische-visualisierungstools">
    <title>Generische Visualisierungstools</title>
    <list list-type="bullet">
      <list-item>
        <p>Voyant:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://voyant-tools.org/">https://web.archive.org/save/https://voyant-tools.org/</ext-link>
        (vgl. Voyant
        (<xref alt="Flüh 2024" rid="ref-fluhToolbeitragVoyant2018" ref-type="bibr">Flüh
        2024</xref>)) (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>CATMA:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/http://catma.de/">https://web.archive.org/http://catma.de/</ext-link>
        (vgl. CATMA
        (<xref alt="Schumacher 2024a" rid="ref-schumacherToolbeitragCATMA2019" ref-type="bibr">Schumacher
        2024a</xref>)) (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>Prism:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.graphpad.com/features">https://web.archive.org/save/https://www.graphpad.com/features</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>Data Wrapper:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.datawrapper.de/">https://web.archive.org/save/https://www.datawrapper.de/</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>Plot.ly:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/https://plotly.com">https://web.archive.org/https://plotly.com</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>RAW:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://rawgraphs.io/">https://web.archive.org/save/http://rawgraphs.io/</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
    </list>
  </sec>
  <sec id="r-the-r-project-for-statistical-computing">
    <title>R: The R project for Statistical Computing</title>
    <list list-type="bullet">
      <list-item>
        <p>R-Webseite:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.r-project.org">https://web.archive.org/save/https://www.r-project.org</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>Tutorials und Einführungen:</p>
        <list list-type="bullet">
          <list-item>
            <p>A gentle Introduction to Text Mining Using R:
            <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://eight2late.wordpress.com/2015/05/27/a-gentle-introduction-to-text-mining-using-r/">https://web.archive.org/save/https://eight2late.wordpress.com/2015/05/27/a-gentle-introduction-to-text-mining-using-r/</ext-link>
            (Letzter Zugriff: 26.06.2024)</p>
          </list-item>
          <list-item>
            <p>Introduction to Text Analysis and Topic Modeling with R:
            <ext-link ext-link-type="uri" xlink:href="http://www.matthewjockers.net/materials/dh-2014-introduction-to-text-analysis-and-topic-modeling-with-r/">http://www.matthewjockers.net/materials/dh-2014-introduction-to-text-analysis-and-topic-modeling-with-r/</ext-link>
            (Letzter Zugriff: 26.06.2024)</p>
          </list-item>
        </list>
      </list-item>
    </list>
  </sec>
  <sec id="python">
    <title>Python</title>
    <list list-type="bullet">
      <list-item>
        <p>Python-Webseite:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.python.org/">https://web.archive.org/save/https://www.python.org/</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>Natural Language Toolkit:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://www.nltk.org/">https://web.archive.org/save/http://www.nltk.org/</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>Tutorials und Einführungen:</p>
        <list list-type="bullet">
          <list-item>
            <p>Python Programming for the Humanities:
            <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://www.karsdorp.io/python*course/">https://web.archive.org/save/http://www.karsdorp.io/python*course/</ext-link>
            (Letzter Zugriff: 26.06.2024)</p>
          </list-item>
          <list-item>
            <p>Natural Language Processing with Python (Buch):
            <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://www.nltk.org/book/">https://web.archive.org/save/http://www.nltk.org/book/</ext-link>
            (Letzter Zugriff: 26.06.2024)</p>
          </list-item>
          <list-item>
            <p>Text Analysis with Topic Models:
            <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://de.dariah.eu/text-analysis-with-topic-models">https://web.archive.org/save/https://de.dariah.eu/text-analysis-with-topic-models</ext-link>
            (Letzter Zugriff: 26.06.2024)</p>
          </list-item>
        </list>
      </list-item>
    </list>
  </sec>
  <sec id="d3">
    <title>D3</title>
    <list list-type="bullet">
      <list-item>
        <p>D3-Webseite:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://d3js.org">https://web.archive.org/save/https://d3js.org</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>Tutorials und Einführungen:</p>
        <list list-type="bullet">
          <list-item>
            <p>Überblick und kurze Einführung D3:
            <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://d3js.org/#introduction">https://web.archive.org/save/https://d3js.org/#introduction</ext-link>
            (Letzter Zugriff: 26.06.2024)</p>
          </list-item>
          <list-item>
            <p>Sammlung von Tutorials:
            <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://github.com/d3/d3/wiki/Tutorials">https://web.archive.org/save/https://github.com/d3/d3/wiki/Tutorials</ext-link>
            (Letzter Zugriff: 26.06.2024)</p>
          </list-item>
        </list>
      </list-item>
    </list>
  </sec>
  <sec id="textvisualisierung-und-visualisierung-im-allgemeinen">
    <title>Textvisualisierung und Visualisierung im Allgemeinen</title>
    <p>Die im Folgenden aufgeführten Webseiten und Grafiken leisten
    Hilfestellung bei der Wahl geeigneter Visualisierungen für
    unterschiedliche Datensätze</p>
    <list list-type="bullet">
      <list-item>
        <p>Principles of Information Visualization:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://www.themacroscope.org/?page_id=469">https://web.archive.org/save/http://www.themacroscope.org/?page_id=469</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>Data and Design Handbook:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://trinachi.github.io/data-design-builds/copyright-page01.html">https://web.archive.org/save/https://trinachi.github.io/data-design-builds/copyright-page01.html</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
      <list-item>
        <p>Data Viz Project:
        <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://datavizproject.com/">https://web.archive.org/save/https://datavizproject.com/</ext-link>
        (Letzter Zugriff: 26.06.2024)</p>
      </list-item>
    </list>
  </sec>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-close-reading">Close
      Reading</styled-content></term>
      <def>
        <p>Close Reading bezeichnet die sorgfältige Lektüre und
        Interpretation eines einzelnen oder weniger Texte. Close Reading
        ist in der digitalen Literaturwissenschaft außerdem mit der
        manuellen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        textueller Phänomene verbunden (vgl. auch
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref> als Gegenbegriff).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-data-mining">Data
      Mining</styled-content></term>
      <def>
        <p>Data Mining gehört zum Fachbereich
        <xref alt="Information Retrieval" rid="glossary-information-retrieval">Information
        Retrieval</xref> und bezieht sich auf die systematische
        Anwendung computergestützter Methoden, die darauf abzielt, in
        vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu
        erkennen. Textbasierte Formen des Data Minings sind u. a.
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>,
        <xref alt="Web Mining" rid="glossary-web-mining">Web
        Mining</xref> und
        <xref alt="Opinion Mining" rid="glossary-opinion-mining">Opinion
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-distant-reading">Distant
      Reading</styled-content></term>
      <def>
        <p>Distant Reading ist ein Ansatz aus den digitalen
        Literaturwissenschaften, bei dem computationelle Verfahren auf
        häufig große Mengen an Textdaten angewandt werden, ohne dass die
        Texte selber gelesen werden. Meist stehen hier quantitative
        Analysen im Vordergrund, es lassen sich jedoch auch qualitative
        <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>
        quantitativ vergleichen. Als Gegenbegriff zu
        <xref alt="Close Reading" rid="glossary-close-reading"><italic>Close
        Reading</italic></xref> wurde der Begriff insbesondere von
        Franco Moretti (2000) geprägt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-information-retrieval">Information
      Retrieval</styled-content></term>
      <def>
        <p>Die Teildisziplin der Informatik, das Information Retrieval,
        beschäftigt sich mit der computergestützten Suche und
        Erschließung komplexer Informationen in meist unstrukturierten
        Datensammlungen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-korpus">Korpus</styled-content></term>
      <def>
        <p>Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural
        für „das Korpus“) sind typischerweise nach Textsorte, Epoche,
        Sprache oder Autor*in zusammengestellt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z.B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-n-gramm">N-Gramm</styled-content></term>
      <def>
        <p>Unter N-Gramm versteht man in der Linguistik eine Sequenz von
        <italic>N</italic> aufeinanderfolgenden Fragmenten/Einheiten in
        einem Text. So gibt es beispielsweise Bigramme, Trigramme etc.
        Diese Fragmente können Buchstaben oder Phoneme sein. Der Satz
        „Marie erforscht Literatur digital“ kann zum Beispiel
        folgendermaßen in Bigramme, drei wortbasierte N-gramme mit je
        zwei Wörtern, aufgeteilt werden: „Marie erforscht“, „erforscht
        Literatur“ und „Literatur digital“.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-opinion-mining">Opinion
      Mininig</styled-content></term>
      <def>
        <p>Unter Opinion Mining, oder Sentiment Analysis, versteht man
        die Analyse von Stimmungen oder Haltungen gegenüber einem Thema,
        durch die Analyse natürlicher Sprache. Das Opinion Mining gehört
        zu den Verfahren des
        <xref alt="Text Minings" rid="glossary-text-mining">Text
        Minings</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic> , oder
        „Wortart“ auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-scalable-reading">Scalable
      Reading</styled-content></term>
      <def>
        <p>Die Kombination aus
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref>- und
        <xref alt="Close Reading" rid="glossary-close-reading">Close
        Reading</xref>-Methoden, angewandt auf einen
        Untersuchungsgegenstand, wird als Scalable Reading
        bezeichnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-text-mining">Text
      Mining</styled-content></term>
      <def>
        <p>Das Text Mining ist eine textbasierte Form des
        <xref alt="Data Minings" rid="glossary-data-mining">Data
        Minings</xref>. Prozesse &amp; Methoden, computergestützt und
        automatisch Informationen bzw. Wissen aus unstrukturierten
        Textdaten zu extrahieren, werden als Text Mining
        zusammengefasst.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-web-mining">Web
      Mining</styled-content></term>
      <def>
        <p>Unter Web Mining versteht man die Anwendung von Techniken des
        <xref alt="Data Mining" rid="glossary-data-mining">Data
        Mining</xref> zur Extraktion von Informationen aus dem World
        Wide Web. Das Web Mining ist ein Teilbereich des Data Minings
        und zählt zu einem der wichtigsten Anwendungsgebiete für das
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-wordcloud">Wordcloud</styled-content></term>
      <def>
        <p>Eine <italic>Wordcloud</italic> , oder auch Schlagwortwolke,
        ist eine Form der Informationsvisualisierung, beispielsweise von
        Worthäufigkeiten in einem Text oder einer Textsammlung. Dabei
        werden unterschiedlich gewichtete Wörter, wie die häufigsten
        Wörter, i.d.R. größer oder auf andere Weise hervorgehoben
        dargestellt. Die horizontale/vertikale Ausrichtung und die Farbe
        der dargestellten Wörter hat meistens allerdings keinen
        semantischen Mehrwert.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-adlerTextAlsFigur1987">
    <mixed-citation>Adler, Jeremy und Ulrich Ernst. 1987. <italic>Text
    als Figur. Visuelle Poesie von der Antike bis zur Moderne</italic>.
    Weinheim: Acta humaniora, VCH.</mixed-citation>
  </ref>
  <ref id="ref-bertinGraphischeSemiologieDiagramme1974">
    <mixed-citation>Bertin, Jacques. 1974. <italic>Graphische
    Semiologie: Diagramme, Netze, Karten</italic>. Berlin: de
    Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-cardReadingsInformationVisualization1999">
    <mixed-citation>Card, Stuart K., Jock Mackinlay und Ben Shneiderman.
    1999. <italic>Readings in information visualization: Using vision to
    think</italic>. San Francisco: Kaufmann.</mixed-citation>
  </ref>
  <ref id="ref-druckerHumanitiesApproachesGraphical2011">
    <mixed-citation>Drucker, Johanna. 2011. Humanities Approaches to
    Graphical Display. <italic>Digital Humanities Quarterly</italic>
    005, Nr. 1 (10. März).</mixed-citation>
  </ref>
  <ref id="ref-ederFigurenkonstellation2007">
    <mixed-citation>Eder, Jens. 2007. Figurenkonstellation. In:
    <italic>Metzler Lexikon Literatur. Begriffe und
    Definitionen</italic>, hg. von Dieter Burdorf, Christoph Fasbender,
    und Burkhard Moenninghoff, 239. Stuttgart, Weimar:
    Metzler.</mixed-citation>
  </ref>
  <ref id="ref-fluhToolbeitragVoyant2018">
    <mixed-citation>Flüh, Marie. 2024. Toolbeitrag: Voyant. Hg. von
    Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 5. Textvisualisierung
    (7. August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3775">10.48694/fortext.3775</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/voyant">https://fortext.net/tools/tools/voyant</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-goetheGoethesWerke188719191987">
    <mixed-citation>Goethe, Johann W. 1987. <italic>Goethes Werke
    (1887-1919). Hrsg im Auftrage der Großherzogin Sophie von Sachsen.
    Abteilung II. Weimarer Ausgabe</italic>. 2. Aufl. Bd. 5. Weimar:
    DTV.</mixed-citation>
  </ref>
  <ref id="ref-heuslerNibelungensageUndNibelungenlied1955">
    <mixed-citation>Heusler, Andreas. 1955. <italic>Nibelungensage und
    Nibelungenlied. Die Stoffgeschichte des deutschen
    Heldenepos</italic>. Dortmund: Ruhfus.</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragStilometrie2024">
    <mixed-citation>Horstmann, Jan. 2024a. Methodenbeitrag: Stilometrie.
    Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 1. Stilometrie
    (26. Februar). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3769">10.48694/fortext.3769</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/stilometrie">https://fortext.net/routinen/methoden/stilometrie</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragTopicModeling2018">
    <mixed-citation>———. 2024b. Methodenbeitrag: Topic Modeling. Hg. von
    Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 8. Topic Modeling (7.
    Oktober). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3717">10.48694/fortext.3717</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/topic-modeling">https://fortext.net/routinen/methoden/topic-modeling</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-jackeMethodenbeitragManuelleAnnotation2018">
    <mixed-citation>Jacke, Janina. 2024. Methodenbeitrag: Manuelle
    Annotation. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 4.
    Manuelle Annotation (7. August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3748">10.48694/fortext.3748</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/manuelle-annotation">https://fortext.net/routinen/methoden/manuelle-annotation</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-janickeCloseDistantReading2015">
    <mixed-citation>Jänicke, Stefan, Greta Franzini, Muhammad Faisal
    Cheema und Gerik Scheuermann. 2015. On close and distant reading in
    digital humanities: A survey and future challenges. In:
    <italic>Eurographics Conference on Visualization (EuroVis) -
    STARs</italic>. The Eurographics Association.</mixed-citation>
  </ref>
  <ref id="ref-kammerVisualitatUndMaterialitat2014">
    <mixed-citation>Kammer, Stephan. 2014. Visualität und Materialität
    der Literatur. In: <italic>Handbuch Literatur &amp; Visuelle
    Kultur</italic>, hg. von Claudia Benthien und Brigitte Weingart,
    31–47. Berlin, Boston: de Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-kollerUnbildlicheBildlicheUnd2000">
    <mixed-citation>Koller, Erwin. 2000. Unbildliche, bildliche und
    bildhafte Versprachlichung von Schmerz (bei A. Döblin, R. Musil, Th.
    Mann und M. Walser). In: <italic>Bild im Text - Text und
    Bild</italic>, hg. von Ulla Fix und Hans Wellmann, 129–153.
    Heidelberg: Winter.</mixed-citation>
  </ref>
  <ref id="ref-mackinlayAutomatingDesignGraphical1986">
    <mixed-citation>Mackinlay, Jock. 1986. Automating the design of
    graphical presentations of relational information. <italic>ACM
    Transactions on Graphics</italic> 5, Nr. 2:
    110–141.</mixed-citation>
  </ref>
  <ref id="ref-mellmannVersanalyse2007">
    <mixed-citation>Mellmann, Katja. 2007. Versanalyse. In:
    <italic>Handbuch Literaturwissenschaft</italic>, hg. von Thomas Anz,
    2: Methoden und Theorien:81–97. Stuttgart, Weimar:
    Metzler.</mixed-citation>
  </ref>
  <ref id="ref-piattiGeografieLiteraturSchauplatze2008">
    <mixed-citation>Piatti, Barbara. 2008. <italic>Die Geografie der
    Literatur. Schauplätze, Handlungsräume, Raumphantasien</italic>.
    Göttingen: Wallstein.</mixed-citation>
  </ref>
  <ref id="ref-ryanCognitiveMapsConstruction2003">
    <mixed-citation>Ryan, Marie-Laure. 2003. Cognitive Maps and the
    Construction of Narrative Space. In: <italic>Narrative Theory and
    the Cognitive Sciences</italic>, hg. von David Herman, 214–242.
    Stanford: CSLI Publications.</mixed-citation>
  </ref>
  <ref id="ref-schmidTextadressat2007">
    <mixed-citation>Schmid, Wolf. 2007. Textadressat. In:
    <italic>Handbuch Literaturwissenschaft</italic>, hg. von Thomas Anz,
    1: Gegenstände und Grundbegriffe:171–181. Weimar:
    Metzler.</mixed-citation>
  </ref>
  <ref id="ref-schumacherToolbeitragCATMA2019">
    <mixed-citation>Schumacher, Mareike. 2024a. Toolbeitrag: CATMA. Hg.
    von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 4. Manuelle
    Annotation (7. August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3761">10.48694/fortext.3761</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/catma">https://fortext.net/tools/tools/catma</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-schumacherMethodenbeitragNetzwerkanalyse2018">
    <mixed-citation>———. 2024b. Methodenbeitrag: Netzwerkanalyse. Hg.
    von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 6. Netzwerkanalyse
    (30. August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3759">10.48694/fortext.3759</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/netzwerkanalyse">https://fortext.net/routinen/methoden/netzwerkanalyse</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-seifertVisualAnalysisKnowledge2014">
    <mixed-citation>Seifert, Christin, Vedran Sabol, Wolfgang Kienreich,
    Elisabeth Lex und Michael Granitzer. 2014. Visual analysis and
    knowledge discovery for text. In: <italic>Large-Scale Data
    Analystics</italic>, 189–218. New York: Springer.</mixed-citation>
  </ref>
  <ref id="ref-shneidermanEyesHaveIt1996">
    <mixed-citation>Shneiderman, Ben. 1996. The eyes have it: A task by
    data type taxonomy for information visualizations. In: <italic>In
    IEEE Symposium on Visual Languages</italic>,
    336–343.</mixed-citation>
  </ref>
  <ref id="ref-wareInformationVisualizationPerception2012">
    <mixed-citation>Ware, Colin. 2012. <italic>Information
    Visualization: Perception for Design</italic>. 3. Aufl. Waltham:
    Elsevier.</mixed-citation>
  </ref>
  <ref id="ref-wertheimerUntersuchungenZurLehre1923">
    <mixed-citation>Wertheimer, Max. 1923. Untersuchungen zur Lehre von
    der Gestalt. II. <italic>Psychologische Forschung</italic> 4, Nr. 1:
    301–350.</mixed-citation>
  </ref>
  <ref id="ref-willcockCompanionIliadBased1976">
    <mixed-citation>Willcock, Malcolm M. 1976. <italic>A Companion to
    the Iliad: Based on the Translation by Richmond Lattimore</italic>.
    Chicago, London: The University of Chicago Press.</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
