<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3778</article-id>
<title-group>
<article-title>Toolbeitrag: Poemage</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0001-8047-2232</contrib-id>
<name>
<surname>Horstmann</surname>
<given-names>Jan</given-names>
</name>
<email>dh@jan-horstmann.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Münster</institution>
</institution-wrap>
</aff>
</contrib-group>
<pub-date date-type="pub" publication-format="electronic" iso-8601-date="2024-08-07">
<day>7</day>
<month>8</month>
<year>2024</year>
</pub-date>
<volume>1</volume>
<issue>5</issue>
<issue-title>Textvisualisierung</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 23.09.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/poemage">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2019-09-23">
<day>23</day>
<month>09</month>
<year>2019</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 23.09.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/poemage">fortext.net</ext-link></p>
<fig>
  <caption><p>Der Workflow von Poemage: TXT-Datei eines englischen
  Gedichts dem „Poems“-Ordner hinzufügen, im dreiteiligen
  Poemage-Interface auswählen und die verschiedenen Kategorien der
  Klangstrukturen visuell explorieren; zur Dokumentation ausgewählter
  Ansichten erstellen Sie Screenshots</p></caption>
  <graphic mimetype="image" mime-subtype="png" xlink:href="Poemage_Screens_p.png" />
</fig>
<list list-type="bullet">
  <list-item>
    <p><bold>Systemanforderungen:</bold> Das Tool erfordert Java, ist
    desktopbasiert (Mac und Windows) und offline nutzbar</p>
  </list-item>
  <list-item>
    <p><bold>Stand der Entwicklung:</bold> Start der Entwicklung 2012;
    an einer webbasierten (vgl.
    <xref alt="Webanwendung" rid="glossary-webanwendung">Webanwendung</xref>)
    Version wird aktuell noch gearbeitet</p>
  </list-item>
  <list-item>
    <p><bold>Herausgeber:</bold> University of Utah: Nina McCurdy, Julie
    Gonnering Lein, Katharine Coles, Miriah Meyer</p>
  </list-item>
  <list-item>
    <p><bold>Lizenz:</bold> Kostenfrei (Open Source)</p>
  </list-item>
  <list-item>
    <p><bold>Weblink:
    </bold><ext-link ext-link-type="uri" xlink:href="https://www.sci.utah.edu/~nmccurdy/Poemage/">https://www.sci.utah.edu/~nmccurdy/Poemage/</ext-link></p>
  </list-item>
  <list-item>
    <p><bold>Im- und Export:</bold> Gedichte können im Reintextformat
    (vgl.
    <xref alt="Reintext-Version" rid="glossary-reintext-version">Reintext-Version</xref>)
    (TXT) dem Ordner <italic>Poems</italic> hinzugefügt werden und sind
    dann im Tool auswählbar</p>
  </list-item>
  <list-item>
    <p><bold>Sprachen:</bold> Englisch</p>
  </list-item>
</list>
<sec id="für-welche-fragestellungen-kann-poemage-eingesetzt-werden">
  <title>1. Für welche Fragestellungen kann Poemage eingesetzt
  werden?</title>
  <p>Mit Poemage lassen sich klangliche Strukturen von
  englischsprachigen Gedichten mit visueller Unterstützung untersuchen.
  Anders als der
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.geisteswissenschaften.fu-berlin.de/v/rhythmicalizer/index.html">Rhytmicalizer</ext-link>,
  der die Audiodateien der Gedichte von Lyrikline
  (<xref alt="Horstmann 2024" rid="ref-horstmannRessourcenbeitragLyrikline2019" ref-type="bibr">Horstmann
  2024</xref>) untersucht, funktioniert die phonetische Analyse bei
  Poemage auf Basis textsprachlicher Informationen und kann damit auf
  jedes Gedicht angewendet werden – bislang jedoch nur in englischer
  Sprache. Durch die visuelle Exploration klanglicher Strukturen können
  Fragen nach phonetischen Mustern und Zusammenhängen z. B. von
  Rhythmen, Assonanzen und Alliterationen etc. in Gedichten im Zuge
  eines Close Readings (vgl.
  <xref alt="Close Reading" rid="glossary-close-reading">Close
  Reading</xref>) entdeckt und untersucht werden. Poemage unterstützt
  visuell Prozesse der Exploration und Hypothesenbildung und ist nicht
  darauf ausgelegt, Visualisierungen zu produzieren, die das
  festgeschriebene Ergebnis eines Forschungsprozesses darstellen.</p>
</sec>
<sec id="welche-funktionalitäten-bietet-poemage-und-wie-zuverlässig-ist-das-tool">
  <title>2. Welche Funktionalitäten bietet Poemage und wie zuverlässig
  ist das Tool?</title>
  <p><italic>Funktionen (Auswahl)</italic>:</p>
  <list list-type="bullet">
    <list-item>
      <p>Auswahl phonetischer Elemente (<italic>sonic rhymes</italic>)
      wie Alliterationen, gleich klingender Silben etc. und
      buchstabenbasierter Übereinstimmungen (<italic>visual
      rhymes</italic>) wie N-Gramms (vgl.
      <xref alt="N-Gramm" rid="glossary-n-gramm">N-Gramm</xref>) oder
      Anagramme im linken <italic>Set View</italic></p>
    </list-item>
    <list-item>
      <p>Anzeige und Hervorhebung (durch Hovern) von über das gesamte
      Gedicht verteilten <italic>sonic rhymes</italic> und
      <italic>visual rhymes</italic> im mittleren <italic>Poem
      View</italic></p>
    </list-item>
    <list-item>
      <p>Anzeige von Verbindungspfaden zwischen gleichen phonetischen
      und buchstabenbasierten Zusammenhängen im <italic>Path
      View</italic></p>
    </list-item>
    <list-item>
      <p>Darstellung sämtlicher phonetischer und buchstabenbasierter
      Elemente und Verbindungen durch die Funktion <italic>beautiful
      mess</italic></p>
    </list-item>
  </list>
  <p><italic>Zuverlässigkeit</italic>: Poemage ist ein einfach zu
  installierendes Programm, das lokal auf Ihrem Rechner läuft (eine
  webbasierte Anwendung soll demnächst erscheinen). Das Hinzufügen von
  Gedichten im TXT-Format ist simpel und funktioniert einwandfrei. Die
  drei <italic>Views</italic> des Interfaces beziehen sich funktional
  aufeinander, d. h. eine Aktion bspw. im <italic>Set View</italic>
  verändert die Anzeigen in den beiden anderen Panels und auch das
  Hovern etwa im <italic>Poem View</italic> (bei aktivierter
  <italic>hover word</italic>-Funktion) verändert die Anzeigen im ersten
  und dritten Panel. Das Tool basiert auf einem bereits dem Tool
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://www.sci.utah.edu/~nmccurdy/rhymeDesign/">RhymeDesign</ext-link>
  (<xref alt="McCurdy, Srikumar und Meyer 2015" rid="ref-mccurdyRhymedesignToolAnalyzing2015" ref-type="bibr">McCurdy,
  Srikumar und Meyer 2015</xref>) zugrunde liegenden System zur
  automatischen Erkennung (vgl.
  <xref alt="Text Mining" rid="glossary-text-mining">Text Mining</xref>)
  klanglicher Strukturen jenseits konventionalisierter Endreime.</p>
</sec>
<sec id="ist-poemage-für-dh-einsteigerinnen-geeignet">
  <title>3. Ist Poemage für DH-Einsteiger*innen geeignet?</title>
  <table-wrap>
    <table>
      <colgroup>
        <col width="50%" />
        <col width="50%" />
      </colgroup>
      <thead>
        <tr>
          <th>Checkliste</th>
          <th>✓ / teilweise / –</th>
        </tr>
      </thead>
      <tbody>
        <tr>
          <td>Methodische Nähe zur traditionellen
          Literaturwissenschaft</td>
          <td>teilweise</td>
        </tr>
        <tr>
          <td>Grafische Benutzeroberfläche</td>
          <td>✓</td>
        </tr>
        <tr>
          <td>Intuitive Bedienbarkeit</td>
          <td>✓</td>
        </tr>
        <tr>
          <td>Leichter Einstieg</td>
          <td>✓</td>
        </tr>
        <tr>
          <td>Handbuch vorhanden</td>
          <td>✓</td>
        </tr>
        <tr>
          <td>Handbuch aktuell</td>
          <td>✓</td>
        </tr>
        <tr>
          <td>Tutorials vorhanden</td>
          <td>teilweise</td>
        </tr>
        <tr>
          <td>Erklärung von Fachbegriffen</td>
          <td>✓</td>
        </tr>
        <tr>
          <td>Gibt es eine gute Nutzerbetreuung?</td>
          <td>✓</td>
        </tr>
      </tbody>
    </table>
  </table-wrap>
  <p>Methodisch geht Poemage auf die Regeln der freien Versanalyse
  zurück, erweitert diese jedoch nicht unerheblich durch automatische
  Funktionen und die Herstellung von Überblicksdarstellungen auf
  Knopfdruck. Das <xref alt="GUI" rid="glossary-gui">GUI</xref> von
  Poemage wurde in einer Kooperation von Lyrikexpert*innen und
  Designer*innen entwickelt und ist damit nicht nur sehr übersichtlich
  gestaltet und intuitiv bedienbar, sondern orientiert sich an den
  Wünschen von Literaturwissenschaftler*innen. Ein kurzes und prägnant
  formuliertes README (das beim Download als Datei enthalten ist)
  enthält Tipps zur etwaigen Fehlerbehebung, Anleitungen zum Dateiupload
  und Beschreibungen der einzelnen Panels und Funktionsbereiche des
  Interfaces. Ein auf der Webseite von Poemage eingebettetes Video eines
  Vortrags kann als Einstieg und Tutorialersatz angesehen werden. Die
  einzelnen, oft nicht intuitiv verständlichen Fachbegriffe,
  insbesondere im <italic>Set View,</italic> werden im Interface
  allerdings nicht erläutert. Eine Beschreibung der einzelnen Funktionen
  mit Beispielen findet sich jedoch in McCurdy u. a.
  (<xref alt="2016, 443" rid="ref-mccurdyPoemageVisualizingSonic2016" ref-type="bibr">2016,
  443</xref>).</p>
</sec>
<sec id="wie-etabliert-ist-poemage-in-den-literatur-wissenschaften">
  <title>4. Wie etabliert ist Poemage in den
  (Literatur-)Wissenschaften?</title>
  <p>Poemage wird bislang vor allem innerhalb der
  Visualisierungs-Community besprochen (s. weiterführende Literatur
  unten), sodass der Eindruck entstehen könnte, es sei vor allem
  hinsichtlich der zum Einsatz kommenden Visualisierungsstrategien
  interessant. Der literaturwissenschaftliche Mehrwert ist bislang
  zumindest in Publikationsform nicht nachgewiesen. Ein Grund dafür
  könnte sein, dass mit dem Tool vor allem Prozesse der Exploration und
  Hypothesenbildung unterstützt werden. Eine literaturwissenschaftlich
  orientierte Reflexion des Systems wäre wünschenswert, steht derzeit
  aber noch aus.</p>
</sec>
<sec id="unterstützt-poemage-kollaboratives-arbeiten">
  <title>5. Unterstützt Poemage kollaboratives Arbeiten?</title>
  <p>Nein, die Desktopapplikation ist für die Einzelarbeit
  ausgerichtet.</p>
</sec>
<sec id="sind-meine-daten-bei-poemage-sicher">
  <title>6. Sind meine Daten bei Poemage sicher?</title>
  <p>Ja. Es müssen keine personenbezogenen Daten angegeben werden. Nach
  Download des Tools kann man es direkt öffnen und anwenden. Ebenso
  müssen Sie Ihre Texte nur dem toolinternen Ordner „Poems“ hinzufügen,
  um sie in Poemage nutzen zu können. Ein Upload findet demnach nicht
  statt, sodass Sie auch urheberrechtlich geschützte Daten bearbeiten
  können.</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>Poemage:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.sci.utah.edu/~nmccurdy/Poemage/">https://web.archive.org/save/https://www.sci.utah.edu/~nmccurdy/Poemage/</ext-link>
      (Letzter Zugriff: 19.06.2024)</p>
    </list-item>
    <list-item>
      <p>Rhytmicalizer:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.geisteswissenschaften.fu-berlin.de/v/rhythmicalizer/index.html">https://web.archive.org/save/https://www.geisteswissenschaften.fu-berlin.de/v/rhythmicalizer/index.html</ext-link>
      (Letzter Zugriff: 19.06.2024)</p>
    </list-item>
    <list-item>
      <p>RhymeDesign:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://www.sci.utah.edu/~nmccurdy/rhymeDesign/">https://web.archive.org/save/http://www.sci.utah.edu/~nmccurdy/rhymeDesign/</ext-link>
      (Letzter Zugriff: 19.06.2024)</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-close-reading">Close
      Reading</styled-content></term>
      <def>
        <p>Close Reading bezeichnet die sorgfältige Lektüre und
        Interpretation eines einzelnen oder weniger Texte. Close Reading
        ist in der digitalen Literaturwissenschaft außerdem mit der
        manuellen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        textueller Phänomene verbunden (vgl. auch
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref> als Gegenbegriff).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-commandline">Commandline</styled-content></term>
      <def>
        <p>Die Commandline (engl. <italic>command line
        interface</italic> (CLI)), auch Kommandozeile, Konsole, Terminal
        oder Eingabeaufforderung genannt, ist die direkteste Methode zur
        Interaktion eines Menschen mit einem Computer. Programme ohne
        eine grafische Benutzeroberfläche
        (<xref alt="GUI" rid="glossary-gui">GUI</xref>) werden i. d. R.
        durch Texteingabe in die Commandline gesteuert. Um die
        Commandline zu öffnen, klicken Sie auf Ihrem Mac „cmd“ +
        „space“, geben „Terminal“ ein und doppelklicken auf das
        Suchergebnis. Bei Windows klicken Sie die Windowstaste + „R“,
        geben „cmd.exe“ ein und klicken Enter.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-csv">CSV</styled-content></term>
      <def>
        <p>CSV ist die englische Abkürzung für <italic>Comma Separated
        Values</italic>. Es handelt sich um ein Dateiformat zur
        einheitlichen Darstellung und Speicherung von einfach
        strukturierten Daten mit dem Kürzel <monospace>.csv</monospace>
        , sodass diese problemlos zwischen IT-Systemen ausgetauscht
        werden können. Dabei sind alle Daten zeilenweise angeordnet.
        Alle Zeilen wiederum sind in einzelne Datenfelder aufgeteilt,
        welche durch Trennzeichen wie Semikola oder Kommata getrennt
        werden können. In Programmen wie Excel können solche Textdateien
        als Tabelle angezeigt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-data-mining">Data
      Mining</styled-content></term>
      <def>
        <p>Data Mining gehört zum Fachbereich
        <xref alt="Information Retrieval" rid="glossary-information-retrieval">Information
        Retrieval</xref> und bezieht sich auf die systematische
        Anwendung computergestützter Methoden, die darauf abzielt, in
        vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu
        erkennen. Textbasierte Formen des Data Minings sind u. a.
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>,
        <xref alt="Web Mining" rid="glossary-web-mining">Web
        Mining</xref> und
        <xref alt="Opinion Mining" rid="glossary-opinion-mining">Opinion
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-distant-reading">Distant
      Reading</styled-content></term>
      <def>
        <p>Distant Reading ist ein Ansatz aus den digitalen
        Literaturwissenschaften, bei dem computationelle Verfahren auf
        häufig große Mengen an Textdaten angewandt werden, ohne dass die
        Texte selber gelesen werden. Meist stehen hier quantitative
        Analysen im Vordergrund, es lassen sich jedoch auch qualitative
        <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>
        quantitativ vergleichen. Als Gegenbegriff zu
        <xref alt="Close Reading" rid="glossary-close-reading"><italic>Close
        Reading</italic></xref> wurde der Begriff insbesondere von
        Franco Moretti (2000) geprägt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-gui">GUI</styled-content></term>
      <def>
        <p>GUI steht für <italic>Graphical User Interface</italic> und
        bezeichnet eine grafische Benutzeroberfläche. Ein GUI ermöglicht
        es, Tools mithilfe von grafischen Schaltflächen zu bedienen, um
        somit beispielsweise den Umgang mit der
        <xref alt="Commandline" rid="glossary-commandline">Commandline</xref>
        zu umgehen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-information-retrieval">Information
      Retrieval</styled-content></term>
      <def>
        <p>Die Teildisziplin der Informatik, das Information Retrieval,
        beschäftigt sich mit der computergestützten Suche und
        Erschließung komplexer Informationen in meist unstrukturierten
        Datensammlungen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z. B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-n-gramm">N-Gramm</styled-content></term>
      <def>
        <p>Unter N-Gramm versteht man in der Linguistik eine Sequenz von
        <italic>N</italic> aufeinanderfolgenden Fragmenten/Einheiten in
        einem Text. So gibt es beispielsweise Bigramme, Trigramme etc.
        Diese Fragmente können Buchstaben oder Phoneme sein. Der Satz
        „Marie erforscht Literatur digital“ kann zum Beispiel
        folgendermaßen in Bigramme, drei wortbasierte N-gramme mit je
        zwei Wörtern, aufgeteilt werden: „Marie erforscht“, „erforscht
        Literatur“ und „Literatur digital“.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-opinion-mining">Opinion
      Mininig</styled-content></term>
      <def>
        <p>Unter Opinion Mining, oder Sentiment Analysis, versteht man
        die Analyse von Stimmungen oder Haltungen gegenüber einem Thema,
        durch die Analyse natürlicher Sprache. Das Opinion Mining gehört
        zu den Verfahren des
        <xref alt="Text Minings" rid="glossary-text-mining">Text
        Minings</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic> , oder
        „Wortart“ auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-reintext-version">Reintext-Version</styled-content></term>
      <def>
        <p>Die Reintext-Version ist die Version eines digitalen Textes
        oder einer Tabelle, in der keinerlei Formatierungen
        (Kursivierung, Metadatenauszeichnung etc.) enthalten sind.
        Reintext-Formate sind beispielsweise TXT, RTF und
        <xref alt="CSV" rid="glossary-csv">CSV</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-text-mining">Text
      Mining</styled-content></term>
      <def>
        <p>Das Text Mining ist eine textbasierte Form des
        <xref alt="Data Minings" rid="glossary-data-mining">Data
        Minings</xref>. Prozesse &amp; Methoden, computergestützt und
        automatisch Informationen bzw. Wissen aus unstrukturierten
        Textdaten zu extrahieren, werden als Text Mining
        zusammengefasst.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-web-mining">Web
      Mining</styled-content></term>
      <def>
        <p>Unter Web Mining versteht man die Anwendung von Techniken des
        <xref alt="Data Mining" rid="glossary-data-mining">Data
        Mining</xref> zur Extraktion von Informationen aus dem World
        Wide Web. Das Web Mining ist ein Teilbereich des Data Minings
        und zählt zu einem der wichtigsten Anwendungsgebiete für das
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-webanwendung">Webanwendung</styled-content></term>
      <def>
        <p>Eine webbasierte Anwendung ist ein Anwendungsprogramm,
        welches eine Webseite als Schnittstelle oder Front-End
        verwendet. Im Gegensatz zu klassischen Desktopanwendungen werden
        diese nicht lokal auf dem Rechner der Nutzer*innen installiert,
        sondern können von jedem Computer über einen
        <xref alt="Webbrowser" rid="glossary-browser">Webbrowser</xref>
        „online“ genutzt werden. Webanwendungen erfordern daher kein
        spezielles Betriebssystem.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-colesSlippageSpillagePillage2014">
    <mixed-citation>Coles, Katharine. 2014. Slippage, Spillage, Pillage,
    Bliss: Close Reading, Uncertainty, and Machines. <italic>Western
    Humanities Review</italic> 68: 57–83.
    <ext-link ext-link-type="uri" xlink:href="http://www.sci.utah.edu/~nmccurdy/Poemage/images/20150224154447411.pdf">http://www.sci.utah.edu/~nmccurdy/Poemage/images/20150224154447411.pdf</ext-link>
    (zugegriffen: 18. September 2019).</mixed-citation>
  </ref>
  <ref id="ref-horstmannRessourcenbeitragLyrikline2019">
    <mixed-citation>Horstmann, Jan. 2024. Ressourcenbeitrag: Lyrikline.
    Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 2.
    Korpusbildung (12. Juni). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3814">10.48694/fortext.3814</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/ressourcen/textsammlungen/lyrikline">https://fortext.net/ressourcen/textsammlungen/lyrikline</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-leinSoundingSurfacesComputers2014">
    <mixed-citation>Lein, Julie. 2014. Sounding the Surfaces: Computers,
    Context, and Poetic Consequence. <italic>Western Humanities
    Review</italic> 68, Nr. 3: 84–109.
    <ext-link ext-link-type="uri" xlink:href="http://www.sci.utah.edu/~nmccurdy/Poemage/images/20150224154622013.pdf">http://www.sci.utah.edu/~nmccurdy/Poemage/images/20150224154622013.pdf</ext-link>
    (zugegriffen: 18. September 2019).</mixed-citation>
  </ref>
  <ref id="ref-leinDeepPoetryVisualizing2018">
    <mixed-citation>Lein, Julie, Nina McCurdy und Amanda Hurtado. 2018.
    Deep in Poetry: Visualizing Texts’ Sonic Depths in 3D.
    <italic>Leonardo: International Journal of Contemporary Visual
    Artists</italic> 51, Nr. 1: 80–82. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1162/LEON_a_01415">10.1162/LEON_a_01415</ext-link>,.</mixed-citation>
  </ref>
  <ref id="ref-mccurdyPoemageVisualizingSonic2016">
    <mixed-citation>McCurdy, Nina, Julie Lein, Katharine Coles und
    Miriah Meyer. 2016. Poemage: Visualizing the Sonic Topology of a
    Poem. <italic>IEEE Transactions on Visualization and Computer
    Graphics</italic> 22, Nr. 1: 439–448. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/TVCG.2015.2467811">10.1109/TVCG.2015.2467811</ext-link>,.</mixed-citation>
  </ref>
  <ref id="ref-mccurdyRhymedesignToolAnalyzing2015">
    <mixed-citation>McCurdy, Nina, Vivek Srikumar und Miriah Meyer.
    2015. Rhymedesign: A Tool for Analyzing Sonic Devices in Poetry. In:
    <italic>Proceedings of the Fourth Workshop on Computational
    Linguistics for Literature</italic>, 12–22. Denver, Colorado, USA:
    Association for Computational Linguistics. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.3115/v1/W15-0702">10.3115/v1/W15-0702</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://www.aclweb.org/anthology/W15-0702.pdf">https://www.aclweb.org/anthology/W15-0702.pdf</ext-link>
    (zugegriffen: 18. September 2019).</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
