<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3814</article-id>
<title-group>
<article-title>Ressourcenbeitrag: Lyrikline</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0001-8047-2232</contrib-id>
<name>
<surname>Horstmann</surname>
<given-names>Jan</given-names>
</name>
<email>dh@jan-horstmann.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Münster</institution>
</institution-wrap>
</aff>
</contrib-group>
<volume>1</volume>
<issue>2</issue>
<issue-title>Korpusbildung</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 29.07.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/ressourcen/textsammlungen/lyrikline">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2019-07-29">
<day>29</day>
<month>07</month>
<year>2019</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 29.07.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/ressourcen/textsammlungen/lyrikline">fortext.net</ext-link></p>
<sec id="kurzbeschreibung">
  <title>1. Kurzbeschreibung</title>
  <p>Lyrikline ist eine multimodale, mehrsprachige Plattform für Lyrik.
  Die Gedichte werden frei online zugänglich gemacht (vgl.
  <xref alt="Open Access" rid="glossary-open-access">Open
  Access</xref>), mit einem Bild der Autor*innen kombiniert und können
  zudem von diesen vorgelesen angehört werden. Die übersichtlich
  gestaltete Webseite ermöglicht u. a. eine gezielte und schnelle Suche
  nach Kategorien, Autor*innen oder Gedichten und die automatische
  Auswahl eines Zufallsgedichts.</p>
  <fig>
    <caption><p>Abb. 1: Startseite von Lyrikline vom 8. Juli
    2019</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Lyrikline-Startseite-p.png" />
  </fig>
  <p><bold>Steckbrief</bold></p>
  <list list-type="bullet">
    <list-item>
      <p><ext-link ext-link-type="uri" xlink:href="https://www.lyrikline.org">https://www.lyrikline.org</ext-link></p>
    </list-item>
    <list-item>
      <p>1999 vom
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.haus-fuer-poesie.org/de/literaturwerkstatt-berlin/home/">Haus
      für Poesie Berlin</ext-link> initiiert; seit 2003 zahlreiche
      nationale und internationale
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.lyrikline.org/de/partner/">Partner</ext-link>,
      darunter das Goethe-Institut München, die Zentral- und
      Landesbibliothek Berlin, die Lyrikzeitschrift <italic>Zwischen den
      Zeilen</italic>, die Anthologie <italic>Jahrbuch der
      Lyrik</italic>, die Schweizerische Kulturstiftung Pro Helvetia
      etc.</p>
    </list-item>
    <list-item>
      <p>Ziel: dem Schrumpfen des lyrischen Segments im Buchhandel sowie
      dem „Auseinanderfallen von Schrift und Ton auf dem Feld der Lyrik“
      (s.
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.lyrikline.org/de/about/">Lyrikline:
      About</ext-link>) entgegenwirken durch eine pluralistische, nicht
      eurozentrische Sammlung bekannter und unbekannterer
      Autor*innen</p>
    </list-item>
    <list-item>
      <p>derzeit 1375 vertretene Dichter*innen; 12312 Gedichte in 84
      Sprachen; 18492 Übersetzungen (Stand Juli 2019)</p>
    </list-item>
    <list-item>
      <p>verzeichnete
      <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>:
      Titel, Autor*innen (Geburts- und Sterbedaten, weitere biografische
      Angaben, weitere Publikationen, Preise, Links), Sprache,
      Herausgeber, Ort, Verlag, Audioproduktionsdaten, teilweise
      ISBN-Nummer, Übersetzungen in verschiedene Sprachen</p>
    </list-item>
    <list-item>
      <p>Schwerpunkte: internationale Lyrik in Schrift und Ton
      (Originalsprache und ausgewählte Übersetzungen), teilweise auch
      mit Videos</p>
    </list-item>
  </list>
</sec>
<sec id="anwendungsbeispiel">
  <title>2. Anwendungsbeispiel</title>
  <p>Sie wollen ein thematisches
  <xref alt="Korpus" rid="glossary-korpus">Korpus</xref>
  zusammenstellen, das Gedichte enthält, die sich dem Thema Tiere
  widmen. Mit einem Klick liefert Lyrikline Ihnen 358 Gedichte in
  unterschiedlichen Sprachen zu diesem Thema, die Sie mit zwei weiteren
  Klicks auf 144 deutschsprachige und 125 aus Deutschland stammende
  Gedichte reduzieren können. Sämtliche Gedichte können Sie nicht nur
  lesen, sondern auch anhören (häufig von den Autor*innen selbst
  vorgetragen). Zudem werden Ihnen zu etlichen Gedichten diverse
  Übersetzungen angeboten.</p>
  <fig>
    <caption><p>Abb. 2: Filteroptionen für die Gedichte auf
    Lyrikline</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Lyrikline-Themenfilter-p.png" />
  </fig>
</sec>
<sec id="diskussion">
  <title>3. Diskussion</title>
  <sec id="kann-ich-lyrikline-für-wissenschaftliche-arbeiten-nutzen">
    <title>3.1 Kann ich Lyrikline für wissenschaftliche Arbeiten
    nutzen?<break/></title>
    <p>Ja, das unter der deutschen UNESCO-Kommission stehende Projekt
    wird als „exzellente Form einer zeitgemäßen, grenzüberschreitenden
    Kulturarbeit“ bezeichnet und wurde u. a. 2005 mit dem
    Grimme-Online-Award in der Sparte „Kultur und Unterhaltung“
    ausgezeichnet. Die „verlässliche Plattform“ wird für ihre Sorgfalt
    gerühmt
    (<xref alt="Braun 2009" rid="ref-braunLyriklineOrgInternationale2009" ref-type="bibr">Braun
    2009</xref>). Die Auswahl und Bereitstellung der Gedichte sowie
    Übersetzungen obliegt den oben genannten Verbundspartnerschaften der
    jeweiligen Länder, wobei für die Kuratierung Expert*innen für
    aktuelle Poesie eingesetzt werden und auch für die Übersetzungen auf
    renommierte Lyrikübersetzer*innen zurückgegriffen wird, um
    Qualitätsstandards sicherzustellen. Das Projekt vereinheitlicht
    zudem die Audioaufnahmen in technischer Hinsicht, um eine
    einheitlich hohe Qualität und Vergleichbarkeit zu gewährleisten.
    Jedes zur Verfügung gestellte Gedicht ist vollständig, Lyrikline
    verfolgt jedoch nicht den Anspruch, sämtliche Texte der vertretenen
    Autor*innen zu verzeichnen. Für Gedichte, bei denen dies wichtig ist
    (wie beispielsweise der visuellen Poesie), wird ebenfalls eine
    dokumentnahe Nachempfindung des originalen Seitenlayouts angestrebt,
    um die Gedichte in ihrer Flächigkeit rezipieren zu können.</p>
    <p>Die Quelle des jeweiligen Gedichtes ist angegeben, allerdings
    fehlen hierbei die Seitenangaben, sodass eine genaue Zitation für
    eine wissenschaftliche Arbeit einer weiteren Recherche in der
    jeweils angegebenen Ausgabe bedarf. Lyrikline bietet außerdem keine
    Downloadfunktionen (etwa in unterschiedlichen Dateiformaten) an,
    sodass die Texte nur per copy &amp; paste (als Reintext (vgl.
    <xref alt="Reintext-Version" rid="glossary-reintext-version">Reintext-Version</xref>)
    ohne Metadaten) gespeichert werden können.</p>
    <p>Hervorzuheben ist die Kooperation von Lyrikline mit dem von der
    Volkswagenstiftung geförderten
    <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.geisteswissenschaften.fu-berlin.de/v/rhythmicalizer/">Rhythmicalizer-Projekt</ext-link>
    der Freien Universität Berlin. Das Projekt hat - auf Grundlage der
    amerikanischen Theorien der freien Versprosodie – die in Lyrikline
    enthaltenen deutsch- und englischsprachigen Audioaufnahmen verwendet
    und eine Methode zur digitalen Erkennung von Prosodie entwickelt.
    Die auf der Projektseite besprochenen
    <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.geisteswissenschaften.fu-berlin.de/v/rhythmicalizer/Muster/index.html">Muster</ext-link>
    verweisen bereits auf Beispieltexte aus dem Lyrikline-Korpus. Auf
    Lyrikline selbst finden sich die Projektergebnisse insbesondere in
    Form der Filtermöglichkeiten implementiert.</p>
  </sec>
  <sec id="wie-benutzerfreundlich-ist-die-arbeit-mit-lyrikline">
    <title>3.2 Wie benutzerfreundlich ist die Arbeit mit
    Lyrikline?<break/></title>
    <p>Lyrikline ist sehr benutzerfreundlich gestaltet und die Inhalte
    sind frei zugänglich. Die zahlreichen Such- und Filteroptionen (vgl.
    <xref alt="Query" rid="glossary-query">Query</xref>) sind
    übersichtlich, intuitiv bedienbar und beschleunigen die Textsuche
    erheblich. Unter der jeweiligen Gedichtüberschrift gibt es immer ein
    Pull-down-Menü, das weitere Gedichte der jeweiligen Person
    verzeichnet. Eine kurze Autor*innenbiografie wird immer rechts neben
    dem Gedicht angezeigt. Die rechte Spalte der Startseite verzeichnet
    aktuelle Meldungen wie ausgewählte Autor*innengeburtstage des
    jeweiligen Tages, diverse von Mitgliedern erstellte sog.
    „Playlists“, den Push-Button, der Ihnen ein Zufallsgedicht anzeigt,
    ein ausgewähltes Gedicht, das man direkt in der Sidebar anhören
    kann, die Möglichkeit, der Lyrikline Community beizutreten, und
    diverse Blogeinträge. Ein Handbuch zu Lyrikline ist nicht vorhanden,
    die gesamte Seite ist neben Deutsch jedoch in acht weiteren Sprachen
    einsehbar, die per Klick in der oberen Zeile ausgewählt werden
    können.</p>
    <fig>
      <caption><p>Abb. 3: Ansicht eines Gedichtes und der
      Autorinnenseite von Uljana Wolf auf Lyrikline</p></caption>
      <graphic mimetype="image" mime-subtype="png" xlink:href="Lyrikline-Gedicht-und-Autorin-p.png" />
    </fig>
    <p>Es werden zudem weitere Ressourcen zur Verfügung gestellt, die in
    Zukunft noch ausgebaut werden: So finden sich über die Startseite
    erreichbar z. B. „Poetische Handreichungen zu zeitgenössischer
    Lyrik“, in denen derzeit für drei ausgewählte Gedichte didaktische
    Handreichungen für die Vermittlung von Lyrik im (Schul-)Unterricht
    bereitgestellt werden. Außerdem gibt es Videoportraits zu
    ausgewählten Dichter*innen und eine Sammlung an verfilmten
    Gedichten.</p>
  </sec>
</sec>
<sec id="wie-funktioniert-die-textsuche-in-lyrikline">
  <title>4. Wie funktioniert die Textsuche in Lyrikline?</title>
  <p>Gedichte können direkt auf der Startseite nach Autor*innen
  (alphabetisch, nach Sprachen, nach Ländern) oder nach Gedichten (nach
  Sprachen, Übersetzungen, Genres &amp; Eigenschaften, Formen &amp;
  Begriffen, Themen [mit diversen Unterkategorien] sowie rhythmischen
  Mustern) gefiltert werden (siehe Abb. 2). Zudem verzeichnet der Reiter
  „NEU“ jüngst hinzugefügte Gedichte, Autor*innen und Übersetzungen.
  Eine Eingabe im Suchfeld oben rechts auf der Startseite zeigt
  unmittelbar die Ergebnisse nach verschiedenen Kategorien gegliedert an
  (s. Abb. 4).</p>
  <fig>
    <caption><p>Abb. 4: Freitextsuche auf Lyrikline</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Lyrikline-Suche-p.png" />
  </fig>
  <list list-type="bullet">
    <list-item>
      <p>Haus für Poesie Berlin:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.haus-fuer-poesie.org/de/literaturwerkstatt-berlin/home/">https://web.archive.org/save/https://www.haus-fuer-poesie.org/de/literaturwerkstatt-berlin/home/</ext-link>
      (Letzter Zugriff: 04.06.2024)</p>
    </list-item>
    <list-item>
      <p>Lyrikline:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.lyrikline.org/de/about/">https://web.archive.org/save/https://www.lyrikline.org/de/about/</ext-link>
      (Letzter Zugriff: 04.06.2024)</p>
    </list-item>
    <list-item>
      <p>Partner Lyrikline:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.lyrikline.org/de/partner/">https://web.archive.org/save/https://www.lyrikline.org/de/partner/</ext-link>
      (Letzter Zugriff: 04.06.2024)</p>
    </list-item>
    <list-item>
      <p>Rhythmicalizer-Projekt:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.geisteswissenschaften.fu-berlin.de/v/rhythmicalizer/">https://web.archive.org/save/https://www.geisteswissenschaften.fu-berlin.de/v/rhythmicalizer/</ext-link>
      (Letzter Zugriff: 04.06.2024)</p>
    </list-item>
    <list-item>
      <p>Muster Rhythmicalizer-Projekt:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.geisteswissenschaften.fu-berlin.de/v/rhythmicalizer/Muster/index.html">https://web.archive.org/save/https://www.geisteswissenschaften.fu-berlin.de/v/rhythmicalizer/Muster/index.html</ext-link>
      (Letzter Zugriff: 04.06.2024)</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-csv">CSV</styled-content></term>
      <def>
        <p>CSV ist die englische Abkürzung für <italic>Comma Separated
        Values</italic>. Es handelt sich um ein Dateiformat zur
        einheitlichen Darstellung und Speicherung von einfach
        strukturierten Daten mit dem Kürzel <monospace>.csv</monospace>
        , sodass diese problemlos zwischen IT-Systemen ausgetauscht
        werden können. Dabei sind alle Daten zeilenweise angeordnet.
        Alle Zeilen wiederum sind in einzelne Datenfelder aufgeteilt,
        welche durch Trennzeichen wie Semikola oder Kommata getrennt
        werden können. In Programmen wie Excel können solche Textdateien
        als Tabelle angezeigt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-korpus">Korpus</styled-content></term>
      <def>
        <p>Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural
        für „das Korpus“) sind typischerweise nach Textsorte, Epoche,
        Sprache oder Autor*in zusammengestellt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z.B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-open-access">Open
      Access</styled-content></term>
      <def>
        <p>Open Access bezeichnet den freien Zugang zu
        wissenschaftlicher Literatur und anderen Materialien im
        Internet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic> , oder
        „Wortart“ auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-query">Query</styled-content></term>
      <def>
        <p><italic>Query</italic> bedeutet „Abfrage“ oder „Frage“ und
        bezeichnet eine computergestützte Abfrage zur Analyse eines
        Textes. Um Datenbestände zu durchsuchen, werden Abfragesprachen
        eingesetzt, die <italic>Queries</italic> (Anfragen) an den
        Datenbestand senden. So bilden alle möglichen Queries zusammen
        die <italic>Query Language</italic> eines Tools.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-reintext-version">Reintext-Version</styled-content></term>
      <def>
        <p>Die Reintext-Version ist die Version eines digitalen Textes
        oder einer Tabelle, in der keinerlei Formatierungen
        (Kursivierung, Metadatenauszeichnung etc.) enthalten sind.
        Reintext-Formate sind beispielsweise TXT, RTF und
        <xref alt="CSV" rid="glossary-csv">CSV</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-braunLyriklineOrgInternationale2009">
    <mixed-citation>Braun, Michael. 2009. Lyrikline.org. Internationale
    der Dichter. <italic>Tagesspiegel online</italic>.
    <ext-link ext-link-type="uri" xlink:href="https://www.tagesspiegel.de/kultur/literatur/lyrikline-org-internationale-der-dichter/1621806.html">https://www.tagesspiegel.de/kultur/literatur/lyrikline-org-internationale-der-dichter/1621806.html</ext-link>
    (zugegriffen: 17. Juli 2019).</mixed-citation>
  </ref>
  <ref id="ref-brendelHierSprichtDichter2009">
    <mixed-citation>Brendel, Gerd. 2009. Hier spricht der Dichter. Das
    Portal ,Lyrikline.org’ feiert zehnjähriges Bestehen.
    <italic>Deutschlandfunk Kultur</italic>.
    <ext-link ext-link-type="uri" xlink:href="https://www.deutschlandfunkkultur.de/hier-spricht-der-dichter.1013.de.html?dram:article_id=169718">https://www.deutschlandfunkkultur.de/hier-spricht-der-dichter.1013.de.html?dram:article_id=169718</ext-link>
    (zugegriffen: 17. Juli 2019).</mixed-citation>
  </ref>
  <ref id="ref-hardickGedichtRhytmikDichtungUnd2017">
    <mixed-citation>Hardick, Stefanie. 2017. Gedicht-Rhytmik. Dichtung
    und Daten. <italic>Tagesspiegel online</italic>.
    <ext-link ext-link-type="uri" xlink:href="https://www.tagesspiegel.de/themen/freie-universitaet-berlin/gedicht-rhytmik-dichtung-und-daten/19626986.html">https://www.tagesspiegel.de/themen/freie-universitaet-berlin/gedicht-rhytmik-dichtung-und-daten/19626986.html</ext-link>
    (zugegriffen: 17. Juli 2019).</mixed-citation>
  </ref>
  <ref id="ref-seidelPoesie58Sprachen2013">
    <mixed-citation>Seidel, Änne. 2013. Poesie in 58 Sprachen. Relaunch
    der Gedichte-Datenbank ,Lyrikline’.
    <italic>Deutschlandfunk</italic>.
    <ext-link ext-link-type="uri" xlink:href="https://www.deutschlandfunk.de/poesie-in-58-sprachen.691.de.html?dram:article_id=260013">https://www.deutschlandfunk.de/poesie-in-58-sprachen.691.de.html?dram:article_id=260013</ext-link>
    (zugegriffen: 17. Juli 2019).</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
