<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3798</article-id>
<title-group>
<article-title>Lerneinheit: Sentimentanalyse mit
SentText</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0002-1707-284X</contrib-id>
<name>
<surname>Flüh</surname>
<given-names>Marie</given-names>
</name>
<email>marie.flueh@uni-hamburg.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Hamburg</institution>
</institution-wrap>
</aff>
</contrib-group>
<pub-date date-type="pub" publication-format="electronic" iso-8601-date="2024-07-10">
<day>10</day>
<month>7</month>
<year>2024</year>
</pub-date>
<volume>1</volume>
<issue>7</issue>
<issue-title>Sentimentanalyse</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 29.06.2020 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/lerneinheiten/sentimentanalyse-mit-senttext-1">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2020-06-29">
<day>29</day>
<month>06</month>
<year>2020</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 29.06.2020 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/lerneinheiten/sentimentanalyse-mit-senttext-1">fortext.net</ext-link></p>
<sec id="eckdaten-der-lerneinheit">
  <title>Eckdaten der Lerneinheit</title>
  <list list-type="bullet">
    <list-item>
      <p>Anwendungsbezug: Lexikonbasierte Sentimentanalyse bedeutender
      griechischer Dramen (<italic>Der gefesselte Prometheus</italic>
      von Aischylos, <italic>Die Wolken</italic> von Aristophanes,
      <italic>Medea</italic> von Euripides), Epen
      (<italic>Odyssee</italic> und <italic>Ilias</italic> von Homer,
      <italic>Theogonia</italic> von Hesiodos) und Lyrik (<italic>Der
      goldene Esel</italic> von Apuleius, <italic>Metamorphosen</italic>
      von Ovid, <italic>Auf die Liebe</italic> von Anakreon)</p>
    </list-item>
    <list-item>
      <p>Methodik: Lexikonbasierte Sentimentanalyse</p>
    </list-item>
    <list-item>
      <p>Angewendetes Tool: SentText</p>
    </list-item>
    <list-item>
      <p>Lernziele: Zentrale Schritte der Korpuskonstituierung umsetzen,
      Hochladen der Texte und Kennenlernen der Analyseparameter, Analyse
      einzelner Texte und Interpretation der Analyseergebnisse,
      vergleichende Analyse der Homerischen Epen und Interpretation der
      Analyseergebnisse, manuelle Korrektur der Sentimentwerte (vgl.
      <xref alt="Sentimentwert" rid="glossary-sentimentwert">Sentimentwert</xref>),
      gattungstypologische Korpuskonstituierung, vergleichende
      Sentimentanalyse der drei Teilkorpora</p>
    </list-item>
    <list-item>
      <p>Dauer der Lerneinheit: 90 Minuten</p>
    </list-item>
    <list-item>
      <p>Schwierigkeitsgrad des Tools: einfach</p>
    </list-item>
  </list>
</sec>
<sec id="bausteine">
  <title>Bausteine</title>
  <list list-type="bullet">
    <list-item>
      <p>Anwendungsbeispiel: In welcher textuellen Gestalt erscheinen
      Empfindungen in Homers <italic>Ilias</italic> und welche Stimmung
      bestimmt die <italic>Odyssee</italic>? Welche Stimmungen bestimmen
      unterschiedliche Werke der griechischen Antike – und lassen sich
      gattungstypologische Differenzen ausmachen? Führen Sie eine
      lexikonbasierte Sentimentanalyse
      (<xref alt="Flüh 2024a" rid="ref-fluhMethodenbeitragSentimentanalyse2019" ref-type="bibr">Flüh
      2024a</xref>) durch, bestimmen Sie den Sentimentgehalt (vgl.
      <xref alt="Sentimentwert" rid="glossary-sentimentwert">Sentimentwert</xref>)
      eines eigens erstellten Antike-Korpus und entwickeln Sie aus Ihren
      Analyseergebnissen bzw. -visualisierungen erste
      Interpretationshypothesen.</p>
    </list-item>
    <list-item>
      <p>Vorarbeiten: Wie gelangen Sie an Ihre Textbeispiele? Erfahren
      Sie, welche digitalen Repositorien Primärtexte für digitale
      Textanalysen zur Verfügung stellen und wie Sie die Texte
      herunterladen können.</p>
    </list-item>
    <list-item>
      <p>Funktionen: Welche Funktionen bietet Ihnen SentText
      (<xref alt="Flüh 2024b" rid="ref-fluhToolbeitragSentText2020" ref-type="bibr">Flüh
      2024b</xref>)? Lernen Sie die unterschiedlichen Module sowie deren
      Funktionen kennen und führen Sie eine Sentimentanalyse durch.</p>
    </list-item>
    <list-item>
      <p>Lösungen zu den Beispielaufgaben: Haben Sie die
      Beispielaufgaben richtig gelöst? Hier finden Sie Antworten.</p>
    </list-item>
  </list>
</sec>
<sec id="anwendungsbeispiel">
  <title>1. Anwendungsbeispiel</title>
  <p>In dieser Lerneinheit werden Sie anhand unterschiedlicher
  Schriftzeugnisse der griechischen Antike die wichtigsten Elemente
  einer lexikonbasierten Sentimentanalyse
  (<xref alt="Flüh 2024a" rid="ref-fluhMethodenbeitragSentimentanalyse2019" ref-type="bibr">Flüh
  2024a</xref>) kennenlernen. Die Analyse zielt darauf ab,
  herauszufinden, welche Terminologie für die Beschreibung von
  Stimmungen (vgl.
  <xref alt="Opinion Mininig" rid="glossary-opinion-mining">Opinion
  Mininig</xref>) in literarischen Texten unterschiedlicher Gattungen
  verwendet wird und welche Gefühlslagen die Erzählwelten bestimmen. Um
  unterschiedliche Analyseperspektiven auf sentimentbezogene
  Textmerkmale in dramatischen, epischen und lyrischen Texten der
  griechischen Antike werfen zu können, nutzen Sie das Textanalyetool
  SentText.
  Als Textgrundlage dienen mehrere der wohl frühesten und bedeutendsten
  Epen, Dramen und Dichtungen der Weltliteratur, deren Wirkung bis in
  die Gegenwart reicht. Vor allem die Homerischen Epen gelten als
  Urquell der griechischen, römischen, byzantinischen und europäischen
  Kultur, deren Einfluss sich noch heute in der Denkweise der westlichen
  Welt widerspiegelt; Homers Werke bestimmen – mal mehr, mal weniger
  subtil – europäische Dichtung, Malerei, bildende Kunst und Literatur
  sowie Theater und Film
  (<xref alt="Latacz 2014" rid="ref-lataczHomersIliasStudien2014" ref-type="bibr">Latacz
  2014</xref>). Gleichermaßen zählen die dramatischen Werke Aischylos’,
  Aristophanes’ und Euripides’ sowie die Gedichte Apuleius’, Ovids und
  Anakreons bis heute zu prägenden Werken der Literaturgeschichte.
  Aufgrund dieser Tiefenwirkung finden sich deutschsprachige
  Übersetzungen aller genannten sowie diverser weiterer Autoren der
  griechischen Antike im ansonsten auf die Langzeitarchivierung originär
  deutsprachiger Literatur ausgerichteten
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://textgridrep.org/">Textgrid
  Repository</ext-link>.
  Diese Lerneinheit befähigt Sie zum adäquaten Einsatz von SentText. Sie
  behandelt grundlegende Fragestellungen der literaturwissenschaftlich
  ausgerichteten Sentimentanalyse. Darauf aufbauend können Sie eigenen
  Forschungsfragen nachgehen und die im Rahmen der Analyse
  herausgefilterten emotionsbezogenen Signalwörter (vgl.
  <xref alt="SBW" rid="glossary-sbw">SBW</xref>) bspw. als Grundlage für
  eine Emotionsanalyse heranziehen.</p>
</sec>
<sec id="vorarbeiten">
  <title>2. Vorarbeiten</title>
  <p>Um die Methode kennenzulernen, der sich diese Lerneinheit widmet,
  lesen Sie zunächst den Methodeneintrag über Sentimentanalyse
  (<xref alt="Flüh 2024a" rid="ref-fluhMethodenbeitragSentimentanalyse2019" ref-type="bibr">Flüh
  2024a</xref>). Lesen Sie hier
  (<xref alt="Flüh 2024b" rid="ref-fluhToolbeitragSentText2020" ref-type="bibr">Flüh
  2024b</xref>) im Anschluss die Besprechung des Textanalysetools
  SentText und machen sich auf diese Weise mit den wichtigsten
  Funktionen des Analysewerkzeugs vertraut. Die Korpusbildung
  (<xref alt="Bläß 2024" rid="ref-blassMethodenbeitragKorpusbildung2020" ref-type="bibr">Bläß
  2024</xref>) markiert neben der Herausbildung einer Forschungsfrage
  die Anfangsphase eines literaturwissenschaftlichen Projekts. In einem
  ersten Schritt erstellen wir also ein Antike-Korpus, welches Texte
  aller genannten Autoren beinhaltet.
  Laden Sie sich die digitale Version der <italic>Ilias</italic> und der
  <italic>Odyssee</italic> herunter, indem Sie das
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://textgridrep.org/">Textgrid
  Repository</ext-link> aufrufen und dort eine Suchabfrage nach
  sämtlichen im Langzeitarchiv enthaltenen Texten Homers durchführen.
  Wählen Sie hierfür neben dem Eingabefeld für Suchabfragen am oberen
  rechten Bildschirmrand die Filterfunktion „Inhalte“ und dann „…nach
  Autor“ aus. Nun wird eine Liste aller im Repositorium enthaltener
  Autor*innen generiert. Scrollen Sie bis zu „Homer“, sehen Sie, dass
  das Archiv sechs seiner Werke beinhaltet. Um zu sehen, um welche Werke
  es sich handelt, klicken Sie auf „Homer“ (vgl. Abb. 1).</p>
  <fig>
    <caption><p>Abb. 1: Von der Suchabfrage bis zum
    Suchergebnis</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Download_im_TextGrid_Repository_pap_0.png" />
  </fig>
  <p>SentText arbeitet ausschließlich mit Dateien im TXT- und XML-Format
  (vgl. <xref alt="XML" rid="glossary-xml">XML</xref>;
  <xref alt="Reintext-Version" rid="glossary-reintext-version">Reintext-Version</xref>).
  Am linken Bildschirmrand können Sie unter der Kategorie „Dateityp“
  Ihre Suchabfrage weiter ausdifferenzieren. Klicken Sie in diesem
  Bereich auf „text/xml“ (vgl. Abb. 2).</p>
  <fig>
    <caption><p>Abb. 2: Auswahl der Filterfunktion „Dateityp“ im
    TextGrid Repository</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Filterfunktion_Dateityp_pap_0.png" />
  </fig>
  <p>Jetzt erscheinen in der Listenansicht ausschließlich Dateien, deren
  Formate dem für unsere Analyse benötigten Typus entsprechen. An oberer
  Position der Liste wird bereits die <italic>Odyssee</italic>
  angeführt. Klicken Sie in dieser Kachel als nächstes auf den
  „Herunterladen“-Button. Nun öffnet sich ein neues Browserfenster, in
  dem die <italic>Odyssee</italic> im XML-Format angezeigt wird (vgl.
  Abb. 3). Wenn Sie etwas nach unten scrollen, wird deutlich, dass sich
  hinter allen – hier lilafarbenen – Programmierbefehlen
  unterschiedliche Textelemente verbergen.</p>
  <fig>
    <caption><p>Abb. 3: Download der Odyssee im XML-Format</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Download_der_XML-Datei.png" />
  </fig>
  <p>Um die Datei auf Ihrem PC zu speichern, klicken Sie am obersten
  Bildschirmrand in die Menüleiste Ihres Computers und wählen unter dem
  Reiter „Datei“ die Option „Seite speichern unter…“ aus (vgl. Abb. 4).
  Legen Sie in dem „Sichern unter“-Textfeld einen aussagekräftigen Namen
  für die Datei fest (Autor_Titel) und speichern diese auf Ihrem Desktop
  ab, indem Sie Ihre Auswahl per Klick auf „Sichern“ bestätigen (vgl.
  Abb. 4).</p>
  <fig>
    <caption><p>Abb. 4: Speichern der XML-Datei</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="XML_Datei_speichern_pap.png" />
  </fig>
  <p>Dieserart verfahren Sie auch mit der <italic>Ilias</italic>: Per
  Mausklick auf das Pfeilsymbol im oberen linken Bildschirmbereich
  kehren Sie von der XML-Ansicht der <italic>Odyssee</italic> in den
  Auswahlbereich des Textarchivs zurück. Direkt unter der soeben
  heruntergeladenen <italic>Odyssee</italic> finden Sie eine digitale
  Variante der <italic>Ilias</italic> im XML-Format. Wählen Sie nun in
  der <italic>Ilias</italic>-Kachel den „Herunterladen“-Button aus und
  speichern das XML-Dokument über die Menüleiste Ihres Computers.
  Sollten Sie einen anderen Browser verwenden, kann der Downloadprozess
  leicht variieren. Bei Microsoft Edge klicken Sie zuerst auf „Odyssee“,
  wählen in der linken Spalte unter „Herunterladen“ aus den
  aufgelisteten Dateitypen „plain text (txt)“ oder „Metadateien (xml)“
  aus und laden die Datei mit einem Rechtsklick unter „Ziel speichern
  unter…“ herunter. Falls Sie mit Google Chrome arbeiten, öffnet sich
  das Fenster mit der txt- oder xml-Datei automatisch, anschließend
  können Sie den Text per Rechtsklick auf „Speichern unter…“ als
  xml-Datei speichern. Kehren Sie nun auf die Startseite des
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://textgridrep.org/">TextGrid
  Repository</ext-link> zurück und laden auf die gleiche Weise (1.
  Alphabetisch geordnete Autorenliste aufrufen; 2. Autorenname
  auswählen; 3. Auswahl der Filterfunktion text/xml; 4. Herunterladen
  der XML-Datei; 5. Speichern auf dem Desktop) auch die übrigen der
  folgenden Texte herunter (vgl. Abb. 5):</p>
  <fig>
    <caption><p>Abb. 5: Bestandteile des Antike-Korpus</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Antike_Korpus_pap_0.png" />
  </fig>
  <p>Nun haben Sie die Bestandteile des Antike-Korpus im XML-Format auf
  Ihrem Desktop gespeichert und sind bereit für die Sentimentanalyse mit
  SentText. Das Tool arbeitet webbasiert und ohne Account-Pflicht.
  Folgen Sie
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://thomasschmidtur.pythonanywhere.com/">diesem
  Link</ext-link>, um auf die Startseite zu gelangen. Nun befinden Sie
  sich im „ABOUT“-Bereich, wo Tool und Funktionsweisen kurz vorgestellt
  werden. Lesen Sie die Einführung und kopieren im Anschluss probeweise
  die ersten Sätze des ersten Gesanges der <italic>Odyssee</italic> in
  das Demo-Feld:</p>
  <p>„Sage mir, Muse, die Taten des vielgewanderten Mannes,
  Welcher so weit geirrt nach der heiligen Troja Zerstörung,
  Vieler Menschen Städte gesehn und Sitte gelernt hat […].“</p>
  <p><bold><italic>Aufgabe 1</italic></bold>: Welche Wörter werden rot
  markiert, welche Wörter werden blau markiert und welche Stimmung
  assoziieren Sie mit den farblich hervorgehobenen Begriffen? Welches
  Wort scheint Ihnen eine besonders positive Gefühlslage zu
  repräsentieren und welches ist negativ konnotiert? Bringen Sie die
  Wörter – absteigend von positiv zu negativ konnotierten Wörtern – in
  eine Reihenfolge.</p>
  <p><bold><italic>Aufgabe 2</italic></bold>: Die Demoversion greift auf
  das Sentimentwörterbuch <italic>SentimentWortschatz</italic>
  (<italic>SentiWS</italic>) zurück. „heiligen“ hat hier einen
  Sentimentwert von 0.0727, der Sentimentwert von „gelernt“ beträgt
  0.2492. „Zerstörung“ hat einen Sentimentwert von –0.3578. Passen die
  errechneten Sentimentwerte zu Ihrer persönlichen Reihenfolge?</p>
  <p>In den Aufgaben 1 und 2 haben Sie die Grundlagen der
  lexikonbasierten Sentimentanalyse in sehr reduzierter Form
  kennengelernt: Der Computer vergleicht Textdaten – den ersten Gesang
  der <italic>Odyssee</italic> – und
  <xref alt="Sentimentwörterbuch" rid="glossary-sentimentwoerterbuch">Sentimentwörterbuch</xref>
  – <italic>SentiWS </italic>– miteinander und legt für die Schnittmenge
  (sämtliche im Text und im Wörterbuch enthaltenen Wörter) die Polarität
  (Verortung auf einer Skala von positiv bis negativ) und den
  <xref alt="Sentimentwert" rid="glossary-sentimentwert">Sentimentwert</xref>
  fest. Zurück zu SentText! Die Startseite setzt sich aus drei Sparten
  zusammen. Unter „DOCUMENTATION“ finden Sie wichtige Informationen über
  verschiedene Parameter, die bei der Analyse berücksichtigt werden.
  Nehmen Sie sich einen Augenblick Zeit, um die unterschiedlichen
  Einflussgrößen zu begutachten und behalten Sie diese im Hinterkopf;
  sie bestimmen die Analyseergebnisse und -visualisierungen und
  beeinflussen dadurch schlussendlich auch Ihre Interpretation.
  Klicken Sie nun auf den mittleren Reiter „SENTIMENT ANALYSIS“. Jetzt
  befinden Sie sich in dem Bereich, in dem Sie Ihre Texte hochladen und
  den Analyseprozess in Gang setzen (vgl. Abb. 6).</p>
  <fig>
    <caption><p>Abb. 6: Uploadbereich bei SentText: 1) Dateien auswählen
    und hochladen (obligatorisch); 2) Analysegrundlage festlegen
    (obligatorisch); 3) Analyseparameter anpassen (fakultativ); 4)
    Verarbeitung von XML-Dateien spezifizieren (fakultativ): Dateien im
    XML-Format sind deutlich umfangreicher aufgebaut als Dateien im
    TXT-Format. Sie wurden oft bereits bearbeitet und enthalten
    entsprechende Zusätze wie die Speicherung des Lemmas als Attribut.
    Ob diese Eigenschaften beim Import beibehalten werden sollen
    (höherer Rechenaufwand) oder nicht, steht Ihnen frei</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Interface_Uploadbereich_pap_0.png" />
  </fig>
  <p>Klicken Sie zunächst im Upload-Bereich auf „Durchsuchen…“ (vgl.
  Abb. 6, Punkt 1). Navigieren Sie zu Ihrem Desktop, wo Sie die neun
  XML-Dateien abgelegt haben. Aktivieren Sie die Strg- oder Ctrl-Taste
  und halten Sie diese gedrückt, während Sie per Mausklick alle neun
  Textdateien für die Analyse auswählen. Bestätigen Sie Ihre Auswahl via
  Mausklick auf „Öffnen“ (vgl. Abb. 7).</p>
  <fig>
    <caption><p>Abb. 7: Upload der Texte in drei Schritten: Auswahl
    beider Dateien bei gedrückter Ctrl-/Strg-Taste, bestätigen der
    Auswahl, Anzeige der Dateien im Sentimentanalysetool
    SentText</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Sentimentanalyse_Upload_Antike_Korpus_pap.png" />
  </fig>
  <p>Wie Sie sehen, zeigt SentText nun die Anzahl der für die Analyse
  ausgewählten Dateien an. Rechts neben dem Upload-Bereich können Sie
  festlegen, auf welches Sentimentwörterbuch das Tool bei der Analyse
  zurückgreifen soll (vgl. Abb. 6, Punkt 2). Zur Auswahl stehen
  <italic>SentiWS</italic> der Universität Leipzig und die
  <italic>Berlin Affective Wordlist – Reloaded</italic> der Freien
  Universität Berlin. Darüber hinaus können Sie in diesem Bereich ein
  eigenes Wörterbuch einspeisen. Hierbei handelt es sich um ein
  wichtiges <xref alt="Feature" rid="glossary-feature">Feature</xref>,
  da sich auf diese Weise bspw. historisch gewachsene orthographische
  Besonderheiten in die Analyse einbeziehen lassen. In dieser
  Lerneinheit greifen wir zunächst auf <italic>SentiWS</italic> zurück,
  welches sich als verlässliche Grundlage für lexikonbasierte
  Sentimentanalysen literarischer Texte erwiesen hat
  (<xref alt="Schmidt und Burghardt 2018, 144" rid="ref-schmidtEvaluationLexiconbasedSentiment2018" ref-type="bibr">Schmidt
  und Burghardt 2018, 144</xref> f.). Sie behalten die Voreinstellungen
  (vgl. <xref alt="Default" rid="glossary-default">Default</xref>) also
  bei. Klicken Sie nun auf den „More options (advanced user)“-Button
  (vgl. Abb. 7, Punkt 3). Hier sehen Sie unterschiedliche Einstellungen,
  mit denen Sie die Analyse in Zukunft anpassen können. In diesem
  Bereich können Sie u. a. die
  <xref alt="Stoppwortliste" rid="glossary-stoppwortliste">Stoppwortliste</xref>
  erweitern und auf diese Weise für die Analyse irrelevante Wörter
  ausschließen (bspw. Regieanweisungen, Auftritte, Abgänge oder andere
  Elemente des Nebentextes in Dramen). Für den ersten Durchlauf der
  Analyse greifen Sie auf die bereits aktivierten Voreinstellungen
  zurück. Starten Sie nun per Klick auf „ANALYZE!“ die Sentimentanalyse.
  Die Analyse aller Dateien dauert nur einen kurzen Moment (vgl. Abb.
  8). Sollten Sie Dateien größeren Umfangs hochladen oder andere
  Analyseparameter auswählen, kann dieser Arbeitsprozess mehr Zeit in
  Anspruch nehmen.</p>
  <fig>
    <caption><p>Abb. 8: Analyse des Antike-Korpus binnen weniger
    Sekunden</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Uploadprozess_pap_0.png" />
  </fig>
</sec>
<sec id="funktionen">
  <title>3. Funktionen</title>
  <p>Im folgenden Teil lernen Sie die unterschiedlichen Module und deren
  Funktionen exemplarisch kennen. Wie Sie nun auf Ihrem Bildschirm
  sehen, besteht das Interface von SentText aus vier Panels oder Modulen
  (vgl. Abb. 9).</p>
  <fig>
    <caption><p>Abb. 9: Vier Panels in SentText; hier nicht sichtbar:
    das „Compare“-Panel</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Interface_TextSent_pap.png" />
  </fig>
  <p>Im linksseitig angeordneten Info-Panel werden die Analyseparameter
  angezeigt. Im Gegensatz zu den drei übrigen Modulen erfüllt das
  Info-Panel ausschließlich eine Orientierung stiftende Funktion und ist
  nicht klickbar. Die Parameter der Analyse – also die variablen
  Rahmenbedingungen, unter denen sie durchgeführt wird – sollten Sie bei
  der Interpretation der Ergebnisse stets berücksichtigen bzw.
  transparent machen, um die Nachvollziehbarkeit Ihrer Ergebnisse zu
  gewährleisten. Im oberen Bereich des Panels können Sie per Mausklick
  auf „NEW SENTIMENT ANALYSIS“ eine neue Analyse mit anderen
  Grundeinstellungen starten. Achtung: Die Daten der aktuellen Analyse
  gehen dadurch verloren. Das Corpus-Panel – der Bereich unter „Overview
  and grouping of submitted files“ – dient der (Re)Organisation
  einzelner Textdateien zu Textkorpora und ermöglicht eine vergleichende
  Analyse mehrerer Textkorpora, die in separaten Ordnern angelegt
  werden. Im Visualize-Panel („Visualization of submitted data“) werden
  die Analyseergebnisse des im Corpus-Panel ausgewählten Dokuments in
  unterschiedliche Diagramme übersetzt (in diesem Fall Aischylos’
  <italic>Der gefesselte Prometheus</italic>, der der alphabetischen
  Anordnung aller hochgeladenen Dateien folgend am Anfang steht). Wählen
  Sie im Corpus-Panel einen anderen Text aus, erscheinen die
  entsprechenden Analyseergebnisse im Visualize-Panel. Hinter den ovalen
  blauen Schaltflächen im Visualize-Panel verbergen sich interaktive
  Diagramme, die verschiedene Analyseperspektiven auf den ausgewählten
  Text ermöglichen. Per Mausklick auf den gewünschten Diagrammtyp öffnet
  sich die Visualisierung. Sobald Sie im Corpus-Panel einen anderen Text
  auswählen, reagiert auch das Visualize-Panel mit der Anzeige der
  entsprechenden Visualisierungen und das Text-Panel mit der Anzeige des
  jeweiligen Textes. Im Text-Panel („Evaluation and correction of
  submitted data“) sehen Sie die hochgeladenen XML-Dateien als Reintext,
  Sentiment-tragende Wörter (vgl.
  <xref alt="SBW" rid="glossary-sbw">SBW</xref>) sind wie in der
  Demoversion ihrer Valenz entsprechend blau, rot und manchmal auch gelb
  eingefärbt. Darüber hinaus können Sie die Ergebnisse der Analyse in
  diesem Modul manuell korrigieren, indem Sie individuelle
  Sentimentwerte vergeben.</p>
  <p><bold>Vergleich einzelner Texte</bold>: Im Corpus-Panel werden
  Ihnen die hochgeladenen Texte in alphabetischer Reihenfolge angezeigt
  („Sorting by: Name“). Lassen Sie sich per Klick auf „Sorting by:
  Score“ eine nach Sentimentwerten (vgl.
  <xref alt="Sentimentwert" rid="glossary-sentimentwert">Sentimentwert</xref>)
  geordnete Übersicht erstellen (vgl. Abb. 10).</p>
  <fig>
    <caption><p>Abb. 10: Organisation der hochgeladenen Dateien in
    alphabetischer Reihenfolge (dunkelgrau hinterlegt) oder mit dem
    Sentimentwert des Dokuments entsprechender Anordnung (hellgrau
    hinterlegt)</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Sorting_by_pap.png" />
  </fig>
  <p><bold><italic>Aufgabe 3</italic></bold>: In welchen Texten herrscht
  eine positive, in welchen Texten eine negative Stimmung vor? Erstellen
  Sie eine Rangliste und nutzen Sie die empirischen Daten, um eine erste
  Interpretationshypothese über das Stimmungsbild abzuleiten.</p>
  <p>Zur Erinnerung: Die Polarität wird bei <italic>SentiWS</italic>
  jeweils mithilfe einer Skala von –1 (maximal negativ) bis +1 (maximal
  positiv) ausgedrückt und auf vier Nachkommastellen gerundet. „Die
  Ausprägung der einzelnen Wörter wurden mittels der“Pointwise Mutual
  Information”-Methode (PMI) berechnet. Bei diesem Ansatz wird die
  semantische Ausprägung eines Wortes (SO: semantic orientation) aus
  semantischen Assoziationen des Wortes (SA: semantic association) zu
  ausgewählten Wörtern (sog. seed words: ausgewählte Wörter, die bei der
  Berechnung quasi als exemplarische Schlüsselwörter verwendet werden),
  die stark positiv oder negativ konnotiert sind, abgeleitet. Die
  semantische Ausprägung eines Wortes bezeichnet folglich den Grad der
  Verbindung eben dieses Wortes zu einem manuell erstellten Set an
  Wörtern, die positiv oder negativ konnotiert sind. Für jedes Wort wird
  berechnet, ob und wie stark es mit positiven und negativen Wörtern
  assoziiert wird.” (s. Artikel 30 im Methodeneintrag Sentimentanalyse
  (<xref alt="Flüh 2024a" rid="ref-fluhMethodenbeitragSentimentanalyse2019" ref-type="bibr">Flüh
  2024a</xref>)). Die Dezimalwerte in SentText sind teilweise deutlich
  höher. In diesen Fällen handelt es sich um den absoluten
  Sentimentwert, bei dem – bspw. für die Darstellung der
  <italic>Strongest Words</italic> – sämtliche Sentimentwerte addiert
  werden.</p>
  <p><bold><italic>Aufgabe 4</italic></bold>: Unterhalb der blauen
  Titelzeile im Visualize-Panel, in der der Dateiname der ausgewählten
  Datei angezeigt wird, können Sie einer kleineren Kopfzeile die
  Wortanzahl des Dokuments und die Gesamtanzahl der Sentiment-tragenden
  Wörter entnehmen. Wie lauten die absoluten Sentimentwerte (Addition
  der Werte aller Sentiment-tragenden Wörter, angegeben als Dezimalzahl)
  beider Homerischen Epen?</p>
  <p>Um die Funktionen des Text-Panels auszuprobieren, wählen Sie im
  Corpus-Panel nun Aischylos’ <italic>Der gefesselte Prometheus</italic>
  aus. Im Visualize-Panel öffnen sich dadurch unterschiedliche
  Visualisierungen, während im Text-Panel Aischylos’ Drama erscheint.
  Scrollen Sie im Text-Panel durch den Text und hovern über die farblich
  markierten Wörter.</p>
  <p><bold><italic>Aufgabe 5</italic></bold>: Nutzen Sie die hinter dem
  Informationssysmbol verborgenen Tooltipps im Text-Panel. Welche Wörter
  werden gelb markiert – und beinhaltet der Text gelb hervorgehobene
  Wörter?</p>
  <p><bold><italic>Aufgabe 6</italic></bold>: Welchen Sentimentwert und
  welche Polarität haben „gefesselt“, „Fesseln“, „Einsamkeit“, „Kraft“
  und „Gewalt“? Passen die generierten Polaritäten zu Ihren eigenen
  Assoziationen? Begründen Sie Ihre Antwort.</p>
  <p>Wie Sie feststellen, ist es im Rahmen einer lexikonbasierten
  Sentimentanalyse nicht ohne Weiteres möglich, Doppeldeutigkeiten
  kontextsensitiv zu behandeln. Die Analyse bewegt sich ausschließlich
  auf der Textoberfläche des ausgewählten Textes und filtert
  sentimentbezogene Textmerkmale heraus. Durch den Abgleich mit
  <italic>SentiWS</italic> erhält „fesseln“ eine positive Polarität,
  obwohl der/die aufmerksame Leser*in weiß, dass hier der qualvolle
  Zustand Prometheus beschrieben wird. Anhand dieser
  Polaritätszuschreibung wird eine grundlegende Problematik sichtbar:
  Lexikonbasierte Ansätze werden der Spezifik literarischer Texte – sei
  es in Form einer kontextgebundenen Semantik, sei es in Form implizit
  im Text verankerter Gefühlsausdrücke oder einer ironischen
  Ausdrucksweise – nicht vollständig gerecht. Um falsch erkannten
  Wörtern die richtige Polarität zuordnen zu können, beinhaltet SentText
  eine manuelle Korrekturfunktion. Wie Sie im Zuge der Bearbeitung von
  Aufgabe 6 erkannt haben, besitzt das Lexem „Fesseln“ einen negativen
  Sentimentwert von −0.0048. Dieser Wert erscheint in Anbetracht der
  desaströsen Lage Prometheus auch für das titelgebende „gefesselte“
  passend, welches einen positiven Sentimentwert erhalten hat. Um einen
  passenden Sentimentwert festzulegen, markieren Sie „gefesselte“. Nun
  öffnet sich das Dialogfeld, in dem Sie den Sentimentwert manuell
  eingeben können (vgl. Abb. 11). Jetzt haben Sie die Wahl: Entweder Sie
  entfernen die Markierung des ausgewählten Wortes als SBW via Klick auf
  „– Remove“ oder Sie legen einen neuen Sentimentwert fest.</p>
  <fig>
    <caption><p>Abb. 11: Manuelle Korrektur durch Auswahl des Wortes und
    Eingabe eines passenden Sentimentwerts</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Manuelle_Korrektur_pap.png" />
  </fig>
  <p>Tippen Sie in das Textfeld hinter „Add sentiment of word“ den
  negativen Sentimentwert –0.0048 ein und bestätigen Ihre Eingabe durch
  einen Klick auf den „Save sentiment“-Button. Wie Sie sehen, wird
  „gefesselt“ fortan rot markiert, weist den zugewiesenen negativen
  Sentimentwert auf (vgl. Abb. 12) und entspricht damit einer
  kontextsensitiv korrekten Semantik.</p>
  <fig>
    <caption><p>Abb. 12: Ergebnis der manuellen Korrektur</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abgeschlossene_Korrektur_pap.png" />
  </fig>
  <p><bold>Ausgewählte Visualisierungen</bold>: Einen Großteil der
  Visualisierungen werden wir uns zu einem späteren Zeitpunkt im Rahmen
  einer vergleichenden Analyse anschauen. Zwei ausgewählte Formen lassen
  sich jedoch nur für einzelne Texte abrufen: Die „Table“- und die
  „Timeline“-Visualisierung. Beide Visualisierungen arbeiten auf der
  Satzebene und sind im „Visualize-Panel“ dementsprechend unter der
  Überschrift „Charts of Sentence Level“ zu finden. Klicken Sie hier auf
  „Timeline: Development of the Sentiment“ oder „Table: The strongest
  ten sentences“, öffnen sich die Darstellungen. Beide Visualisierungen
  interagieren mit dem Text-Panel und lassen sich modifizieren.</p>
  <p><bold><italic>Aufgabe 7</italic></bold>: Wählen Sie die
  „Table“-Visualisierung aus. Wie lautet der Satz mit dem negativsten
  Sentimentwert? Welche Figur äußert ihn und an wen richtet er sich?</p>
  <p><bold><italic>Aufgabe 8</italic></bold>: Wählen Sie die
  „Timeline“-Visualisierung aus. In welchem Textsegment finden sich
  besonders positive bzw. negative Sätze und wie lauten diese?</p>
  <p><bold>Vergleich zweier Texte</bold>: Nun möchten wir die
  Analyseergebnisse beider „Extremfälle“ etwas genauer unter die Lupe
  nehmen und die unterschiedlichen Formen der Visualisierung erkunden.
  Wählen Sie im Corpus-Panel zunächst Homers <italic>Odyssee</italic>
  aus und richten Ihre Aufmerksamkeit nun wieder auf das
  Visualize-Modul. Über den grünen „Compare with others“-Button im
  Visualize-Panel können Sie mehrere Textdateien miteinander
  vergleichen. Wählen Sie die <italic>Ilias</italic> und die
  <italic>Odyssee</italic> zum Vergleich aus, indem Sie zuerst auf die
  grüne „Compare with others“-Schaltfläche klicken. Nun werden Ihnen die
  Analyseergebnisse aller Einzeltexte angezeigt. Um aus dem
  Antike-Korpus einzelne Texte auszuwählen, klicken Sie hinter „Select
  files“ – wo zum jetzigen Zeitpunkt noch „9 selected“ angezeigt wird –
  auf das kleine Pfeilsymbol. Deaktivieren Sie die übrigen Texte, indem
  Sie das Häkchen entfernen oder die „unselect all“-Funktion nutzen und
  ausschließlich <italic>Ilias</italic> und <italic>Odyssee</italic> mit
  einem Häkchen versehen (vgl. Abb. 13).</p>
  <fig>
    <caption><p>Abb. 13: Auswahl zweier Dateien für die vergleichende
    Analyse in drei Schritten</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Vergleich_zweier_Dateien_pap.png" />
  </fig>
  <p>Wie auch bei der Analyse von Einzeltexten können Sie nun hinter
  „Select graph“ für die ausgewählten Texte unterschiedliche
  Visualisierungen abrufen. Während alle unter „Scores“, „Polarities“
  und „Distribution“ abrufbaren Visualisierungen quantitative
  Analyseergebnisse in den Vordergrund stellen (Verteilung der SBWs und
  der Sentiment-tragenden Sätze im Text oder Korpus), ermöglichen die
  „Strongest Words“-Visualisierungen eine Exploration semantischer
  Strukturen.</p>
  <p><bold><italic>Aufgabe 9</italic></bold>: Werten Sie die
  Tortendiagramme aus, die die Verteilung der Sentiment-tragenden Sätze
  und Wörter anzeigen (Select graph, Distribution, Words/Sentences).</p>
  <p>Wählen Sie unter „Select graph“ nun die Wordcloud aus. Jetzt werden
  Ihnen für beide Texte Wordclouds (vgl.
  <xref alt="Wordcloud" rid="glossary-wordcloud">Wordcloud</xref>)
  angezeigt, die die besonders häufig vorkommenden positiven
  Sentimentwörter beinhalten. Die Größe der Buchstaben repräsentiert die
  Vorkommenshäufigkeit. Die Farbe steht für die Polarität (blau:
  positiv; rot: negativ). Sobald Sie mit der Maus über einzelne Wörter
  hovern, werden Ihnen das Wort, der Sentimentwert, die
  Vorkommenshäufigkeit und der absolute Sentimentwert (also die pro
  Vorkommen addierten Sentimentwerte) angezeigt (vgl. Abb. 14 und 15).
  Unter „Polarity“ können Sie auswählen, zu welcher Polarität Sie sich
  eine Wordcloud anzeigen lassen möchten.</p>
  <fig>
    <caption><p>Abb. 14: Wordclouds der positiven Sentiment bearing
    words im Vergleich</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Wordclouds_Homer_pos_pap_0.png" />
  </fig>
  <fig>
    <caption><p>Abb. 15: Wordclouds der negativen Sentiment bearing
    words im Vergleich</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Wordclouds_Homer_neg_pap_0.png" />
  </fig>
  <p><bold><italic>Aufgabe 10</italic></bold>: Welche positiven und
  welche negativen Sentimentwörter bestimmen die <italic>Ilias</italic>
  und die <italic>Odyssee</italic>? Werten Sie die Wordclouds aus.
  Welche Wörter mit besonders hohem positiven und negativen
  Sentimentwert kommen in der <italic>Ilias</italic> und der
  <italic>Odyssee</italic> vor? Beziehen Sie in Ihre Auswertung auch die
  Balkendiagramme mit ein, welche Sie unter „Select Graph → (“Strongest
  words”) → „Bar“ auswählen können.</p>
  <p>Nun haben Sie einige der Analyseergebnisse innerhalb der
  Toolumgebung miteinander verglichen. Wenn Sie alle Analyseergebnisse
  herunterladen möchten, um diese bspw. auch offline und zu einem
  anderen Zeitpunkt analysieren zu können, nutzen Sie die
  Download-Funktion im Corpus-Panel (vgl. Abb. 16). Hierfür hovern Sie
  über dem Downloadsymbol rechts neben dem Dateititel und klicken auf
  das gewünschte Dateiformat.</p>
  <fig>
    <caption><p>Abb. 16: Download der Analyseergebnisse in drei
    Formaten</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Download_der_Analysedateien_pap.png" />
  </fig>
  <p><bold><italic>Aufgabe 11</italic></bold>: Laden Sie die
  Analyseergebnisse der <italic>Odyssee</italic> herunter und speichern
  Sie diese im xml-Format auf Ihrem Desktop ab.</p>
  <p><bold>Vergleich mehrerer Korpora (Corpus-, Visualize-Panel)</bold>:
  Im folgenden Teil der Lerneinheit werden Sie das noch ungeordnete
  Antike-Korpus so anordnen, dass ein genretypologischer Vergleich
  möglich wird. Hierfür richten Sie sich wieder dem „Overview and
  grouping of submitted files“-Modul zu. Legen Sie zunächst drei
  unterschiedliche Ordner an. Klicken zu hierzu auf „create folder“,
  geben als Ordnername „Dramatiker“ in das Textfeld ein und bestätigen
  Ihre Eingabe per Klick auf „Submit“ (vgl. Abb. 17).</p>
  <fig>
    <caption><p>Abb. 17: Einen Ordner erstellen: „Create folder“,
    Texteingabe, „Submit“</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Ordner_erstellen_pap.png" />
  </fig>
  <p>Wiederholen Sie diesen Vorgang und legen Sie einen Epiker- und
  einen Dichter-Ordner an. In Ihrem Corpus-Panel befinden sich nun drei
  Ordner und neun Textdateien (vgl. Abb. 18).</p>
  <fig>
    <caption><p>Abb. 18: Das unsortierte Corpus-Panel</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Unsortiertes_Corpus-Panel_pap.png" />
  </fig>
  <p>Bevor die vergleichende Analyse durchgeführt werden kann, müssen
  die verschiedenen Dateien einem entsprechenden Ordner zugeordnet
  werden. Ziehen Sie hierfür die einzelnen Dateien per Drag &amp; Drop
  in den passenden Ordner (vgl. Abb. 19).</p>
  <fig>
    <caption><p>Abb. 19: Das nach Gattungen sortierte
    Corpus-Panel</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Sortiertes_Corpus-Panel_pap.png" />
  </fig>
  <p>Klicken Sie nun auf den grünen „Compare files and folders“-Button
  und starten die vergleichende Sentimentanalyse. Nun öffnet sich
  automatisch ein zuvor nicht sichtbares Panel: das „Compare documents
  and folders“-Modul. Die generalisierten Analyseergebnisse werden Ihnen
  zunächst für alle Einzeltexte und für die drei Textkorpora angezeigt
  (vgl. Abb. 12). Sollte dies nicht der Fall sein, wählen Sie im
  Eingabefeld hinter „Selected files“ zunächst alle 12 Dateien aus. Für
  jedes Dokument bzw. jedes Korpus werden die folgenden Metadaten
  angezeigt: Titel, normalisierter Sentimentwert (= absoluter
  Sentimentwert, geteilt durch die Anzahl aller Wörter eines Textes, um
  die Vergleichbarkeit unterschiedlich langer Texte zu gewährleisten),
  absoluter Sentimentwert und Wortanzahl. Unter „Select graph“ können
  Sie aus unterschiedlichen Visualisierungsformen (Verteilungsgraf,
  Tortendiagramm, Wordcloud) auswählen, die die verschiedenen
  Analyseergebnisse (Polarität, Verteilung positiver/negativer Wörter
  und Sätze, stärkste Sentimentwörter/Sentiment-tragende Sätze) für die
  einzelnen Textdateien sowie die drei Korpora darstellen. Zunächst
  bleiben Sie aber bei der Startansicht (vgl. Abb. 20).</p>
  <fig>
    <caption><p>Abb. 20: Ergebnis der vergleichenden
    Analyse</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Vergleichende_Analyse_pap.png" />
  </fig>
  <p><bold><italic>Aufgabe 12</italic></bold>: In welchen Texten
  herrscht eine positive, in welchen Texten eine negative Stimmung vor?
  Erstellen Sie eine Rangliste.</p>
  <p>Zur Erinnerung: Die Polarität wird bei <italic>SentiWS</italic>
  jeweils in einer Skala von –1 (maximal negativ) bis +1 (maximal
  positiv) ausgedrückt und auf vier Nachkommastellen gerundet. Um die
  Analyseergebnisse in eine Reihenfolge zu bringen, ist der Blick auf
  den normalisierten Sentimentgehalt des Dokuments hilfreich. Nach einem
  ersten Überblick über den Sentimentgehalt der einzelnen Texte widmen
  wir uns nun dem detaillierten Vergleich der drei Teilkorpora. Sie
  haben in dem Compare-Modul die Möglichkeit, zuvor angelegte Ordner
  miteinander vergleichen zu lassen und die Ergebnisse genauer unter die
  Lupe zu nehmen. Per Default (vgl.
  <xref alt="Default" rid="glossary-default">Default</xref>) werden
  Ihnen im Moment die Analyseergebnisse aller 9 Dateien und die der drei
  Textkorpora angezeigt („12 selected“). Klicken Sie im Auswahlfeld
  neben „Selected files“ zunächst auf „unselect all“ und setzten dann
  ein Häkchen vor dem Dramatiker-, Epiker- und Dichter-Ordner (vgl. Abb.
  21). Auf diese Weise schließen Sie die Analyse der Einzeltexte aus und
  können sich auf den Vergleich der Teilkorpora konzentrieren.</p>
  <fig>
    <caption><p>Abb. 21: Auswahl der drei Korpora für eine vergleichende
    Sentimentanalyse</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Auswahl_Korporavergleich_pap.png" />
  </fig>
  <p>Sollten Sie einzelne Texte miteinander vergleichen wollen, können
  Sie diese übrigens ebenfalls in diesem Bereich auswählen. Durch die
  Auswahl der drei Ordner gelangen Sie nun zu der bereits bekannten und
  jetzt etwas größer abgebildeten Gesamtübersicht, in der die absolute
  und die normalisierte Polarität aller Ordner angezeigt wird. Neben dem
  „Select graph“-Schriftzug haben Sie wieder die Möglichkeit, sich
  einzelne Analyseergebnisse in Form unterschiedlicher Visualisierungen
  anzeigen zu lassen. Unter „Polarity“ wird die Polarität der einzelnen
  Korpora angezeigt. Unter „Distribution“ wird die Verteilung der
  positiven und negativen sentiment bearing words bzw. der Sätze mit
  positiver und negativer Polarität in den einzelnen Teilkorpora
  angezeigt. Unter „strongest words“ können Sie sich die besonders
  positiven und besonders negativen Wörter in Wordclouds oder Grafen
  anzeigen lassen. Bearbeiten Sie nun die folgenden Aufgaben, indem Sie
  die Einstellungen hinter „select graph“ den Angaben in den Klammern
  entsprechend anpassen.</p>
  <p><bold><italic>Aufgabe 13 (Polarity Weight; Normalization: Sentiment
  Bearing Words)</italic></bold>: Schauen Sie sich die Grafen an.
  Welches Korpus enthält die meisten <italic>sentiment bearing
  words</italic>? Welches Korpus ist am „stimmungsvollsten“?</p>
  <p><bold><italic>Aufgabe 14 (Distribution; Words)</italic></bold>:
  Beschreiben und interpretieren Sie die Verteilung der positiven und
  negativen Sentiment-tragenden Wörter innerhalb der drei Teilkorpora.
  Wie lassen sich die Diagramme interpretieren, wenn die Verteilung der
  positiven und negativen Sätze (Distribution; Sentences) angezeigt
  wird?</p>
  <p><bold><italic>Aufgabe 15 (Strongest Words; Wordcloud, Polarity:
  negative/positive)</italic></bold>: Welche negativen und welche
  positiven Sentiment-tragenden Wörter bestimmen die drei Textkorpora?
  Lassen sich aus den Wordclouds erste Interpretationshypothesen über
  inhaltliche Schwerpunkte ableiten?</p>
  <p>Damit sind Sie am Ende der Lerneinheit zur lexikonbaiserten
  Sentimentanalyse mit SentText angelangt. Sie haben ein Antike-Korpus
  erstellt und dieses bei SentText hochgeladen. Hier haben Sie das
  Corpus-, das Visualize- sowie das Text-Modul und deren Funktionen
  kennengelernt.</p>
</sec>
<sec id="lösungen-zu-den-beispielaufgaben">
  <title>4. Lösungen zu den Beispielaufgaben</title>
  <p><bold><italic>Aufgabe 1:</italic></bold> Welche Wörter werden rot
  markiert, welche Wörter werden blau markiert und welche Stimmung
  assoziieren Sie mit den farblich hervorgehobenen Begriffen? Welches
  Wort scheint Ihnen eine besonders positive Gefühlslage zu
  repräsentieren und welches ist negativ konnotiert? Bringen Sie die
  Wörter – absteigend von positiv zu negativ konnotierten Wörtern – in
  eine Reihenfolge.
  „heiligen“ und „gelernt“ werden blau markiert. Sie sind positiv
  konnotiert und könnten mit Reinheit und einem bereichernden
  Wissenszuwachs assoziiert werden. „Zerstörung“ wird rot eingefärbt und
  ist negativ konnotiert. Der Begriff entwirft eine düstere, destruktive
  Stimmung. Die folgenden Reihenfolgen erscheinen plausibel: 1) heiligen
  (sehr positiv); 2) lernen (positiv); 3) Zerstörung (negativ) oder 1)
  lernen (sehr positiv); 2) heiligen (positiv); 3) Zerstörung
  (negativ).</p>
  <p><bold><italic>Aufgabe 2:</italic></bold> Die Demoversion greift auf
  das Sentimentwörterbuch <italic>SentimentWortschatz</italic>
  (<italic>SentiWS</italic>) zurück. „heiligen“ hat hier einen
  Sentimentwert von 0.0727, der Sentimentwert von „gelernt“ beträgt
  0.2492. „Zerstörung“ hat einen Sentimentwert von –0.3578. Passen die
  errechneten Sentimentwerte zu Ihrer persönlichen Reihenfolge?</p>
  <p>Die errechneten Sentimentwerte entsprechen der Reihenfolge. Dass
  „Zerstörung“ einen äußerst negativen Sentimentwert erhält, erscheint
  plausibel. „gelernt“ ist <italic>SentiWS</italic> zufolge positiver
  konnotiert als „heiligen“. Die positive Bewertung beider Verben ist
  nachvollziehbar, könnte je nach wertendem Individuum und zeitlichem
  Kontext allerdings auch in umgekehrter Reihenfolge ausfallen. Ein
  religiöser Mensch würde evtl. „heiligen“ positiver bewerten als
  „lernen“. Mit dem Beginn der Aufklärung ab 1700 dürfte „lernen“
  deutlich positiver bewertet werden als „heiligen“. An dieser Stelle
  wird erneut der Einfluss des Sentimentwörterbuchs auf
  Analyseergebnisse und Interpretation deutlich. Die Konnotation der
  Lexeme wird durch den zeitlichen Kontext und die menschlichen
  Bewertungen anhaftende Subjektivität mitbestimmt.</p>
  <p><bold><italic>Aufgabe 3:</italic></bold> In welchen Texten herrscht
  eine positive, in welchen Texten eine negative Stimmung vor? Erstellen
  Sie eine Rangliste und nutzen Sie die empirischen Daten, um eine erste
  Interpretationshypothese über das Stimmungsbild abzuleiten.</p>
  <p>Texte mit negativer Polarität in aufsteigender Reihenfolge (negativ
  zu sehr negativ)
  Homer: <italic>Ilias</italic> –0.001923
  Apuleius: <italic>Der goldene Esel</italic> –0.001954
  Ovid: <italic>Metamorphosen</italic> –0.003512
  Aristophanes: <italic>Die Wolken</italic> –0.003539
  Aischylos: <italic>Der gefesselte Prometheus</italic> –0.005027
  Anakreon: <italic>Auf die Liebe</italic> –0.005503
  Euripides: <italic>Medea</italic> –0.005545</p>
  <p>Texte mit positiver Polarität in aufsteigender Reihenfolge (positiv
  zu sehr positiv)
  Homer: <italic>Odyssee</italic> 0.000931
  Hesiodos: <italic>Theogonia</italic> 0.00117
  Für einen Großteil der Texte ist ein negatives Stimmungsbild
  konstitutiv; nur zwei Texte weisen einen positiven durchschnittlichen
  Sentimentwert auf. Homers Epen führen beide Listen an, hier lassen
  sich sowohl besonders positive als auch negative gefühlsbezogene
  Extremsituationen in Form Sentiment-tragender Signalwörter auf der
  Textoberfläche nachweisen.</p>
  <p><bold><italic>Aufgabe 4:</italic></bold> Unterhalb der blauen
  Titelzeile, in der der Dateiname der ausgewählten Datei angezeigt
  wird, können Sie einer kleineren Kopfzeile die Wortanzahl des
  Dokuments und die Gesamtanzahl der Sentiment-tragenden Wörter
  entnehmen. Wie lauten die absoluten Sentimentwerte (Addition der Werte
  aller Sentiment-tragender Wörter, angegeben als Dezimalzahl) beider
  Homerischer Epen?</p>
  <p>SentText addiert sämtliche Sentimentwerte, die für die
  <italic>Odyssee</italic> vergeben wurden und errechnet einen positiven
  Gesamtwert von 100.3641. SentText addiert sämtliche Sentimentwerte,
  die für die <italic>Ilias</italic> vergeben wurden und errechnet einen
  einen negativen Gesamtwert von –273.3258.</p>
  <p><bold><italic>Aufgabe 5:</italic></bold> Nutzen Sie die hinter dem
  Informationssysmbol verborgenen Tooltipps im Text-Panel. Welche Wörter
  werden gelb markiert – und beinhaltet der Text gelb hervorgehobene
  Wörter?</p>
  <p>Gelb markiert sind diejenigen Wörter, die im ausgewählten Lexikon
  enthalten sind und deren Sentimentwert 0 beträgt. Es handelt sich um
  neutrale Wörter. Der <italic>Gefesselte Prometheus</italic> enthält
  keine neutralen Sentimentwörter.</p>
  <p><bold><italic>Aufgabe 6:</italic></bold> Welchen Sentimentwert und
  welche Polarität haben „gefesselt“, „Fesseln“, „Einsamkeit“, „Kraft“
  und „Gewalt“? Passen die Polaritäten und Ihre eigene Vorstellung
  zusammen? Falls nicht: Woran könnte der Unterschied liegen?</p>
  <p>„gefesselt“: Polarität: positiv; Sentimentwert: 0.004
  „Fesseln“: Polarität: negativ; Sentimentwert: –0.0048
  „Einsamkeit“:Polarität: negativ; Sentimentwert: –0.339
  „Kraft“: Polarität: positiv; Sentimentwert: 0.004
  „Gewalt“: Polarität: negativ; Sentimentwert –0.5363
  In den meisten Fällen stimmen wahrscheinlich Sentimentwert und eigene
  Konnotation überein. Die negative Konnotation der Lexeme „Gewalt“ und
  „Fesseln“ erscheint genauso plausible wie die positive Polarität von
  „Kraft“. Dass „fesseln“ als verwandte Verbform von „Fesseln“ eine
  positive Polarität aufweist, erscheint fragwürdig. Hier müsste eine
  manuelle Änderung vorgenommen werden. Eine Erklärung für die Vergabe
  eines positiven Sentimentwerts liegt in der Bedeutungsvielfalt der
  Verbform. „fesseln“ im Sinne einer durch das Anlegen von Fesseln oder
  Festbinden beraubten Bewegungsfreiheit ist negativ konnotiert.
  Versteht man „fesseln“ allerdings als faszinierendes Beanspruchen von
  Aufmerksamkeit, ist der positive Sentimentwert nachvollziehbar.</p>
  <p><bold><italic>Aufgabe 7:</italic></bold> Wählen Sie die
  „Table“-Visualisierung aus. Wie lautet der Satz mit dem negativsten
  Sentimentwert? Welche Figur äußert ihn und an wen richtet er sich?</p>
  <p>Der Satz lautet: „Ja, krank, wenn Krankheit seine Feinde hassen
  heißt!“. Er wird von Prometheus ausgesprochen und richtet sich an
  Hermes.</p>
  <p><bold><italic>Aufgabe 8:</italic></bold> Wählen Sie die
  „Timeline“-Visualisierung aus. In welchem Textsegment finden sich
  besonders positive bzw. negative Sätze und wie lauten diese?</p>
  <p>In dem Textsegment zwischen 600 und 650 finden sich Sätze mit
  besonders positiver Polarität. Einen besonders positiven Sentimentwert
  von 0.201 weist „Behaglich“ auf, wobei es sich hierbei nicht um einen
  vollständigen Satz handelt. Im Segment zwischen 620 und 675 finden
  Sätze mit besonders negativer Polarität, hierzu gehört z. B. „So
  wirfst du mir auch Schuld an deinem Leide vor?“.</p>
  <p><bold><italic>Aufgabe 9:</italic></bold> Werten Sie die
  Tortendiagramme aus, die die Verteilung der Sentiment-tragenden Sätze
  und Wörter anzeigen (Select graph, Distribution, Words/Sentences).</p>
  <p>Der Vergleich der vier Diagramme zeigt eine sehr ähnliche
  Verteilung der Sentiment-tragenden Wörter und Sätze. Beide Epen weisen
  ein relativ ausgeglichenes Verhältnis zwischen positiven und negativen
  Sentiment-tragenden Wörtern und Sätzen auf. Die Anzahl an positiven
  SBWs überwiegt, wobei diese Tendenz in der <italic>Ilias</italic>
  ausgeprägter ist als in der <italic>Odyssee</italic>. Die Verteilung
  positiver und negativer Sätze ist ebenfalls ähnlich, positive Sätze
  überwiegen in beiden Texten. Es zeigt sich ein ausgeglichenes
  Stimmungsbild.</p>
  <p><bold><italic>Aufgabe 10:</italic></bold> Welche positiven und
  welche negativen Sentimentwörter bestimmen die <italic>Ilias</italic>
  und die <italic>Odyssee</italic>? Werten Sie die Wordcloud aus.
  Welche Wörter mit besonders hohem positiven und negativen
  Sentimentwert kommen in der <italic>Ilias</italic> und der
  <italic>Odyssee</italic> vor? Beziehen Sie in Ihre Auswertung auch die
  Balkendiagramme mit ein, welche Sie unter „Select Graph → (“Strongest
  words”) → „Bar“ auswählen können.</p>
  <p>Die acht negativsten Wörter in Homers <italic>Odyssee</italic>
  lauten „Gewalt“, „Jammer“, „getötet“, „Unglück“, „Feinde“, „brach“,
  „Fremde“ und „Gefahr“.
  Die acht negativsten Wörter der <italic>Ilias</italic> sind „Kampf“,
  „Streit“, „Gewalt“, „Kampfe“, „kämpfte“, „Mauer“, „Feind“ und „Zorn“.
  Aus der Distanz betrachtet, spiegelt sich das zentrale Thema des Epos
  – der erbitterte Kampf zwischen Achaiern und Trojanern um die Stadt
  Troja – deutlich in den besonders negativen Wörtern wider. Der Bau und
  die Verteidigung der Mauer um das Lager der Griechen lässt sich
  ebenfalls ablesen, darüber hinaus findet sich auch der berühmte
  iliadische Zorn im Grafen wieder. Die <italic>Odyssee</italic>
  erscheint auf den ersten Blick weniger Kampfdarstellungen zu
  enthalten. Zentrale Themen wie die Reise in die Fremde oder der
  Verlust von Freunden lassen sich aus dem Grafen ableiten.</p>
  <fig>
    <caption><p>Abb. 22: Die acht besonders negativen Wörter in der
    Ilias und der Odyssee</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="negative_Woerter_mit_hohem_Sentimentwert_pap.png" />
  </fig>
  <p>Die acht besonders positiven Wörter der <italic>Ilias</italic>
  lauten „Genossen“, „Mut“, „mutige“, „Mutes“, „mutigen“, „Muts“,
  „Geschenk“ und „Schnell“. Hier wird die wichtigste
  Charaktereigenschaft der Helden deutlich. Gleichzeitig offenbart sich
  der Mehrwert einer Lemmatisierung. Bei einem weiteren Analysedurchlauf
  sollte eine Lemmatisierung durchgeführt werden, damit Wörter desselben
  Wortstammes nicht als unterschiedliche Lexeme gezählt werden.
  Bei „großen“, „herrliche“, „edlen“, „Geschenke“, „Genossen“, „kluge“,
  „prächtigen“ und „Ruhe“ handelt es sich um die acht besonders
  positiven SBWs der <italic>Odyssee</italic>. Die Zusammensetzung ist
  deutlich heterogener als in der <italic>Ilias</italic>. Die Adjektive
  groß, herrlich, edel, klug und prächtig rücken Charaktereigenschaften
  oder körperliche Eigenschaften in den Vordergrund.</p>
  <fig>
    <caption><p>Abb. 23: Die acht besonders negativen Wörter in der
    Ilias und der Odyssee</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="positive_Woerter_mit_hohem_Sentimentwert_pap.png" />
  </fig>
  <p><bold><italic>Aufgabe 11:</italic></bold> Laden Sie die
  Analyseergebnisse der <italic>Odyssee</italic> herunter und speichern
  Sie diese auf Ihrem Desktop ab.</p>
  <p><bold><italic>Aufgabe 12:</italic></bold> In welchen Texten
  herrscht eine positive, in welchen Texten eine negative Stimmung vor?
  Erstellen Sie eine Rangliste.</p>
  <p>Positiver durchschnittlicher Sentimentwert (absteigend, sehr
  positiv bis weniger positiv)
  1) Hesiodos: <italic>Tehogonie</italic> (0.0017)
  2) Homer: <italic>Odyssee</italic> (0.000931)
  Negativer durschnittlicher Sentimentwert (absteigend, sehr negativ bis
  weniger negativ)
  1) Homer: <italic>Ilias</italic> (–0.001923)
  2) Apuleius: <italic>Der goldene Esel</italic> (–0.001954)
  3) Ovid: <italic>Metamorphosen</italic> (–0.003512)
  4) Aristophanes: <italic>Die Wolken</italic> (–0.003539)
  5) Aischylos: <italic>Der gefesselte Prometheus</italic> (–0.00491)
  6) Anakreon: <italic>Auf die Liebe</italic> (–0.005503)
  7) Euripides: <italic>Medea</italic> (–0.005545)</p>
  <p><bold><italic>Aufgabe 13</italic></bold> <italic>(Polarity Weight;
  Normalization: Sentiment Bearing Words)</italic>: Schauen Sie sich die
  Grafen an. Welches Korpus enthält die meisten_ _sentiment bearing
  words? Welches Korpus ist am „stimmungsvollsten“?</p>
  <p>Das Korpus der Epiker enthält die meisten sentiment bearing words
  und könnte demnach als besonders stimmungsvoll bezeichnet werden.
  Epiker: 23.030 SBWs (–0.0006)
  Dichter: 5.770 SBWs (–0.0030)
  Dramatiker: 2.990 SBWs (–0.0046)
  Bei der Bezeichnung als „stimmungsvollstes Korpus“ ist Vorsicht
  geboten, da die Textlänge natürlich die Anzahl der SBWs beeinflusst.
  Die Epen sind bspw. deutlich umfangreicher als die lyrischen Werke.
  Bei einer solchen quantitativen Analyse ist es also ratsam, Texte
  ähnlichen Umfangs auszuwählen. Um eine fehlerhafte Interpretation zu
  vermeiden, sollten außerdem die normalisierten Werte einbezogen
  werden.</p>
  <p><bold><italic>Aufgabe 14</italic></bold> <italic>(Distribution;
  Words)</italic>: Beschreiben und interpretieren Sie die Verteilung der
  positiven und negativen Sentiment-tragenden Wörter innerhalb der drei
  Teilkorpora. Wie lassen sich die Diagramme interpretieren, wenn die
  Verteilung der positiven und negativen Sätze (Distribution; Sentences)
  angezeigt wird?</p>
  <p>Die Verteilung der positiven und negativen SBWs erscheint auf den
  ersten Blick sehr ausgeglichen. Das gilt v. a. für das Korpus der
  Dramatiker. Hier befindet sich das Verhältnis fast in der Wage (48,7 %
  negative SBWs, 51,3 positive SBWs). Mit einem Verhältnis von +60 zu –
  40 weist das Korpus der Epiker die größte Diskrepanz zwischen
  positiven und negativen SBWs auf. Das Korpus der Dichter nimmt eine
  Mittelposition ein (+54,49 zu –45,51). Die vergleichende Analyse der
  drei Antike-Korpora zeigt zunächst, dass im Durchschnitt alle drei
  Gattungen einen normalisierten negativen Sentimentwert aufweisen. Das
  bestätigt der Blick auf die einzelnen Texte, von denen insgesamt nur
  zwei einen positiven Sentimentwert aufweisen. Bei den epischen Texten
  (<italic>Ilias</italic>, <italic>Odyssee</italic> und
  <italic>Theogonia</italic>) schlägt der Sentimentwert besonders stark
  in den Minusbereich aus. Das ist überraschend, da zwei der im
  Epiker-Korpus enthaltenen Texte zu den Texten gehören, für die ein
  durchschnittlich positiver Sentimentwert errechnet wurde. Dieser
  Befund geht konform mit den übrigen Analyseergebnisse, da die
  <italic>Ilias</italic> insgesamt den zweitnegativsten Sentimentwert
  aufweist und den Sentimentwert des Epiker-Korpus maßgeblich in den
  negativen Bereich führt.</p>
  <p><italic><bold>Aufgabe 15</bold> (Strongest Words; Wordcloud,
  Polarity: negative/positive)</italic>: Welche negativen und welche
  positiven Sentiment-tragenden Wörter bestimmen die drei Textkorpora?
  Lassen sich aus den Wordclouds erste Interpretationshypothesen über
  inhaltliche Schwerpunkte ableiten?</p>
  <p>Die vergleichende Analyse der drei Antike-Korpora zeigt zunächst,
  dass im Durchschnitt alle drei Gattungen einen negativen Sentimentwert
  aufweisen. Das bestätigt der Blick auf die einzelnen Texte, von denen
  nur zwei einen positiven Sentimentwert aufweisen.
  Epiker: –161.925
  Dramatiker: –152.1012
  Dichter: –123.2111
  Aus den Wordclouds treten die folgenden SBWs besonders hervor:
  Negative zentrale Begriffe:
  Dramatiker: Leid, schlechten, Feinden, Schuld
  Epiker: Streit, Gewalt, Mauer, Kampfe, kämpfen
  Dichter: Arme, Gewalt, Feind, Feinde, Gefahr, Furcht, Krieg, Streit
  Positive zentrale Begriffe:
  Dramatiker: Heil, mag, gut, Freude, treu
  Epiker: Mut, großen, herrliche, edlen
  Dichter: Mut, Liebe, Schönheit, Freuden, Glück, Geschenk
  Dramatiker: Hier ließe sich eine Auseinandersetzung mit Schuld und der
  Konflikt zwischen Feind und Freund ableiten. Die Wordcloud lässt
  vermuten, dass Fragen der Moral verhandelt werden.
  Epiker: In der Wordcloud rücken Gewalt und Kampf in den Vordergrund,
  was ebenfalls auf das Austragen eines Konflikts deutet. Mut tritt als
  wichtige Eigenschaft des Helden hervor.
  Dichter: Das zentrale Thema der kriegerischen Auseinandersetzung ist
  in der Wordcloud deutlich zu erkennen und steht mit konventionell
  negativ konnotierten Wörtern wie Gewalt, Furcht, Feind und Streit in
  Verbindung. Dem gegenüber stehen konventionell positiv konnotierte
  Lexeme wie Liebe, Glück, Freuden, Geschenk oder Schönheit. In dieser
  Wordcloud steht ein gefühlsbetontes Vokabular im Vordergrund, was
  gattungstypologisch plausibel erscheint.</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>Textgrid Repository:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://textgridrep.org/">https://web.archive.org/save/https://textgridrep.org/</ext-link>
      (Letzter Zugriff: 04.09.2024)</p>
    </list-item>
    <list-item>
      <p>SentText:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://thomasschmidtur.pythonanywhere.com/">https://web.archive.org/save/http://thomasschmidtur.pythonanywhere.com/</ext-link>
      (Letzter Zugriff: 04.09.2024)</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-csv">CSV</styled-content></term>
      <def>
        <p>CSV ist die englische Abkürzung für <italic>Comma Separated
        Values</italic>. Es handelt sich um ein Dateiformat zur
        einheitlichen Darstellung und Speicherung von einfach
        strukturierten Daten mit dem Kürzel <monospace>.csv</monospace>
        , sodass diese problemlos zwischen IT-Systemen ausgetauscht
        werden können. Dabei sind alle Daten zeilenweise angeordnet.
        Alle Zeilen wiederum sind in einzelne Datenfelder aufgeteilt,
        welche durch Trennzeichen wie Semikola oder Kommata getrennt
        werden können. In Programmen wie Excel können solche Textdateien
        als Tabelle angezeigt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-data-mining">Data
      Mining</styled-content></term>
      <def>
        <p>Data Mining gehört zum Fachbereich
        <xref alt="Information Retrieval" rid="glossary-information-retrieval">Information
        Retrieval</xref> und bezieht sich auf die systematische
        Anwendung computergestützter Methoden, die darauf abzielt, in
        vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu
        erkennen. Textbasierte Formen des Data Minings sind u. a.
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>,
        <xref alt="Web Mining" rid="glossary-web-mining">Web
        Mining</xref> und
        <xref alt="Opinion Mining" rid="glossary-opinion-mining">Opinion
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-default">Default</styled-content></term>
      <def>
        <p>Das/der Default (engl. für Voreinstellung oder Standardwert)
        bezeichnet den Wert einer Softwareeinstellung oder einer
        Eingabevariable, der verwendet wird, falls Nutzer*innen selbst
        keinen Wert oder keine Einstellungen vornehmen. Es handelt sich
        also um die standardmäßig festgelegten Einstellungen eines Tools
        oder Programms. Per Default festgelegte Parameter lassen sich i.
        d. R. manuell umstellen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-feature">Feature</styled-content></term>
      <def>
        <p>Unter Features können Einzelfunktionen eines Tools verstanden
        werden, die beispielsweise komplexe Funktionen wie die
        Visualisierung eines Textes als
        <xref alt="Wordcloud" rid="glossary-wordcloud">Wordcloud</xref>
        ermöglichen, oder auch kleinere Funktionseinheiten wie den
        Abgleich einzelner Spracheigenschaften
        (<xref alt="Properties" rid="glossary-property">Properties</xref>)
        mit
        <xref alt="annotierten" rid="glossary-annotation">annotierten</xref>
        Beispieltexten darstellen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-information-retrieval">Information
      Retrieval</styled-content></term>
      <def>
        <p>Die Teildisziplin der Informatik, das Information Retrieval,
        beschäftigt sich mit der computergestützten Suche und
        Erschließung komplexer Informationen in meist unstrukturierten
        Datensammlungen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup">Markup
      (Textauszeichung)</styled-content></term>
      <def>
        <p>Die Textauszeichnung (eng. <italic>Markup</italic>) fällt in
        den Bereich der Daten- bzw. Textverarbeitung, genauer in das
        Gebiet der Textformatierung, welche durch
        <xref alt="Auszeichnungssprachen" rid="glossary-markup-language">Auszeichnungssprachen</xref>
        wie <xref alt="XML" rid="glossary-xml">XML</xref> implementiert
        wird. Dabei geht es um die Beschreibung, wie einzelne Elemente
        eines Textes beispielsweise auf Webseiten grafisch dargestellt
        werden sollen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z. B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-opinion-mining">Opinion
      Mininig</styled-content></term>
      <def>
        <p>Unter Opinion Mining, oder Sentiment Analysis, versteht man
        die Analyse von Stimmungen oder Haltungen gegenüber einem Thema,
        durch die Analyse natürlicher Sprache. Das Opinion Mining gehört
        zu den Verfahren des
        <xref alt="Text Minings" rid="glossary-text-mining">Text
        Minings</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic>, oder „Wortart“
        auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-property">Property</styled-content></term>
      <def>
        <p>Property steht für „Eigenschaft“, „Komponente“ oder
        „Attribut“. In der automatischen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        dienen konkrete Worteigenschaften wie Groß- und Kleinschreibung
        zur Klassifizierung von Wörtern oder Phrasen. Durch die
        Berücksichtigung solcher Eigenschaften in den
        <xref alt="Features" rid="glossary-feature">Features</xref>
        eines Tools kann
        <xref alt="maschinelles Lernen" rid="glossary-machine-learning">maschinelles
        Lernen</xref> bestimmter Phänomene umgesetzt werden. In der
        manuellen Annotation können als Properties auch Eigenschaften
        von
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        benannt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-reintext-version">Reintext-Version</styled-content></term>
      <def>
        <p>Die Reintext-Version ist die Version eines digitalen Textes
        oder einer Tabelle, in der keinerlei Formatierungen
        (Kursivierung, Metadatenauszeichnung etc.) enthalten sind.
        Reintext-Formate sind beispielsweise TXT, RTF und
        <xref alt="CSV" rid="glossary-csv">CSV</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-sbw">SBW</styled-content></term>
      <def>
        <p>SBW steht für <italic>Sentiment Bearing Word</italic>
        (Sentimentwort) und bezeichnet ein Lexem, das eine Stimmung,
        eine Bewertung, ein Gefühl, eine Einstellung oder auch eine
        Emotion zum Ausdruck bringt. Für SBWs werden „semantische
        Orientierung“ und „Stärke“ in Form des
        <xref alt="Sentimentwerts" rid="glossary-sentimentwert">Sentimentwerts</xref>
        festgelegt. SBWs werden in
        <xref alt="Sentimentlexika" rid="glossary-sentimentwoerterbuch">Sentimentlexika</xref>
        gesammelt und als Grundlage für lexikonbasierte
        Sentimentanalysen verwendet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-sentimentwert">Sentimentwert</styled-content></term>
      <def>
        <p>Der Sentimentwert oder Sentimentgehalt eines Wortes
        beschreibt, meistens auf einer Skala von–1 (maximal negativ;
        bspw. „schädlich“:–0,9269) bis +1 (maximal positiv, bspw.
        „Freude“: 0,6502) die Polarität von Sentimentwörtern (siehe auch
        <xref alt="SBWs" rid="glossary-sbw">SBWs</xref>. Der Wert wird
        bei der Generierung von
        <xref alt="Sentimentlexika" rid="glossary-sentimentwoerterbuch">Sentimentlexika</xref>
        für jedes enthaltene Wort errechnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-sentimentwoerterbuch">Sentimentwörterbuch</styled-content></term>
      <def>
        <p>Ein Wörterbuch, das ausschließlich Lexeme enthält, die
        <xref alt="Träger von Sentiments" rid="glossary-sbw">Träger von
        Sentiments</xref> sind, wird als Sentimentwörterbuch definiert.
        Sentimentlexika fungieren als wichtige Ressource für
        lexikonbasierte Sentimentanalysen , bei denen die Wörter des
        Wörterbuchs und die Wörter eines Primärtextes miteinander
        abgeglichen werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-stoppwortliste">Stoppwortliste</styled-content></term>
      <def>
        <p>Stoppwörter sind hochfrequente Wörter, meist Funktionswörter,
        die, aufgrund ihrer grammatisch bedingten Häufigkeit,
        beispielsweise die Ergebnisse von inhaltlichen oder thematischen
        Analysen verzerren können. Deshalb werden diese Wörter,
        gesammelt in einer Stoppwortliste, bei digitalen Textanalysen
        meist nicht berücksichtigt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-tei">TEI</styled-content></term>
      <def>
        <p>Die <italic>Text Encoding Initiative</italic> (TEI) ist ein
        Konsortium, das gemeinsam einen Standard für die Darstellung von
        Texten in digitaler Form entwickelt. Die TEI bietet
        beispielsweise Standards zur Kodierung von gedruckten Werken und
        zur Auszeichnung von sprachlichen Informationen in
        maschinenlesbaren Texten (siehe auch
        <xref alt="XML" rid="glossary-xml">XML</xref> und
        <xref alt="Markup" rid="glossary-markup">Markup</xref>).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-text-mining">Text
      Mining</styled-content></term>
      <def>
        <p>Das Text Mining ist eine textbasierte Form des
        <xref alt="Data Minings" rid="glossary-data-mining">Data
        Minings</xref>. Prozesse &amp; Methoden, computergestützt und
        automatisch Informationen bzw. Wissen aus unstrukturierten
        Textdaten zu extrahieren, werden als Text Mining
        zusammengefasst.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-web-mining">Web
      Mining</styled-content></term>
      <def>
        <p>Unter Web Mining versteht man die Anwendung von Techniken des
        <xref alt="Data Mining" rid="glossary-data-mining">Data
        Mining</xref> zur Extraktion von Informationen aus dem World
        Wide Web. Das Web Mining ist ein Teilbereich des Data Minings
        und zählt zu einem der wichtigsten Anwendungsgebiete für das
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-wordcloud">Wordcloud</styled-content></term>
      <def>
        <p>Eine <italic>Wordcloud</italic>, oder auch Schlagwortwolke,
        ist eine Form der Informationsvisualisierung, beispielsweise von
        Worthäufigkeiten in einem Text oder einer Textsammlung. Dabei
        werden unterschiedlich gewichtete Wörter, wie die häufigsten
        Wörter, i.d.R. größer oder auf andere Weise hervorgehoben
        dargestellt. Die horizontale/vertikale Ausrichtung und die Farbe
        der dargestellten Wörter hat meistens allerdings keinen
        semantischen Mehrwert.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-xml">XML</styled-content></term>
      <def>
        <p>XML steht für <italic>Extensible Markup Language</italic> und
        ist eine Form von
        <xref alt="Markup Language" rid="glossary-markup-language">Markup
        Language</xref>, die sowohl computer- als auch menschenlesbar
        und hochgradig anpassbar ist. Dabei werden Textdateien
        hierarchisch strukturiert dargestellt und Zusatzinformationen i.
        d. R. in einer anderen Farbe als der eigentliche (schwarz
        gedruckte) Text dargestellt. Eine standardisierte Form von XML
        ist das <xref alt="TEI" rid="glossary-tei">TEI</xref>-XML.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-blassMethodenbeitragKorpusbildung2020">
    <mixed-citation>Bläß, Sandra. 2024. Methodenbeitrag: Korpusbildung.
    Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 2.
    Korpusbildung (12. Juni). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3708">10.48694/fortext.3708</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/korpusbildung">https://fortext.net/routinen/methoden/korpusbildung</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-fluhMethodenbeitragSentimentanalyse2019">
    <mixed-citation>Flüh, Marie. 2024a. Methodenbeitrag:
    Sentimentanalyse. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1,
    Nr. 7. Sentimentanalyse (7. Oktober). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3797">10.48694/fortext.3797</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/sentimentanalyse">https://fortext.net/routinen/methoden/sentimentanalyse</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-fluhToolbeitragSentText2020">
    <mixed-citation>———. 2024b. Toolbeitrag: SentText. Hg. von Evelyn
    Gius. <italic>forTEXT</italic> 1, Nr. 7. Sentimentanalyse (7.
    Oktober). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3799">10.48694/fortext.3799</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/senttext">https://fortext.net/tools/tools/senttext</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-lataczHomersIliasStudien2014">
    <mixed-citation>Latacz, Joachim. 2014. <italic>Homers Ilias. Studien
    zu Dichter, Werk und Rezeption</italic>. Hg. von Thierry Greub,
    Krystyna Greub-Fracz, und Arbogast Schmitt. Berlin, Boston: de
    Gruyter.
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1515/9783110306361">https://doi.org/10.1515/9783110306361</ext-link>
    (zugegriffen: 18. Mai 2020).</mixed-citation>
  </ref>
  <ref id="ref-remusSentiWSPubliclyAvailable2010">
    <mixed-citation>Remus, R., U. Quasthoff und G. Heyer. 2010. SentiWS
    - A Publicly Available German-language Resource for Sentiment
    Analysis. In: <italic>Proceedings of the Seventh International
    Conference on Language Resources and Evaluation (LREC’10)</italic>,
    1168–1171. Valetta, Malta: European Language Resources Association.
    <ext-link ext-link-type="uri" xlink:href="http://www.lrec-conf.org/proceedings/lrec2010/pdf/490_Paper.pdf">http://www.lrec-conf.org/proceedings/lrec2010/pdf/490_Paper.pdf</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-schmidtEvaluationLexiconbasedSentiment2018">
    <mixed-citation>Schmidt, Thomas und Manuel Burghardt. 2018. An
    Evaluation of Lexicon-based Sentiment Analysis Techniques for the
    Plays of Gotthold Ephraim Lessing. In: <italic>Proceedings of the
    Second Joint SIGHUM Workshop on Computational Linguistics for
    Cultural Heritage, Social Sciences, Humanities and
    Literature</italic>, 139–149. Santa Fe, New Mexico: Association for
    Computational Linguistics.</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
