<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3750</article-id>
<title-group>
<article-title>Lerneinheit: Manuelle Annotation mit
CATMA</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0001-8047-2232</contrib-id>
<name>
<surname>Horstmann</surname>
<given-names>Jan</given-names>
</name>
<email>dh@jan-horstmann.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Münster</institution>
</institution-wrap>
</aff>
</contrib-group>
<pub-date date-type="pub" publication-format="electronic" iso-8601-date="2024-08-07">
<day>7</day>
<month>8</month>
<year>2024</year>
</pub-date>
<volume>1</volume>
<issue>4</issue>
<issue-title>Manuelle Annotation</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 04.11.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/lerneinheiten/manuelle-annotation-mit-catma">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2019-11-04">
<day>04</day>
<month>11</month>
<year>2019</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 04.11.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/lerneinheiten/manuelle-annotation-mit-catma">fortext.net</ext-link></p>
<sec id="eckdaten-der-lerneinheit">
  <title>Eckdaten der Lerneinheit</title>
  <list list-type="bullet">
    <list-item>
      <p>Anwendungsbezug: Franz Kafkas <italic>Erstes Leid</italic>
      (1924)</p>
    </list-item>
    <list-item>
      <p>Methode: Digitale taxonomiebasierte manuelle
      <xref alt="Annotation" rid="glossary-annotation">Annotation</xref></p>
    </list-item>
    <list-item>
      <p>Angewendetes Tool: CATMA</p>
    </list-item>
    <list-item>
      <p>Lernziele: Erstellung eines CATMA-Accounts und eines
      CATMA-Projektes, Organisation von Ressourcen und Annotation eines
      Textes mit unterschiedlichen Kategorien</p>
    </list-item>
    <list-item>
      <p>Dauer der Lerneinheit: ca. 60–90 Minuten</p>
    </list-item>
    <list-item>
      <p>Schwierigkeitsgrad des Tools: leicht</p>
    </list-item>
  </list>
</sec>
<sec id="bausteine">
  <title>Bausteine</title>
  <list list-type="bullet">
    <list-item>
      <p>Anwendungsbeispiel: Welchen Text annotieren Sie mit welchen
      Kategorien? Annotieren Sie Kafkas Erzählung <italic>Erstes
      Leid</italic> anhand der „Distanz“-Kategorien aus
      (<xref alt="Martínez und Scheffel 2012" rid="ref-martinezEinfuhrungErzahltheorie2012" ref-type="bibr">Martínez
      und Scheffel 2012</xref>).</p>
    </list-item>
    <list-item>
      <p>Vorarbeiten: Was müssen Sie tun, bevor Sie annotieren können?
      Erfahren Sie, wie Sie ein CATMA-Projekt anlegen und Ihre
      Ressourcen im Tool verwalten.</p>
    </list-item>
    <list-item>
      <p>Funktionen: Welche Funktionen bieten Ihnen die CATMA-Projekte
      und das <italic>Annotate</italic>-Modul? Lernen Sie die einzelnen
      Komponenten des Tools kennen und lösen Sie Beispielaufgaben.</p>
    </list-item>
    <list-item>
      <p>Lösungen zu den Beispielaufgaben: Haben Sie die
      Beispielaufgaben richtig gelöst? Hier finden Sie Antworten.</p>
    </list-item>
  </list>
</sec>
<sec id="anwendungsbeispiel">
  <title>1. Anwendungsbeispiel</title>
  <p>In dieser Lerneinheit werden Sie in die grundlegenden
  Projektkoordinations- und Annotations-Funktionen des Tools CATMA
  (<xref alt="Schumacher 2024" rid="ref-schumacherToolbeitragCATMA2019" ref-type="bibr">Schumacher
  2024</xref>) eingeführt. CATMA (kurz für Computer Assisted Text Markup
  (vgl.
  <xref alt="Markup Language" rid="glossary-markup-language">Markup
  Language</xref>) and Analysis) ist ein webbasiertes (vgl.
  <xref alt="Webanwendung" rid="glossary-webanwendung">Webanwendung</xref>)
  und frei verfügbares (vgl.
  <xref alt="Open Access" rid="glossary-open-access">Open Access</xref>)
  Annotations-, Analyse- und Visualisierungstool für Texte. Das Tool
  eignet sich insbesondere für literaturwissenschaftliche
  Anwendungsfälle, kann aber auch für stärker formalisierte (bspw.
  linguistische) Annotationen verwendet werden. Unser Anwendungsbeispiel
  befasst sich mit einem erzähltheoretischen Phänomen: Anhand der späten
  Erzählung <italic>Erstes Leid</italic> (1924) von Franz Kafka werden
  Sie mit CATMA die Distanz der Erzählinstanz zum Erzählten anhand
  unterschiedlicher Rede- und Gedankenwiedergabeformen annotieren.
  Zugrunde liegt hierbei die Form der manuellen Annotation
  (<xref alt="Jacke 2024a" rid="ref-jackeMethodenbeitragManuelleAnnotation2018" ref-type="bibr">Jacke
  2024a</xref>), bei der Hervorhebungen oder Anmerkungen digital
  angebracht (und danach potentiell verfeinert und weiterverarbeitet)
  werden.</p>
</sec>
<sec id="vorarbeiten">
  <title>2. Vorarbeiten</title>
  <p>Zunächst besorgen Sie sich die digitale Version von Kafkas
  Erzählung <italic>Erstes Leid</italic>, die wir in dieser Lerneinheit
  annotieren wollen. Folgen Sie dazu
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://textgridrep.org/browse/-/browse/qmv7_0">diesem
  Link</ext-link> zum TextGrid Repository
  (<xref alt="Horstmann 2024" rid="ref-horstmannRessourcenbeitragTextGridRepository2018" ref-type="bibr">Horstmann
  2024</xref>) und klicken in der linken Leiste in der Sektion
  „Herunterladen“ auf
  „<xref alt="TEI" rid="glossary-tei">TEI</xref>-Corpus“ (vgl.
  <xref alt="Korpus" rid="glossary-korpus">Korpus</xref>;
  <xref alt="XML" rid="glossary-xml">XML</xref>) (siehe Abb. 1).</p>
  <fig>
    <caption><p>Abb. 1: Download des Textdigitalisats von Franz Kafkas
    „Erstes Leid“ im TextGrid Repository</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.1_Lerneinheit_Annotation_mit_CATMA_TextGrid_Repository_Download_p.png" />
  </fig>
  <p>Die heruntergeladene XML-Datei des Textes findet sich nun im
  Downloadordner Ihres Computers. Sie müssen diese nicht weiter
  bearbeiten, sondern können sie so, wie sie ist, später in CATMA
  hochladen.
  Gehen Sie als nächstes auf
  <ext-link ext-link-type="uri" xlink:href="https://catma.de">https://catma.de</ext-link>,
  um sich im Tool anzumelden (siehe Abb. 2). Auf der Webseite können Sie
  sich bei Interesse über die einzelnen Funktionskomplexe des Tools,
  seine Entwicklungsgeschichte oder die zugrundeliegende Philosophie des
  „undogmatischen“ Annotierens informieren. Außerdem gibt es Tutorials
  auf Englisch, ein Manual und die Möglichkeit, den Newsletter zu
  abonnieren. Der Newsletter informiert etwa über Workshopangebote oder
  Neuerungen im Tool (so sind beispielsweise eine vereinfachte
  Kommentarfunktion, ein kategorieloses Annotieren und weitere
  Visualisierungsmöglichkeiten geplant).</p>
  <fig>
    <caption><p>Abb. 2: Die CATMA-Webseite</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.2_Lernenheit_Annotation_mit_CATMA_Webseite_p_0.png" />
  </fig>
  <p>CATMA ist webbasiert und muss daher nicht lokal installiert werden.
  Sie benötigen lediglich eine stabile Internetverbindung. Klicken Sie
  jetzt auf „Work with CATMA 6“, um zu dieser Ansicht (vgl.
  <xref alt="GUI" rid="glossary-gui">GUI</xref>) zu gelangen:</p>
  <fig>
    <caption><p>Abb. 3: Die Sign-in-Seite von CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.3_Lerneinheit_Annotation_mit_CATMA-Signup-Login_p_neu.png" />
  </fig>
  <p>Sie haben nun zwei Möglichkeiten. Wenn Sie eine Googlemailadresse
  besitzen, können Sie diese zur <bold>Authentifizierung</bold> benutzen
  und direkt auf den Button „Sign in“ klicken und dann – nach
  Bestätigung der „terms of use“, die Sie dort verlinkt finden – auf
  „LOG IN WITH YOUR GOOGLE ACCOUNT“. CATMA nutzt lediglich Googles
  Authentifizierungsmechanismus und sonst nichts: Die von Ihnen
  hochgeladenen und im Tool erstellten Daten werden auf einen sicheren
  <xref alt="Server" rid="glossary-server">Server</xref> der Universität
  Hamburg geladen und können von keiner dritten Partei eingesehen
  werden. Sollten Sie lieber einen eigenen CATMA-Account erstellen
  wollen, klicken Sie zunächst auf den „Sign up“-Button und geben eine
  gültige Emailadresse ein. An diese Adresse erhalten Sie umgehend einen
  Aktivierungscode. Nach dem Klick auf den Link in der Email können Sie
  einen selbst gewählten Usernamen und ein Passwort eingeben. Mit diesen
  Daten können Sie sich in Zukunft durch Klick auf den „Sign in“-Button
  (siehe Abb. 3) bei CATMA anmelden.
  Nach dem Login landen Sie im <bold>Home-Bereich</bold> von CATMA
  (siehe Abb. 4). Hier können Sie neue Projekte anlegen oder – insofern
  Sie kollaborativ arbeiten, was wir in dieser Lerneinheit
  <italic>nicht</italic> tun – bestehenden Projekten beitreten. Oben
  rechts sollten Sie einmal auf „Edit Account“ klicken und ggf. Ihren
  Usernamen anpassen: Da CATMA die kollaborative Arbeit an Projekten
  ermöglicht, kann Ihr Username beim Teilen von Ressourcen als
  Suchvorschlag erscheinen. Um das Teilen von Ressourcen zu
  vereinfachen, empfiehlt es sich, Ihren Realnamen auch als Usernamen zu
  verwenden; prinzipiell können Sie hier jedoch selbst entscheiden. In
  jedem Fall sollte Ihr Username keine sensiblen Daten enthalten.</p>
  <fig>
    <caption><p>Abb. 4: CATMA-Startseite: Organisation von
    Projekten</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.4_Lerneinheit_Annotation_mit_CATMA_Home_und_Edit_Account_p.png" />
  </fig>
  <p>Als nächstes werden Sie ein <bold>Projekt</bold> für die Annotation
  von Kafkas Erzählung <bold>anlegen</bold>, indem Sie auf „CREATE NEW
  PROJECT“ klicken. Wenn Sie einen Projektnamen (wir haben uns hier für
  „forTEXT-Lerneinheit“ entschieden) und ggf. eine Beschreibung
  eingegeben haben, erscheint Ihr neu angelegtes Projekt auf der
  Startseite (siehe Abb. 5). Um zu einem späteren Zeitpunkt auf diese
  Startseite zurückzukehren und Ihre Projekte zu organisieren, klicken
  Sie einfach auf das oben links erscheinende Home-Symbol.</p>
  <fig>
    <caption><p>Abb. 5: Die CATMA-Startseite mit neu angelegtem
    Projekt</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.5_Lerneinheit_Annotation_mit_CATMA_Projects_p.png" />
  </fig>
  <p>Klicken Sie anschließend auf die Kachel, die Ihr neues Projekt
  anzeigt, betreten Sie das erste <bold>Modul</bold> in CATMA:
  „<bold><italic>Project</italic></bold>“. In welchem Modul Sie sich
  befinden, wird stets in der linken grauen Spalte angezeigt. Das
  <italic>Project</italic>-Modul zeigt Ihnen, welche Ressourcen in Ihrem
  Projekt enthalten sind, wer die Projektmitglieder sind und welche
  Rollen diese Mitglieder haben (siehe Abb. 6). Da wir im aktuellen
  Anwendungsbeispiel nicht kollaborativ arbeiten, werden in diesem Fall
  lediglich Sie als „Owner“ des Projektes angezeigt.</p>
  <fig>
    <caption><p>Abb. 6: Das <italic>Project</italic>-Modul in
    CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.6_Lerneinheit_Annotation_mit_CATMA_Project-Modul_und_Add_Document_p.png" />
  </fig>
  <p>Mit einem Klick auf das „+“-Symbol neben „Documents &amp;
  Annotations“ haben Sie die Möglichkeit, Ihrem Projekt die Erzählung
  <italic>Erstes Leid</italic> hinzuzufügen. Klicken Sie dazu auf
  „<bold>Add Document</bold>“.</p>
  <fig>
    <caption><p>Abb. 7: Dokumentupload in CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.7_Lerneinheit_Annotation_mit_CATMA_Wizzard_Dokumentupload_p.png" />
  </fig>
  <p>Es öffnet sich ein Fenster, in dem Sie auf „UPLOAD LOCAL FILE“
  klicken und in der Ordnerstruktur Ihres Computers nach der zuvor
  heruntergeladenen XML-Datei von Kafkas Erzählung suchen. CATMA
  verarbeitet alle gängigen Textdateiformate. Wenn Sie mehrere Dokumente
  auf einmal hochladen möchten, fassen Sie diese Dokumente zunächst in
  einem ZIP-Ordner (vgl. <xref alt="ZIP" rid="glossary-zip">ZIP</xref>)
  zusammen. CATMA wird den Ordner im Upload-Prozess wieder entpacken und
  jedes enthaltene Dokument einzeln anzeigen. Klicken Sie danach auf den
  „NEXT“-Button unten rechts. Die nächste Ansicht zeigt Ihnen dann eine
  Vorschau des hochzuladenden Textes (siehe Abb. 8). Der „File Type“ und
  das „Encoding“ in dieser Ansicht werden i. d. R. automatisch korrekt
  angezeigt. Sollte sich Veränderungsbedarf ergeben (was in dieser
  Lerneinheit nicht der Fall ist), können Sie diese beiden Felder durch
  Doppelklick bearbeiten.</p>
  <fig>
    <caption><p>Abb. 8: Preview des hochzuladenden Dokuments in
    CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.8_Lerneinheit_Annotation_mit_CATMA_Document_Preview_p.png" />
  </fig>
  <p>Nach einem Klick auf „NEXT“ gelangen Sie zu den
  Einstellungsmöglichkeiten für Sprache, die ebenfalls im Regelfall
  automatisch korrekt angezeigt werden sollte (siehe Abb. 9).
  Erfahrenere Nutzer*innen können unter „Advanced Options“ noch
  individuell bestimmen, welche Buchstabenabfolgen (wie etwa „z. B.“)
  vom System als einzelnes Wort behandelt werden sollen. Diese Option
  kann für die Lerneinheit vernachlässigt werden. Klicken Sie wieder auf
  „NEXT“.</p>
  <fig>
    <caption><p>Abb. 9: Spracheinstellungen im Dokument-Upload von
    CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.9_Lerneinheit_Annotation_mit_CATMA_Spracheinstellungen_p.png" />
  </fig>
  <p>Im letzten Fenster des Upload-Prozesses (siehe Abb. 10) haben Sie
  die Möglichkeit, Details zu dem hochgeladenen Dokument anzugeben. Dies
  ist insbesondere sinnvoll, wenn Sie mit mehreren Dokumenten arbeiten,
  die ggf. aus unterschiedlichen Editionen stammen. Das Fenster
  ermöglicht ihnen, auch später einen Überblick zu halten. Die einzelnen
  Felder können Sie per Doppelklick bearbeiten (klicken Sie danach auf
  „Save“).</p>
  <fig>
    <caption><p>Abb. 10: Dokument-Details bearbeiten im Upload-Prozess
    in CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.10_Lerneinheit_Annotation_mit_CATMA_Dokument-Details_p.png" />
  </fig>
  <p>Ein Klick auf den „FINISH“-Button rechts unten beendet den
  Upload-Prozess des Dokuments und Sie landen wieder im
  <italic>Project</italic>-Modul. Sie haben nun erfolgreich einen
  CATMA-Account und ein CATMA-Projekt angelegt sowie Ihren ersten Text
  hochgeladen.</p>
</sec>
<sec id="funktionen">
  <title>3. Funktionen</title>
  <p>Um annotieren zu können, fehlt Ihnen jetzt noch die Taxonomie der
  Kategorien, anhand derer der Text untersucht und annotiert werden
  soll. Solche Taxonomien heißen in CATMA <bold>Tagsets</bold> (vgl.
  <xref alt="Tagset" rid="glossary-tagset">Tagset</xref>). Sie erstellen
  ein Tagset, indem Sie auf das „+“-Zeichen klicken und einen Namen für
  das zu erstellende Tagset vergeben (wir haben uns hier für „Distanz
  (Erzählinstanz–Erzähltes)“ entschieden; siehe Abb. 11). Sie können
  Tagsets (wie auch Documents, Annotation Collections oder Members)
  jederzeit über die drei kleinen Punkte neben den „+“-Zeichen im
  <italic>Project</italic>-Modul bearbeiten.</p>
  <fig>
    <caption><p>Abb. 11: Erstellen eines Tagsets in CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.11_Lerneinheit_Annotation_mit_CATMA_Add_Tagset_p.png" />
  </fig>
  <p>Ein Doppelklick auf das erstellte Tagset in der entsprechenden
  Spalte im <italic>Project</italic>-Modul oder auch ein Klick auf
  „Tags“ in der linken Navigationsspalte erlaubt Ihnen, das Tagset im
  <bold><italic>Tags</italic>-Modul</bold> mit einzelnen Tags (d. h. den
  Annotationskategorien) auszustatten (siehe Abb. 12). Übrigens: Für die
  Navigation in CATMA brauchen Sie niemals die Vor- und Zurück-Buttons
  Ihres Browsers (vgl.
  <xref alt="Browser" rid="glossary-browser">Browser</xref>) zu
  bedienen, sondern sollten immer die entsprechenden Schaltflächen auf
  der linken Seite des CATMA-Fensters nutzen.</p>
  <fig>
    <caption><p>Abb. 12: Das <italic>Tags</italic>-Modul in
    CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.12_Lerneinheit_Annotation_mit_CATMA_Tags-Modul_p.png" />
  </fig>
  <p>Im <italic>Tags</italic>-Modul können Sie das eben erstellte Tagset
  auswählen und beliebig viele Kategorien hinzufügen; CATMA macht
  diesbezüglich keine Einschränkungen oder Vorschriften (auch deswegen
  nennt es sich „undogmatisch“). Für diese Lerneinheit haben wir uns für
  die von Martínez und Scheffel
  (<xref alt="2012, 65" rid="ref-martinezEinfuhrungErzahltheorie2012" ref-type="bibr">2012,
  65</xref>) in ihrer <italic>Einführung in die Erzähltheorie</italic>
  definierten Kategorien zur Analyse der sog. „Distanz“ entschieden, die
  im Wesentlichen auf unterschiedliche Rede- bzw.
  Gedankenwiedergabeformen zurückgeht. Die Leitfrage lautet dabei: Wie
  nah ist die Erzählinstanz sprachlich, gedanklich, ideologisch an der
  von ihr vermittelten ‚Welt‘ und ihren Figuren positioniert?
  Selbstverständlich könnte man die Erzählung auch nach allen möglichen
  anderen Kategorien untersuchen, wie beispielsweise Kategorien der
  künstlerischen Existenz und des Verständnisses von Kunst
  (<xref alt="Vollmer 1998" rid="ref-vollmerVerzweiflungArtistenFranz1998" ref-type="bibr">Vollmer
  1998</xref>), Kategorien des unzuverlässigen Erzählens
  (<xref alt="Gaasland 2012" rid="ref-gaaslandPracticalReasoningDemarcated2012" ref-type="bibr">Gaasland
  2012</xref>) oder auch Emotionskategorien, um die Erzählung einer
  Sentimentanalyse
  (<xref alt="Flüh 2024" rid="ref-fluhMethodenbeitragSentimentanalyse2019" ref-type="bibr">Flüh
  2024</xref>) im Sinne eines Close Readings (vgl.
  <xref alt="Close Reading" rid="glossary-close-reading">Close
  Reading</xref>) zu unterziehen etc. Für viele dieser Ansätze ließen
  sich analog zu den hier ausgewählten Distanzkategorien mehr oder
  weniger hierarchisch organisierte Taxonomien in Form von Tagsets
  entwickeln. Sowohl in Bezug auf die <italic>gesprochene Rede</italic>
  als auch auf die <italic>Gedankenrede</italic> unterscheiden Martínez
  und Scheffel
  (<xref alt="2012" rid="ref-martinezEinfuhrungErzahltheorie2012" ref-type="bibr">2012</xref>)
  drei Kategorien: die <italic>erzählte</italic>, die
  <italic>transponierte</italic> und die <italic>zitierte Rede</italic>.
  Diese drei Unterkategorien haben noch weitere Unterkategorien, die
  jedoch für die hier zu vollziehende Übung nicht weiter
  ausdifferenziert werden müssen. Die weiteren Unterkategorien sind
  „Erwähnung des sprachlichen Akts“, „Gesprächsbericht“ bzw.
  „Bewusstseinsbericht“ für die Kategorie der erzählten Rede, „indirekte
  Rede“, „erlebte Rede“ für die Kategorie der transponierten Rede und
  „direkte Rede“, „autonome direkte Rede“ bzw. „Gedankenzitat“ und
  „innerer Monolog“ für die Kategorie der zitierten Rede; vgl. Martínez
  und Scheffel
  (<xref alt="2012, 65" rid="ref-martinezEinfuhrungErzahltheorie2012" ref-type="bibr">2012,
  65</xref>). Aus diesen Kategorien lässt sich nun leicht ein Tagset
  entwerfen, wie es in Abb. 12 beispielhaft geschehen ist. Wählen Sie
  das Tagset aus, klicken oben rechts auf das „+“-Symbol und dann auf
  „Add Tag“. So erstellen Sie die beiden Tags „gesprochene Rede“ und
  „Gedankenrede“ (siehe Abb. 13). Um die jeweiligen Unterkategorien zu
  erstellen, wählen Sie den entsprechenden Tag aus und klicken dann oben
  rechts auf „Add Subtag“ und die neu erstellten Kategorien erscheinen
  eine Hierarchieebene weiter eingerückt.</p>
  <fig>
    <caption><p>Abb. 13: Erstellen eines Tags in CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.13_Lerneinheit_Annotation_mit_CATMA_Add_Tag_p.png" />
  </fig>
  <p>Sie können potentiell auf diese Art und Weise so viele Tags auf so
  vielen Ebenen erstellen wie Sie möchten – nur die Übersichtlichkeit
  und praktische Handhabbarkeit setzen Ihnen hier Grenzen. Auch die
  Farben der einzelnen Kategorien können Sie frei wählen. Und: Tagsets
  und einzelne Tags können später im Annotationsprozess jederzeit
  editiert und erweitert werden.</p>
  <p><bold><italic>Aufgabe 1</italic></bold>: Bauen Sie das Tagset wie
  in Abb. 12 angezeigt nach. Was könnten Ihrer Meinung nach die Vor- und
  Nachteile bzw. Gefahren von Konzeptrepräsentationen im Sinne
  formalisierter Taxonomien in Form von Tagsets sein?</p>
  <p>In CATMA ist die Unterscheidung zwischen <bold>Tags</bold> und
  <bold>Annotationen</bold> grundlegend. Ähnlich wie in der
  linguistischen Unterscheidung von <bold>Tagsets</bold> bezeichnen Tags
  jeweils die generelle Kategorie und Annotationen die spezifischen
  Vorkommnisse dieser Kategorie im Text. Neben den text-unspezifischen
  Taxonomien, wie sie durch Tagsets abgebildet werden, wollen wir jetzt
  textspezifische Annotationen mithilfe dieser Kategorien erstellen.
  Eine technische Besonderheit von CATMA ist, dass Annotationen nicht
  direkt im Textdokument gespeichert werden (sog. <italic>inline
  Markup</italic>), sondern in einer mit dem Originaltextdokument
  verknüpften Datenbank abgelegt werden (sog. <italic>external stand-off
  Markup</italic>). Diese Datenbank erfasst alle Annotationen aller
  Nutzer*innen, die sich auf das jeweilige Dokument beziehen. So kann
  erstens ein und derselbe Text von beliebig vielen Annotator*innen und
  mit beliebig vielen Taxonomien ausgezeichnet werden. Diese
  kollaborativ erstellte Gesamtmenge aller Annotationen kann man dann
  zweitens bei späteren Suchabfragen (vgl.
  <xref alt="Query" rid="glossary-query">Query</xref>) nutzen. Um beides
  technisch zu ermöglichen, werden Annotationen in einer sog.
  <bold><italic>Annotation Collection</italic></bold> gespeichert, die
  jeweils einem spezifischen Text und einer Person zugeordnet ist.
  Es gibt in CATMA mehrere Möglichkeiten, Annotation Collections zu
  erstellen: Sie können beispielsweise zum
  <italic>Project</italic>-Modul zurückkehren und in der
  „Documents“-Spalte Ihrem Dokument eine Annotation Collection
  hinzufügen. Das funktioniert aber auch während des eigentlichen
  Annotationsprozesses, wie wir es auch in dieser Lerneinheit tun.
  Klicken Sie daher nun in der linken Navigationsspalte auf „Annotate“,
  um das <bold><italic>Annotate</italic>-Modul</bold> (siehe Abb. 14) zu
  betreten.</p>
  <fig>
    <caption><p>Abb. 14: Das <italic>Annotate</italic>-Modul in CATMA
    mit geöffnetem Tagset</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.14_Lerneinheit_Annotation_mit_CATMA_Annotate1_p.png" />
  </fig>
  <p>Oben rechts im „Collection“-Feld haben Sie die Möglichkeit, mit
  einem Klick auf das „+“-Symbol Ihre eigene Annotation Collection zu
  erstellen (siehe Abb. 15). Da Annotation Collections sowohl text- als
  auch personenspezifisch sind, empfiehlt es sich, diesen Bezug bei der
  Benennung Ihrer Annotation Collection explizit zu machen.</p>
  <fig>
    <caption><p>Abb. 15: Erstellen einer Annotation Collection in
    CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.15_Lerneinheit_Annotation_mit_CATMA_Add_Annotation_Collection_p.png" />
  </fig>
  <p>Nach einem Klick auf „OK“ haben Sie alles, was benötigt wird, und
  können nun mit dem eigentlichen <bold>Annotieren</bold> beginnen.</p>
  <p>Um ein Wort oder eine Textpassage zu annotieren, markieren Sie
  zunächst den entsprechenden Abschnitt, sodass er blau hinterlegt ist.
  Jetzt gibt es zwei Möglichkeiten:</p>
  <list list-type="order">
    <list-item>
      <p>Klicken Sie auf die gewünschte Kategorie im Tagset auf der
      rechten Seite. Die Annotation wird in der Farbe des ausgewählten
      Tags als Unterstreichung erscheinen (siehe Abb. 16).</p>
    </list-item>
    <list-item>
      <p>Alternativ können Sie auch mit rechts in das Textfeld klicken.
      Es öffnet sich dort ein komprimiertes Menü Ihres Tagsets, aus dem
      Sie den entsprechenden Tag auswählen können (siehe Abb. 17).</p>
    </list-item>
  </list>
  <fig>
    <caption><p>Abb. 16: Das Annotate-Modul in CATMA mit erstellten
    Annotationen</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.16_Lerneinheit_Annotation_mit_CATMA_Annotate2_p.png" />
  </fig>
  <fig>
    <caption><p>Abb. 17: Erstellen einer Annotation mit Rechtsklick in
    CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.17_Lerneinheit_Annotation_mit_CATMA_Annotate_Rechtsklick_p.png" />
  </fig>
  <p>Es gibt keine Begrenzung, wie viele Annotationen Sie vergeben
  können oder wie lang eine Annotation sein soll. Auch können Sie ein
  und dieselbe Textstelle mit unterschiedlichen Kategorien belegen und
  Annotationen können einander auch überlappen. Wenn sie voneinander
  getrennte Passagen mit einer einzigen Annotation belegen wollen (wie
  etwa „rief ihm etwas […] zu“), gibt es die Möglichkeit, unterhalb des
  Textfeldes die Option „Allow multiple discontinuous selections“
  (rechts neben dem Zoom-Slider; siehe Abb. 17) zu aktivieren. Der
  Slider bestimmt die Seitengröße, so ist es beispielsweise möglich,
  entweder den gesamten Text auf einer Seite scrollbar anzeigen zu
  lassen (Slider auf 100) bzw. einzelne Seiten zu erzeugen, die Sie dann
  mit den entsprechenden Schaltflächen durchblättern können.
  Haben Sie eine <bold>Annotation</bold> irrtümlich gesetzt und möchten
  sie wieder <bold>löschen</bold>, klicken Sie einfach die entsprechende
  Annotation im Textfeld an. Unten rechts erscheint ein Fenster mit
  „Selected Annotations“, in dem Sie die Möglichkeit haben, mit Klick
  auf das kleine Mülltonnen-Symbol die ausgewählte Annotation wieder zu
  löschen.</p>
  <p><bold><italic>Aufgabe 2</italic></bold>: Lesen Sie die Erzählung
  <italic>Erstes Leid</italic> am Bildschirm und annotieren Sie
  Passagen, die zu den gegebenen Distanz-Kategorien passen. Was ist in
  Bezug auf die vergebenen Kategorien auffällig? Was sind Vor- und
  Nachteile eines solchen digital gestützten Annotationsprozesses?</p>
  <p>Sie werden im Annotationsprozess bemerkt haben, dass Sie sich in
  einigen Fällen sehr sicher sind, wie etwas annotiert werden muss, in
  anderen aber zumindest Diskussionsbedarf bestünde (Ist z. B. die
  Erwähnung, dass der Trapezkünstler träumt, bereits ein
  Gedankenbericht?). Um derlei Abwägungen ebenfalls in den Metadaten,
  d. h. den Annotationen sichtbar machen zu können, bietet CATMA die
  Möglichkeit, sog. <bold>Tagsets</bold> (vgl.
  <xref alt="Tagset" rid="glossary-tagset">Tagset</xref>) und ggf.
  <bold><italic>Values</italic></bold> zu vergeben. Properties (=
  Eigenschaften) ermöglichen, das tendenziell deklarativ organisierte
  Annotieren mit Tags um ein skalares Konzept qualitativer Bewertungen
  zu erweitern, d. h. um Kategorien, die auf unterschiedlichsten Ebenen
  des Tagsets auftauchen können. So ließen sich beispielsweise jedem Tag
  die Properties „<bold>Sicherheit</bold>“ oder auch
  „<bold>Wichtigkeit</bold>“ etc. hinzufügen. Ist eine solche Property
  einem Tag zugeordnet, wird das System Sie nach jeder Vergabe des
  entsprechenden Tags nach dieser Property, also nach der Sicherheit,
  Wichtigkeit etc. der gesetzten Annotation, fragen. Hier könnten Sie
  jetzt sog. „ad hoc values“ vergeben, die näher beschreiben, wie sicher
  eine Annotationsentscheidung war. Es ist auch möglich, bereits vorab
  zu bestimmen, welche Values bei einer bestimmten Property ausgewählt
  werden können. Im Falle der „Sicherheits“-Property könnten Sie
  beispielsweise eine Skala von 1 bis 5 vorgeben, sodass die
  Sicherheiten der einzelnen Annotationen am Ende tatsächlich
  vergleichbar und damit messbar gemacht werden. Dies alles liegt in
  Ihrem eigenen Ermessen und orientiert sich an den Bedarfen Ihres
  jeweiligen Annotationsprojektes.
  Properties können Sie ebenfalls im <italic>Tags</italic>-Modul
  vergeben. Wählen Sie dazu einen Tag aus und klicken oben beim
  „+“-Symbol auf „Add Property“. Im sich öffnenden Fenster vergeben Sie
  einen Property-Namen, klicken auf die Schaltfläche „ADD PROPERTY“ und
  vergeben dann ggf. dazugehörige (durch Kommata separierte) Values
  (siehe Abb. 18). Mit einem Klick auf „OK“ werden die Properties und
  Values erstellt.</p>
  <fig>
    <caption><p>Abb. 18: Hinzufügen einer <italic>Property</italic> und
    entsprechenden <italic>Values</italic> zu einem Tag in
    CATMA</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.18_Lerneinheit_Annotation_mit_CATMA_Add_Property_p_neu.png" />
  </fig>
  <p>Es ist zudem möglich, die Property-Funktion für
  <bold>Freitextkommentare</bold> zu nutzen. Vergeben Sie dafür einfach
  eine Property mit dem Namen „Kommentar“ für diejenigen Tags, bei denen
  Sie Kommentarbedarf sehen. Bei Vergabe einer entsprechenden Annotation
  wird künftig nach dieser Property gefragt und Sie haben die
  Möglichkeit, im Value-Feld einen annotationsspezifischen Kommentar zu
  hinterlassen, der bspw. Ihre Annotationsentscheidung näher erläutert
  oder rechtfertigt. Derlei Kommentare können auch für einen selbst eine
  wertvolle Gedächtnisstütze für spätere Annotations- oder
  Analysedurchgänge bilden.</p>
  <p><bold><italic>Aufgabe 3</italic></bold>: Gehen Sie Ihre
  Annotationen noch einmal durch und vergeben Sie Properties und Values.
  Sie können die in dieser Lerneinheit bereits vorgeschlagenen
  Kategorien („Sicherheit“, „Wichtigkeit“, „Kommentar“) nutzen, oder
  auch jede weitere Form von Property erstellen, die Ihnen wichtig
  erscheint. Welche Textstellen bedürfen für die Annotation der weiteren
  Diskussion? Welche weiteren Properties bieten sich an?</p>
  <p><italic>Tipp</italic>: Wenn Sie in einem CATMA-Projekt mit mehreren
  Texten, mehreren Tagsets oder auch mehreren Annotation Collections
  arbeiten (Letzteres ist insbesondere bei der kollaborativen Annotation
  (<xref alt="Jacke 2024b" rid="ref-jackeMethodenbeitragKollaborativesLiteraturwissenschaftliches2018" ref-type="bibr">Jacke
  2024b</xref>) der Fall, die in dieser Lerneinheit ausgespart wurde),
  hilft Ihnen die Lasche im <italic>Annotate</italic>-Modul, einen
  Übersicht zu behalten (siehe Abb. 19). Klicken Sie links auf die
  Lasche, um sie zu öffnen, wählen Sie die gewünschten Texte, Annotation
  Collections und Tagsets aus und schließen die Lasche wieder.</p>
  <fig>
    <caption><p>Abb. 19: Die Lasche in CATMAs
    <italic>Annotate</italic>-Modul zur Organisation von Dokumenten,
    Annotation Collections und Tagsets</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Abb.19_Lerneinheit_Annotation_mit_CATMA_Lasche_Annotate_p.png" />
  </fig>
  <p>Wie Sie die von Ihnen dem Text als Metadaten hinzugefügten
  Annotationen zusammen mit den Textdaten analysieren und visualisieren
  können, werden wir Ihnen in der nächsten Lerneinheit erklären.</p>
</sec>
<sec id="lösungen-zu-den-beispielaufgaben">
  <title>4. Lösungen zu den Beispielaufgaben</title>
  <p><bold><italic>Aufgabe 1</italic></bold>: Bauen Sie das Tagset, wie
  in Abb. 12 angezeigt, nach. Was könnten Ihrer Meinung nach die Vor-
  und Nachteile bzw. Gefahren von Konzeptrepräsentationen im Sinne
  formalisierter Taxonomien in Form von Tagsets sein?</p>
  <p>Entwickeln Sie selbst basierend auf einem konkreten Analyseansatz
  oder einer Theorie ein Tagset, werden Sie merken, dass man schnell
  dazu neigt, zu viele Kategorien anzulegen. Es kann dann schwierig
  werden, beim eigentlichen Annotationsprozess den Überblick über das
  eigene Tagset und sämtliche zur Verfügung stehenden Tags im Kopf zu
  behalten. Häufig macht die Formalisierung von Konzepten in Form von
  Taxonomien aber auch recht unmittelbar auf Doppelungen, Lücken oder
  Ungenauigkeiten in der eigenen Taxonomie aufmerksam. Nicht selten kann
  man mehrere Tags einer Oberkategorie hinzufügen, wodurch sie an
  anderer Stelle vielleicht obsolet werden, sodass eine Reduktion des
  Tagsets nicht nur die Übersichtlichkeit wieder herstellt, sondern auch
  für eine präzisere Organisation der gesamten Taxonomie sorgt.
  Ihnen wird auch auffallen, dass die Erzeugung von Tagkategorien vor
  dem Hintergrund der konkreten Anwendung an Textpassagen bewusst macht,
  dass jeder Kategorie sehr genaue Definitionen zugrunde liegen sollten,
  damit – auch Ihnen selbst – klar wird, wie und wann der jeweilige Tag
  anzuwenden ist. Die Hierarchisierung einzelner Tags passt zudem zu
  einigen literaturwissenschaftlichen Ansätzen besser (wie etwa dem
  Formalismus oder Strukturalismus) als zu anderen (wie etwa der
  Dekonstruktion). Dass Tagsets in CATMA nicht notwendigerweise
  hierarchisch organisiert werden müssen, schafft diesem Problem
  Abhilfe. Auf derselben Hierarchieebene angesiedelte Tags werden in
  CATMA zwar immer noch horizontal untereinander angezeigt, dennoch
  können sie beispielsweise eine rhizomatische Konzeptorganisation
  simulieren. Eine allgemeine Gefahr der Formalisierung von Konzepten in
  Form von Tagsets könnte sein, dass (möglicherweise bewusste)
  Uneindeutigkeiten in der eigenen Taxonomie schwerer darstellbar sind,
  da die tabellarische Darstellung zu einer Verdeutlichung zwingt, die
  gelegentlich mit einer Simplifizierung des Analysekonzeptes selbst
  einhergehen könnte.</p>
  <p><bold><italic>Aufgabe 2</italic></bold>: Lesen Sie die Erzählung
  <italic>Erstes Leid</italic> am Bildschirm und annotieren Sie
  Passagen, die zu den gegebenen Distanz-Kategorien passen. Was ist in
  Bezug auf die vergebenen Kategorien auffällig? Was sind Vor- und
  Nachteile eines solchen digital gestützten Annotationsprozesses?</p>
  <p>Es ist auffällig, dass zu Beginn des Textes keine der gegebenen
  Distanz-Kategorien angewendet werden kann. Schließlich finden sich
  Gesprächsberichte (erzählte Rede), die durch indirekte und erlebte
  Rede abgelöst werden (geringere Distanz). Direkte Rede
  (<xref alt="Martínez und Scheffel 2012" rid="ref-martinezEinfuhrungErzahltheorie2012" ref-type="bibr">Martínez
  und Scheffel 2012</xref>) („dramatischer Modus“) findet sich nur ein
  einziges Mal, wenn das Leid des Trapezkünstlers am größten ist: „Nur
  diese eine Stange in den Händen – wie kann ich denn leben!“ (übrigens
  gekoppelt mit dem einzigen Ausrufungszeichen des Textes). Anschließend
  folgen indirekte Gedankenwiedergaben und Bewusstseinsberichte (des
  Impresarios) – die Distanz wird also wieder größer. Die
  Distanz-Entwicklung des gesamten Textes ließe sich folglich als
  Zoom-in und anschließenden Zoom-out beschreiben, wobei im Moment der
  geringsten Distanz der Ursprung des „Erste[n] Leid[s]“ liegt. Der
  literarische Text entzieht sich gelegentlich den gegebenen
  Analysekategorien. An diesen Stellen ist nicht klar, ob beispielsweise
  Gedanken repräsentiert werden oder ob Werturteile auf Gedanken
  (wessen?) bzw. Gesprächen basieren. Je direkter die Form der
  Gedanken-/Redewiedergabe ist, desto unproblematischer lassen sich die
  Tags vergeben. Wird die Distanz der Erzählinstanz zum Erzählten jedoch
  größer (insbesondere bei der bloßen Erwähnung eines sprachlichen Aktes
  oder Gedankens), kann es zu Entscheidungsschwierigkeiten kommen.
  Man könnte weitere Kategorien und Unterkategorien (sog. Subtags)
  vergeben, um eine genauere Annotation zu ermöglichen. Die Gefahr dabei
  ist, ein unübersichtlich großes Tagset zu erstellen, dessen
  analytische Aussagekraft immer in seiner Differenzierbarkeit begründet
  liegt. Der große Vorteil ist, dass der Prozess systematisiert wird.
  Anmerkungen von potentiell mehreren Benutzer*innen werden mit dem Text
  verknüpft und so nachhaltig und analysierbar gemacht.</p>
  <p><bold><italic>Aufgabe 3</italic></bold>: Gehen Sie Ihre
  Annotationen noch einmal durch und vergeben Sie Properties und Values.
  Sie können die in dieser Lerneinheit bereits vorgeschlagenen
  Kategorien („Sicherheit“, „Wichtigkeit“, „Kommentar“) nutzen, oder
  auch jede weitere Form von Property erstellen, die Ihnen wichtig
  erscheint. Welche Textstellen bedürfen für die Annotation der weiteren
  Diskussion? Welche weiteren Properties bieten sich an?</p>
  <p>Textstellen zur weiteren Diskussion in Bezug auf Distanzkategorien
  könnten sein:</p>
  <list list-type="order">
    <list-item>
      <p>„und wenn in der wärmeren Jahreszeit in der ganzen Runde der
      Wölbung die Seitenfenster aufgeklappt wurden und mit der frischen
      Luft die Sonne mächtig in den dämmernden Raum eindrang, dann war
      es dort sogar schön“</p>
    </list-item>
    <list-item>
      <p>„der Trapezkünstler lag im Gepäcknetz und träumte“</p>
    </list-item>
    <list-item>
      <p>„Da fing der Trapezkünstler plötzlich zu weinen an“</p>
    </list-item>
    <list-item>
      <p>„da er keine Antwort bekam“</p>
    </list-item>
  </list>
  <p>zu 1) Auf wessen Wahrnehmung bzw. Gedanken beruht das Urteil
  „schön“? Wird hier bereits auf einen Gedankengang des Trapezkünstlers
  verwiesen, sodass von einem Bewusstseinsbericht die Rede sein könnte?
  Auch innerhalb der Unterkategorie Bewusstseinsbericht lassen sich
  demnach noch unterschiedliche Distanzen ausmachen. Entscheiden Sie
  sich dazu, diese Passage mit dem Gedankenrede-Tag „erzählte Rede“ zu
  annotieren, sollten Sie diese Abwägungen durch einen niedrigen Wert
  des „Sicherheits“-Propertys verdeutlichen.</p>
  <p>zu 2) Ähnlich wie bei (1) ist hier nicht klar, ob mit der Erwähnung
  des Träumens Bewusstsein berichtet wird: Diskussionen über
  Traumtheorien, das Bewusste, Unbewusste, Halb-Bewusste, Unterbewusste
  etc. könnten sich anschließen. Auch hier könnte die Unsicherheit durch
  einen niedrigen Wert des „Sicherheit“-Propertys verdeutlicht
  werden.</p>
  <p>zu 3) Das Weinen als Reaktion setzt ein Bewusstsein voraus, auf das
  hier indirekt Bezug genommen wird. Wenn Sie sich entschließen, den
  entsprechenden Tag zu vergeben, bietet es sich an, Ihre Entscheidung
  in einem Kommentar zu dokumentieren.</p>
  <p>zu 4) Wie geht man mit Textpassagen um, die das Nichtvorhandensein
  von gesprochener Rede oder Gedankenrede explizit hervorheben? Für die
  angeführte Stelle könnte man einen weiteren Tag erstellen („Schweigen“
  o. ä.) und sie entsprechend annotieren. Die Schwierigkeit weist jedoch
  auf ein größeres Problem hin, das in den Digital Humanities bislang
  nicht geklärt wurde, für die Literaturwissenschaften aber ganz
  entscheidend ist: Wie kann im Text etwas annotiert werden, das nicht
  da ist?</p>
  <p>Weitere Properties könnten etwa sein, wer in einem Gespräch die
  Gesprächspartner sind oder wessen Gedanken wiedergegeben werden.</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>CATMA:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://catma.de">https://web.archive.org/save/https://catma.de</ext-link>
      (Letzter Zugriff: 03.07.2024)</p>
    </list-item>
    <list-item>
      <p>Digitale Version von Kafkas Erzählung <italic>Erstes
      Leid</italic> auf TextGrid:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://textgridrep.org/browse/-/browse/qmv7_0">https://web.archive.org/save/https://textgridrep.org/browse/-/browse/qmv7_0</ext-link>
      (Letzter Zugriff: 03.07.2024)</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-close-reading">Close
      Reading</styled-content></term>
      <def>
        <p>Close Reading bezeichnet die sorgfältige Lektüre und
        Interpretation eines einzelnen oder weniger Texte. Close Reading
        ist in der digitalen Literaturwissenschaft außerdem mit der
        manuellen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        textueller Phänomene verbunden (vgl. auch
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref> als Gegenbegriff).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-commandline">Commandline</styled-content></term>
      <def>
        <p>Die Commandline (engl. <italic>command line
        interface</italic> (CLI)), auch Kommandozeile, Konsole, Terminal
        oder Eingabeaufforderung genannt, ist die direkteste Methode zur
        Interaktion eines Menschen mit einem Computer. Programme ohne
        eine grafische Benutzeroberfläche
        (<xref alt="GUI" rid="glossary-gui">GUI</xref>) werden i. d. R.
        durch Texteingabe in die Commandline gesteuert. Um die
        Commandline zu öffnen, klicken Sie auf Ihrem Mac „cmd“ +
        „space“, geben „Terminal“ ein und doppelklicken auf das
        Suchergebnis. Bei Windows klicken Sie die Windowstaste + „R“,
        geben „cmd.exe“ ein und klicken Enter.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-distant-reading">Distant
      Reading</styled-content></term>
      <def>
        <p>Distant Reading ist ein Ansatz aus den digitalen
        Literaturwissenschaften, bei dem computationelle Verfahren auf
        häufig große Mengen an Textdaten angewandt werden, ohne dass die
        Texte selber gelesen werden. Meist stehen hier quantitative
        Analysen im Vordergrund, es lassen sich jedoch auch qualitative
        <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>
        quantitativ vergleichen. Als Gegenbegriff zu
        <xref alt="Close Reading" rid="glossary-close-reading"><italic>Close
        Reading</italic></xref> wurde der Begriff insbesondere von
        Franco Moretti (2000) geprägt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-feature">Feature</styled-content></term>
      <def>
        <p>Unter Features können Einzelfunktionen eines Tools verstanden
        werden, die beispielsweise komplexe Funktionen wie die
        Visualisierung eines Textes als
        <xref alt="Wordcloud" rid="glossary-wordcloud">Wordcloud</xref>
        ermöglichen, oder auch kleinere Funktionseinheiten wie den
        Abgleich einzelner Spracheigenschaften
        (<xref alt="Properties" rid="glossary-property">Properties</xref>)
        mit
        <xref alt="annotierten" rid="glossary-annotation">annotierten</xref>
        Beispieltexten darstellen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-gui">GUI</styled-content></term>
      <def>
        <p>GUI steht für <italic>Graphical User Interface</italic> und
        bezeichnet eine grafische Benutzeroberfläche. Ein GUI ermöglicht
        es, Tools mithilfe von grafischen Schaltflächen zu bedienen, um
        somit beispielsweise den Umgang mit der
        <xref alt="Commandline" rid="glossary-commandline">Commandline</xref>
        zu umgehen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-korpus">Korpus</styled-content></term>
      <def>
        <p>Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural
        für „das Korpus“) sind typischerweise nach Textsorte, Epoche,
        Sprache oder Autor*in zusammengestellt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup">Markup
      (Textauszeichung)</styled-content></term>
      <def>
        <p>Die Textauszeichnung (eng. <italic>Markup</italic>) fällt in
        den Bereich der Daten- bzw. Textverarbeitung, genauer in das
        Gebiet der Textformatierung, welche durch
        <xref alt="Auszeichnungssprachen" rid="glossary-markup-language">Auszeichnungssprachen</xref>
        wie <xref alt="XML" rid="glossary-xml">XML</xref> implementiert
        wird. Dabei geht es um die Beschreibung, wie einzelne Elemente
        eines Textes beispielsweise auf Webseiten grafisch dargestellt
        werden sollen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z.B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-open-access">Open
      Access</styled-content></term>
      <def>
        <p>Open Access bezeichnet den freien Zugang zu
        wissenschaftlicher Literatur und anderen Materialien im
        Internet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic> , oder
        „Wortart“ auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-property">Property</styled-content></term>
      <def>
        <p>Property steht für „Eigenschaft“, „Komponente“ oder
        „Attribut“. In der automatischen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        dienen konkrete Worteigenschaften wie Groß- und Kleinschreibung
        zur Klassifizierung von Wörtern oder Phrasen. Durch die
        Berücksichtigung solcher Eigenschaften in den
        <xref alt="Features" rid="glossary-feature">Features</xref>
        eines Tools kann
        <xref alt="maschinelles Lernen" rid="glossary-machine-learning">maschinelles
        Lernen</xref> bestimmter Phänomene umgesetzt werden. In der
        manuellen Annotation können als Properties auch Eigenschaften
        von
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        benannt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-query">Query</styled-content></term>
      <def>
        <p><italic>Query</italic> bedeutet „Abfrage“ oder „Frage“ und
        bezeichnet eine computergestützte Abfrage zur Analyse eines
        Textes. Um Datenbestände zu durchsuchen, werden Abfragesprachen
        eingesetzt, die <italic>Queries</italic> (Anfragen) an den
        Datenbestand senden. So bilden alle möglichen Queries zusammen
        die <italic>Query Language</italic> eines Tools.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-server">Server</styled-content></term>
      <def>
        <p>Ein Server kann sowohl hard- als auch softwarebasiert sein.
        Ein hardwarebasierter Server ist ein Computer, der in ein
        Rechnernetz eingebunden ist und der so Ressourcen über ein
        Netzwerk zur Verfügung stellt. Ein softwarebasierter Server
        hingegen ist ein Programm, das einen spezifischen Service
        bietet, welcher von anderen Programmen (Clients) lokal oder über
        ein Netzwerk in Anspruch genommen wird.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-tagset">Tagset</styled-content></term>
      <def>
        <p>Ein Tagset definiert die Taxonomie, anhand derer
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        in einem Projekt erstellt werden. Ein Tagset beinhaltet immer
        mehrere Tags und ggf. auch Subtags. Ähnlich der
        <xref alt="Type/Token" rid="glossary-type-token">Type/Token</xref>
        -Differenz in der Linguistik sind Tags deskriptive Kategorien,
        wohingegen Annotationen die einzelnen Vorkommnisse dieser
        Kategorien im Text sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-tei">TEI</styled-content></term>
      <def>
        <p>Die <italic>Text Encoding Initiative</italic> (TEI) ist ein
        Konsortium, das gemeinsam einen Standard für die Darstellung von
        Texten in digitaler Form entwickelt. Die TEI bietet
        beispielsweise Standards zur Kodierung von gedruckten Werken und
        zur Auszeichnung von sprachlichen Informationen in
        maschinenlesbaren Texten (siehe auch
        <xref alt="XML" rid="glossary-xml">XML</xref> und
        <xref alt="Markup" rid="glossary-markup">Markup</xref>).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-webanwendung">Webanwendung</styled-content></term>
      <def>
        <p>Eine webbasierte Anwendung ist ein Anwendungsprogramm,
        welches eine Webseite als Schnittstelle oder Front-End
        verwendet. Im Gegensatz zu klassischen Desktopanwendungen werden
        diese nicht lokal auf dem Rechner der Nutzer*innen installiert,
        sondern können von jedem Computer über einen
        <xref alt="Webbrowser" rid="glossary-browser">Webbrowser</xref>
        „online“ genutzt werden. Webanwendungen erfordern daher kein
        spezielles Betriebssystem.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-wordcloud">Wordcloud</styled-content></term>
      <def>
        <p>Eine <italic>Wordcloud</italic> , oder auch Schlagwortwolke,
        ist eine Form der Informationsvisualisierung, beispielsweise von
        Worthäufigkeiten in einem Text oder einer Textsammlung. Dabei
        werden unterschiedlich gewichtete Wörter, wie die häufigsten
        Wörter, i.d.R. größer oder auf andere Weise hervorgehoben
        dargestellt. Die horizontale/vertikale Ausrichtung und die Farbe
        der dargestellten Wörter hat meistens allerdings keinen
        semantischen Mehrwert.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-xml">XML</styled-content></term>
      <def>
        <p>XML steht für <italic>Extensible Markup Language</italic> und
        ist eine Form von
        <xref alt="Markup Language" rid="glossary-markup-language">Markup
        Language</xref>, die sowohl computer- als auch menschenlesbar
        und hochgradig anpassbar ist. Dabei werden Textdateien
        hierarchisch strukturiert dargestellt und Zusatzinformationen i.
        d. R. in einer anderen Farbe als der eigentliche (schwarz
        gedruckte) Text dargestellt. Eine standardisierte Form von XML
        ist das <xref alt="TEI" rid="glossary-tei">TEI</xref>-XML.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-zip">ZIP</styled-content></term>
      <def>
        <p>ZIP steht für ein Dateiformat (zip = engl. Reißverschluss),
        in welchem mehrere Einzeldateien verlustfrei, komprimiert
        zusammengefasst werden. ZIP-Dateien werden beim Öffnen entweder
        automatisch entpackt oder lassen sich per Rechtsklick
        extrahieren.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-fluhMethodenbeitragSentimentanalyse2019">
    <mixed-citation>Flüh, Marie. 2024. Methodenbeitrag:
    Sentimentanalyse. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1,
    Nr. 7. Sentimentanalyse (7. Oktober). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3797">10.48694/fortext.3797</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/sentimentanalyse">https://fortext.net/routinen/methoden/sentimentanalyse</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-gaaslandPracticalReasoningDemarcated2012">
    <mixed-citation>Gaasland, Rolf. 2012. Practical Reasoning
    Demarcated. Unreliable Narration in Franz Kafka’s „Erstes Leid“. In:
    <italic>Disputable Core Concepts of Narrative Theory</italic>, hg.
    von Göran Rossholm und Christer Johansson, 239–251. Bern (u.a.):
    Lang.</mixed-citation>
  </ref>
  <ref id="ref-horstmannRessourcenbeitragTextGridRepository2018">
    <mixed-citation>Horstmann, Jan. 2024. Ressourcenbeitrag: TextGrid
    Repository. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 11.
    Bibliografie (29. November). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3794">10.48694/fortext.3794</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/ressourcen/textsammlungen/textgrid-repository">https://fortext.net/ressourcen/textsammlungen/textgrid-repository</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-jackeMethodenbeitragKollaborativesLiteraturwissenschaftliches2018">
    <mixed-citation>Jacke, Janina. 2024b. Methodenbeitrag:
    Kollaboratives literaturwissenschaftliches Annotieren. Hg. von
    Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 4. Manuelle Annotation
    (7. August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3749">10.48694/fortext.3749</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/kollaboratives-literaturwissenschaftliches-annotieren">https://fortext.net/routinen/methoden/kollaboratives-literaturwissenschaftliches-annotieren</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-jackeMethodenbeitragManuelleAnnotation2018">
    <mixed-citation>———. 2024a. Methodenbeitrag: Manuelle Annotation.
    Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 4. Manuelle
    Annotation (7. August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3748">10.48694/fortext.3748</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/manuelle-annotation">https://fortext.net/routinen/methoden/manuelle-annotation</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-martinezEinfuhrungErzahltheorie2012">
    <mixed-citation>Martínez, Matías und Michael Scheffel. 2012.
    <italic>Einführung in die Erzähltheorie</italic>. München:
    Beck.</mixed-citation>
  </ref>
  <ref id="ref-schumacherToolbeitragCATMA2019">
    <mixed-citation>Schumacher, Mareike. 2024. Toolbeitrag: CATMA. Hg.
    von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 4. Manuelle
    Annotation (7. August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3761">10.48694/fortext.3761</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/catma">https://fortext.net/tools/tools/catma</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-vollmerVerzweiflungArtistenFranz1998">
    <mixed-citation>Vollmer, Hartmut. 1998. Die Verzweiflung des
    Artisten. Franz Kafkas Erzählung Erstes Leid – eine Parabel
    künstlerischer Grenzerfahrungen. <italic>Deutsche
    Vierteljahrsschrift für Literaturwissenschaft und
    Geistesgeschichte</italic> 72, Nr. 1: 126–146. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/BF03375489">10.1007/BF03375489</ext-link>,.</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
