<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3765</article-id>
<title-group>
<article-title>Methodenbeitrag: Named Entity Recognition
(NER)</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0002-7952-4194</contrib-id>
<name>
<surname>Schumacher</surname>
<given-names>Mareike</given-names>
</name>
<email>Mareike.Schumacher@sprachlit.uni-regensburg.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Regensburg</institution>
</institution-wrap>
</aff>
</contrib-group>
<volume>1</volume>
<issue>9</issue>
<issue-title>Named Entity Recognition</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 17.05.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/named-entity-recognition-ner">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2018-05-17">
<day>17</day>
<month>05</month>
<year>2018</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 17.05.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/named-entity-recognition-ner">fortext.net</ext-link></p>
<sec id="definition">
  <title>1. Definition</title>
  <p><italic>Named Entity Recognition (NER)</italic> ist ein Verfahren,
  mit dem klar benennbare Elemente (z.B. Namen von Personen oder Orten)
  in einem Text automatisch markiert (vgl.
  <xref alt="Text Mining" rid="glossary-text-mining">Text Mining</xref>)
  werden können. Named Entity Recognition wurde im Rahmen der
  computerlinguistischen Methode des <italic>Natural Language
  Processing</italic> (<xref alt="NLP" rid="glossary-nlp">NLP</xref>)
  entwickelt, bei der es darum geht, natürlichsprachliche
  Gesetzmäßigkeiten maschinenlesbar aufzubereiten.</p>
  <fig>
    <caption><p>Abb. 1: Named Entity Recognition mit dem Stanford Named
    Entity Recognizer</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="NER_Thumbnail-p.png" />
  </fig>
</sec>
<sec id="anwendungsbeispiel">
  <title>2. Anwendungsbeispiel</title>
  <p>Wollen Sie beispielsweise untersuchen, wie häufig Frauenfiguren in
  norddeutschen Kriminalromanen des 20. Jahrhunderts vorkommen, so
  können Sie Ihre Untersuchung mit <italic>Named Entity
  Recognition</italic> (vgl.
  <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
  Reading</xref>) beginnen. In einer Textsammlung von 100
  Kriminalromanen (vgl.
  <xref alt="Korpus" rid="glossary-korpus">Korpus</xref>) werden alle
  Figuren mit einem <italic>NER</italic>-Tool automatisch markiert (vgl.
  <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>)
  und dann manuell nach weiblichen und männlichen Figuren differenziert.
  Es wird sichtbar, dass Frauenfiguren in Ihrem gesamten Textkorpus nur
  15% aller Figurennennungen ausmachen.
  Mit diesem Befund gehen Sie weiter und teilen Ihr Korpus in zeitliche
  Einheiten auf. Nun fällt Ihnen auf, dass Frauenfiguren zu Beginn des
  20. Jahrhunderts nur 5% der Namensnennungen in norddeutschen
  Kriminalromanen ausmachen, während es zum Ende des 20. Jahrhunderts
  schon 40% sind. Sie spalten nun Ihr Korpus nach Autoren und Autorinnen
  auf und stellen fest, dass Autoren Frauenfiguren viel häufiger
  erwähnen als Autorinnen. Schließlich untersuchen Sie auch noch, ob es
  sich bei den benannten Figuren um Ermittler*innen, Verdächtige, Opfer,
  Hacker*innen usw. handelt.</p>
</sec>
<sec id="literaturwissenschaftliche-tradition">
  <title>3. Literaturwissenschaftliche Tradition</title>
  <p>Mit <italic>Named Entity Recognition</italic> werden meistens drei
  Parameter gleichzeitig erfasst:</p>
  <list list-type="order">
    <list-item>
      <p>Personen,</p>
    </list-item>
    <list-item>
      <p>Orte und</p>
    </list-item>
    <list-item>
      <p>Organisationen.</p>
    </list-item>
  </list>
  <p>In der Literaturwissenschaft wurden vor allem Personen (im Sinne
  von Figuren) und Orte bereits auf unterschiedliche Weise analysiert
  und sind bis heute wichtige Aspekte literaturwissenschaftlicher
  Forschung. Im Forschungsgebiet des „Organizational Storytelling“,
  welches der Literaturwissenschaft und insbesondere der Erzähltheorie
  nahe steht, werden auch Organisationen in Narrativen untersucht. Im
  Folgenden werden die drei typischen Aspekte der <italic>Named Entity
  Recognition</italic> und ihre literaturwissenschaftliche Bedeutung
  einzeln betrachtet.</p>
  <p><italic>Personen</italic>: Schon seit Aristoteles werden Figuren
  als Elemente von Erzählungen verstanden und analysiert
  (<xref alt="Eder 2013, 40f" rid="ref-ederFigurImFilm2013" ref-type="bibr">Eder
  2013, 40f</xref>.). Dabei kann der Fokus auf der Funktion einzelner
  Figuren (vgl. ebd., 41), dem Gesamtgefüge von Figurenkomplexen (vgl.
  ebd., 43) oder der psychologischen Ausgestaltung einzelner oder
  mehrerer Figuren liegen (vgl. ebd., 47ff.). Eine Besonderheit des
  literaturwissenschaftlichen Verständnisses von Figuren gegenüber einer
  linguistischen Definition von Person als <italic>named entity</italic>
  ist, dass neben der Nennung von Eigennamen auch allgemeines
  Weltwissen, Typisierungen und kulturelle Codes dazu beitragen, eine
  Figur auszugestalten
  (<xref alt="Jannidis 2012, 2" rid="ref-jannidisCharacter2012" ref-type="bibr">Jannidis
  2012, 2</xref>). Für die <italic>Named Entity Recognition</italic> ist
  dabei von besonderer Bedeutung, dass neben Eigennamen auch andere
  Referenzen auf eine Figur verweisen können (vgl. ebd., 3). Trotzdem
  bleibt aber stets ein Eigenname zentral für die Erkennung von Figuren
  (<xref alt="Jannidis 2004, 109" rid="ref-jannidisFigurUndPerson2004" ref-type="bibr">Jannidis
  2004, 109</xref>). Dies entspricht einem (post)strukturalistischen
  Verständnis von Figur (vgl. ebd., 104).
  Auch in der literarischen Onomastik
  (<xref alt="Lamping 1983, 9" rid="ref-lampingNameErzahlungZur1983" ref-type="bibr">Lamping
  1983, 9</xref>), ist die Typologisierung und Bedeutungsanalyse von
  Namen in literarischen Texten vorherrschend
  (<xref alt="Stiegler 1994, 14" rid="ref-stieglerAufgabeNamensUntersuchung1994" ref-type="bibr">Stiegler
  1994, 14</xref>). Hier wurden sowohl einzelne Werke
  (<xref alt="Krappmann 2012" rid="ref-krappmannNamenUweJohnsons2012" ref-type="bibr">Krappmann
  2012</xref>) als auch Gruppen literarischer Werke
  (<xref alt="Trauner 2012" rid="ref-traunerNamenweltKinderUnd2012" ref-type="bibr">Trauner
  2012</xref>) und Korpora
  (<xref alt="Brütting 2013" rid="ref-brüttingNamenUndIhre2013" ref-type="bibr">Brütting
  2013</xref>) auf Eigennamen untersucht. Darüber hinaus gab es bereits
  in den 1980er Jahren den Versuch, computergestützte Verfahren in
  dieses Forschungsfeld zu integrieren
  (<xref alt="Dalen-Oskam 2016, 345" rid="ref-dalen-oskamCorpusbasedApproachesNames2016" ref-type="bibr">Dalen-Oskam
  2016, 345</xref>). Diese frühe Verknüpfung von Digital Humanities mit
  einem spezifischen literaturwissenschaftlichen Forschungsgebiet gibt
  einen Hinweis darauf, wie naheliegend eine solche Verbindung ist.</p>
  <p><italic>Raum</italic>: Die erzähltheoretische Forschung zur
  Thematik des Raumes folgt zwei Traditionslinien. Entweder wird der
  Raumbegriff primär im eigentlichen Wortsinne definiert oder
  hauptsächlich metaphorisch gebraucht
  (<xref alt="Ryan 2012, 2" rid="ref-ryanSpace2012" ref-type="bibr">Ryan
  2012, 2</xref>). Die buchstäbliche Verwendung des Raumbegriffs ähnelt
  dem linguistischen Verständnis von Orten, das der <italic>Named Entity
  Recognition</italic> zu Grunde liegt. Im Rahmen dieser
  Forschungstradition wurde Raum sowohl als Phänomen der Textoberfläche
  (<xref alt="Fludernik 2008, 51ff" rid="ref-fludernikErzahltheorieEinfuhrung2008" ref-type="bibr">Fludernik
  2008, 51ff</xref>.) als auch der Tiefendimension betrachtet, welchem
  unterschiedliche Funktionen zuzuordnen sind. Dazu gehören die
  räumliche Rahmung von Ereignissen, die Ausgestaltung des Settings und
  die Gestaltung ganzer narrativer Welten
  (<xref alt="Ryan 2012, 6–10" rid="ref-ryanSpace2012" ref-type="bibr">Ryan
  2012, 6–10</xref>).
  Für die Literaturgeografie oder -kartografie sind literarische Orte
  und Räume ebenfalls zentral
  (<xref alt="Piatti 2008" rid="ref-piattiGeografieLiteraturSchauplatze2008" ref-type="bibr">Piatti
  2008</xref>). In diesem Forschungsfeld werden geografische Karten
  genutzt, um fiktive Räume zu visualisieren und zu analysieren. Orte
  und Räume werden hier als lokalisierbare Einheiten bzw. als räumliche
  Objekte
  (<xref alt="Reuschel, Piatti und Hurni 2012, 149" rid="ref-reuschelModellingUncertainGeodata2012" ref-type="bibr">Reuschel,
  Piatti und Hurni 2012, 149</xref>) verstanden – eine Auffassung, die
  ebenfalls eine Ähnlichkeit mit dem linguistischen Ortsbegriff in der
  <italic>Named Entity Recognition</italic> aufweist.</p>
  <p><italic>Organisationen</italic>: Die dritte Kategorie, die in der
  <italic>Named Entity Recognition</italic> häufig mit berücksichtigt
  wird, ist weit weniger eindeutig als die beiden zuvor betrachteten.
  Sogar die Benennung variiert je nach Tool und manchmal sogar auch nach
  Modellen, die mit einem Tool verwendet werden. Es ist also denkbar,
  dass unterschiedliche literaturwissenschaftlich bedeutsame Motive zu
  dieser Kategorie gerechnet werden. Da z.B. Schulen und/oder
  Universitäten als Institutionen der Bildung als klar benennbare
  Einheiten interpretiert werden können, kann die Betrachtung dieser
  „Organisationen“ analog zu Verfahren der <italic>NER</italic> gedacht
  werden
  (<xref alt="Röser 1975" rid="ref-röserBildHoherenSchule1975" ref-type="bibr">Röser
  1975</xref>;
  <xref alt="Mix 1995" rid="ref-mixSchulenNationBildungskritik1995" ref-type="bibr">Mix
  1995</xref>;
  <xref alt="Mikota 2014" rid="ref-mikotaLehrerAlsTater2014" ref-type="bibr">Mikota
  2014</xref>;
  <xref alt="Pauldrach 2016" rid="ref-pauldrachNichtFurLeben2016" ref-type="bibr">Pauldrach
  2016</xref>).
  Im erzähltheoretisch geprägten Forschungszweig zum „Corporate
  Storytelling“ stehen Unternehmen und ihre narrative Außendarstellung
  sowie zugehörige Gegennarrative im Fokus des Interesses
  (<xref alt="Hansen, Narlyk und Wolff Lundholt 2013" rid="ref-hansenCorporateStorytelling2013" ref-type="bibr">Hansen,
  Narlyk und Wolff Lundholt 2013</xref>). In diesem Feld werden unter
  anderem handlungspraktische Methoden narrativer Kommunikation
  entwickelt
  (<xref alt="Thier 2004" rid="ref-thierEntdeckungNarrativenFur2004" ref-type="bibr">Thier
  2004</xref>). Obwohl der Forschungsgegenstand hier fast deckungsgleich
  mit dem ist, was in der <italic>Named Entity Recognition</italic>
  erkannt wird, gibt es allerdings bisher nur wenige methodische
  Überschneidungen.
  Indem literaturwissenschaftliche Konzepte so aufbereitet wurden, dass
  sie maschinenlesbar sind
  (<xref alt="Jannidis u. a. 2015" rid="ref-jannidisAutomatischeErkennungFiguren2015a" ref-type="bibr">Jannidis
  u. a. 2015</xref>), konnte die Methode bereits in Ansätzen auf
  literarische Texte angewandt werden (vgl.
  <xref alt="Domäneadaption" rid="glossary-domain-adaption">Domäneadaption</xref>).
  Da aber noch nicht alle Parameter in einem solchen Verfahren für die
  Literaturwissenschaft aufbereitet wurden, kann an dieser Stelle noch
  Grundlagenforschung betrieben werden.</p>
</sec>
<sec id="diskussion">
  <title>4. Diskussion</title>
  <p><italic>NER</italic>-Tools erreichen bei der automatischen
  Extraktion von Informationseinheiten (<italic>named entities</italic>)
  aus Sachtexten eine hohe Verlässlichkeit, weshalb <italic>NER</italic>
  in der Linguistik bereits als gelöstes Problem betrachtet wurde
  (<xref alt="Cunningham 2005, 668" rid="ref-cunninghamInformationExtractionAutomatic2005" ref-type="bibr">Cunningham
  2005, 668</xref>). Die erzielten Erfolgsquoten bei der Erkennung von
  Personen, Orten und Organisationen variieren in unterschiedlichen
  Sprachen allerdings stark. Vorhandene <italic>NER</italic>-Tools
  wurden zumeist mit großen Korpora bestehend aus journalistischen
  Texten trainiert (das Training von <italic>NER</italic> Tools wird in
  Abschnitt 5 genauer beschrieben). Es gibt mehrere sprachenspezifische
  <italic>NER</italic>-Modelle, die mit diesen Tools verwendet werden
  können. Diese Modelle haben durchschnittliche Erfolgsquoten
  (<italic>F-Scores</italic>) von 68% in deutschen Texten und 89% in
  englischen Texten
  (<xref alt="Faruqui und Padó 2010, 1" rid="ref-faruquiTrainingEvaluatingGerman2010" ref-type="bibr">Faruqui
  und Padó 2010, 1</xref>). Wie Jannidis u. a.
  (<xref alt="2015" rid="ref-jannidisAutomatischeErkennungFiguren2015a" ref-type="bibr">2015</xref>)
  am Beispiel von Figuren zeigten, erkennt das Modell für die deutsche
  Sprache von Faruqui und Padó in literarischen Texten nur knapp 20%
  aller Vorkommnisse von Figuren im Text („Recall-Quote“ genannt) im
  Vergleich zu 88% erkannten Personen in journalistischen Texten. Ein
  Grund hierfür kann darin gesehen werden, dass in literarischen Texten
  Figuren seltener mit ihren Eigennamen und häufiger mit indirekten
  Verweisen oder Umschreibungen aufgerufen werden. Eine Nutzung von
  <italic>NER</italic>-Tools ohne vorhergehende Domänenadaption ist also
  problematisch.
  Der Einsatz von <italic>NER</italic> bedeutet eine enorme
  Zeitersparnis gegenüber der manuellen Annotation von <italic>named
  entities</italic> in Texten. Damit ermöglicht <italic>NER</italic> vor
  allem die Betrachtung großer Textmengen, d. h. ganzer Romane und
  Korpora. <italic>NER</italic> sollte aber stets in dem Bewusstsein der
  eingeschränkten Zuverlässigkeit der Methode eingesetzt werden. Sogar
  wenn durch die
  <xref alt="Domäneadaption" rid="glossary-domain-adaption">Domäneadaption</xref>
  für Figuren in (deutschen) literarischen Texten eine Trefferquote von
  rund 85% erreicht werden konnte
  (<xref alt="Jannidis u. a. 2015" rid="ref-jannidisAutomatischeErkennungFiguren2015a" ref-type="bibr">Jannidis
  u. a. 2015</xref>), bedeutet dies, dass rund 15% der relevanten
  <italic>named entities</italic> nicht gefunden wurden. Vor allem bei
  Analysen von Einzeltexten kann diese Fehlerquote durchaus so gewichtig
  sein, dass die qualitative Interpretation, die anhand des
  Datenmaterials geleistet werden soll, fehlgeleitet wird.
  Der Einsatz von <italic>NER</italic> in der Literaturwissenschaft
  eignet sich besonders für
  <italic><xref alt="Distant Reading" rid="glossary-distant-reading">Distant
  Reading</xref></italic>-Ansätze. Während im
  <italic><xref alt="Close Reading" rid="glossary-close-reading">Close
  Reading</xref></italic>-Verfahren zumeist einzelne Texte oder eine
  kleine Anzahl von Texten exemplarisch analysiert werden, werden beim
  <italic>Distant Reading</italic> größere Korpora in den Fokus gerückt.
  Moretti beschreibt, wie die Literaturwissenschaft mittels
  <italic>Close Reading</italic> bisher vielleicht 1% der Weltliteratur
  tatsächlich in Betracht gezogen hat. Die restlichen 99%, die er als
  „the great unread“ bezeichnet, kommen in der Literaturwissenschaft
  bisher eher selten vor
  (<xref alt="Moretti 2013, 63–70" rid="ref-morettiDistantReading2013" ref-type="bibr">Moretti
  2013, 63–70</xref>). Digitale Methoden machen es möglich, sich diesem
  „great unread“ zuzuwenden. Statt wie beim <italic>Close
  Reading</italic> herausragende Einzeltexte zu studieren, wird
  Literatur beim <italic>Distant Reading</italic> eher relational
  betrachtet. Auf einer solchen Basis wird auch der Einsatz digitaler
  <italic>NER</italic>-Tools bedeutsam. Denn mit der zunehmenden Distanz
  von einzelnen Texten und dem Fokus auf Relationen zwischen bestimmten
  quantitativen Aspekten in unterschiedlichen Texten relativiert sich
  auch die oben hervorgehobene Fehlerquote. In solchen Analysen ist es
  nicht mehr entscheidend, an welcher Stelle welche Figur in welchem
  Kontext genannt wird. Stattdessen werden eher Muster fokussiert, die
  in Gruppen von Texten oder sogar in einem großen Korpus auftreten.
  Abschließend bleibt noch festzuhalten, dass auch in
  <italic>Distant-Reading</italic>-Verfahren ein bewusster Umgang mit
  der Fehleranfälligkeit von <italic>NER</italic> gepflegt wird. Statt
  davon auszugehen, dass sich Fehlerquoten durch die Vergrößerung von
  Korpora nivellieren, werden diese eher in Kauf genommen, um überhaupt
  Analysen großer Textmengen durchführen zu können. Es werden hier erste
  Annäherungen an das „great unread“ gewagt, um dadurch haltbare
  Aussagen über Nationalliteraturen, Weltliteratur oder Literatur als
  solche treffen zu können.</p>
</sec>
<sec id="technische-grundlagen">
  <title>5. Technische Grundlagen</title>
  <p>Im ersten Schritt der <italic>Named Entity Recognition</italic>
  geht es zunächst darum, dem Computer zu vermitteln, wie die Worte
  erkannt werden können, die als <italic>named entity</italic>
  gekennzeichnet werden sollen. Dazu werden eine Reihe von Merkmalen
  definiert, die vom Tool statistisch ausgewertet werden (technisch:
  Festlegen der <italic>Natural Language Processing
  (NLP)</italic>-<xref alt="Feature" rid="glossary-feature">Feature</xref>)
  und so eine möglichst präzise Erkennung möglich machen sollen. Zum
  Beispiel können Wortlisten berücksichtigt werden, die alle
  Figurennamen, Orte und Organisationen verzeichnen, die vorkommen
  könnten. Zusätzlich können Wortarten nicht nur der <italic>named
  entity</italic> selbst sondern auch der vorangehenden und
  nachgestellten Worte einbezogen werden. Weitere
  <italic>features</italic> können sein:</p>
  <list list-type="bullet">
    <list-item>
      <p>häufig vorher genannte Wörter (sowie z.B. bei Orten das Wort
      „in“),</p>
    </list-item>
    <list-item>
      <p>Darstellungsformat (bei Daten so etwas wie Zahl Monat
      Jahr),</p>
    </list-item>
    <list-item>
      <p>Groß- und Kleinschreibung,</p>
    </list-item>
    <list-item>
      <p>Position im Satz</p>
    </list-item>
    <list-item>
      <p>usw.</p>
    </list-item>
  </list>
  <p>Mit Hilfe dieser im Tool vordefinierten <italic>features</italic>
  kann ein als
  <italic><xref alt="Machine Learning" rid="glossary-machine-learning">Machine
  Learning</xref></italic> bezeichneter Prozess durchgeführt werden. Der
  Lernprozess des <italic>NER</italic>-Tools (auch „Training“ genannt)
  besteht darin, dass diese <italic>features</italic> mit einem manuell
  annotierten Text abgeglichen werden; dem sogenannten Trainingskorpus.
  Ergebnis dieses Abgleichs ist das <italic>NER</italic>-Modell. Die
  Anzahl der <italic>features</italic>, die ein Tool berücksichtigt,
  kann variieren. Nur die Kombination verschiedener
  <italic>features</italic> führt zu guten Ergebnissen bei der
  automatischen Erkennung, da <italic>named entities</italic> in
  unterschiedlichen Zusammenhängen unterschiedliche Bedeutungen tragen
  können. So wäre z.B. „Paris“ mit vorangestelltem „in“ wahrscheinlich
  eine Referenz auf die Stadt, mit nachgestelltem Verb wahrscheinlich
  eine Person. Ausnahmen können durch den Abgleich mit dem manuell
  annotierten Text ebenfalls mit einbezogen werden. Wenn im
  Trainingskorpus z.B. in Sätzen wie „Paris hat schöne Museen“ Paris als
  Ort ausgezeichnet wurde, obwohl ein Verb dahinter steht, so kann das
  Tool erkennen, dass das Wort „hat“ direkt hinter einer <italic>named
  entity</italic> darauf hindeuten kann, dass es sich um einen Ort
  handelt. Letztendlich errechnet das Tool anhand der
  <italic>feature</italic>-Kombinationen und der Trainingsdaten, welche
  Bedeutung in welchem Zusammenhang wahrscheinlicher ist.
  <italic>NER</italic> kann z.B. mit Hilfe des Stanford Named Entity
  Recognizers
  (<xref alt="Schumacher 2024b" rid="ref-schumacherToolbeitragStanfordNamed2018" ref-type="bibr">Schumacher
  2024b</xref>) oder der virtuellen Arbeitsumgebung WebLicht
  (<xref alt="Schumacher 2024a" rid="ref-schumacherToolbeitragAbbyyFineReader2019" ref-type="bibr">Schumacher
  2024a</xref>) über eine grafische Nutzeroberfläche (vgl.
  <xref alt="GUI" rid="glossary-gui">GUI</xref>) durchgeführt werden,
  die auch mit geringen technischen Kenntnissen bedienbar sind. In
  diesen Tools werden <italic>NER</italic>-Modelle genutzt, die zumeist
  mittels Korpora aus Sachtexten trainiert wurden. Um das Tool mit
  Beispieldaten einer anderen Domäne wie z.B. der Literatur neu zu
  trainieren oder die vordefinierten <italic>features</italic> zu
  ergänzen, ist es nötig, über die
  <xref alt="Commandline" rid="glossary-commandline">Commandline</xref>
  des Computers eine Reihe von Befehlen in der Programmiersprache des
  jeweiligen Tools einzugeben. Die erforderlichen Befehle finden sich
  allerdings oft in der Dokumentation der Tools, sind dort erklärt und
  können per copy/paste eingefügt werden. Profunde Kenntnisse einer oder
  mehrerer Programmiersprache(n) sind also auch hierfür nicht nötig. Es
  ist aber durchaus hilfreich, die Sprache des Codes zumindest lesen und
  verstehen zu können.</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>Stanford CoreNLP:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://stanfordnlp.github.io/CoreNLP/">https://web.archive.org/save/https://stanfordnlp.github.io/CoreNLP/</ext-link>
      (Letzter Zugriff: 10.10.2024)</p>
    </list-item>
    <list-item>
      <p>WebLicht:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://weblicht.sfs.uni-tuebingen.de/weblichtwiki/index.php/Main_Page">https://web.archive.org/save/https://weblicht.sfs.uni-tuebingen.de/weblichtwiki/index.php/Main_Page</ext-link>
      (Letzter Zugriff: 10.10.2024)</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-close-reading">Close
      Reading</styled-content></term>
      <def>
        <p>Close Reading bezeichnet die sorgfältige Lektüre und
        Interpretation eines einzelnen oder weniger Texte. Close Reading
        ist in der digitalen Literaturwissenschaft außerdem mit der
        manuellen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        textueller Phänomene verbunden (vgl. auch
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref> als Gegenbegriff).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-commandline">Commandline</styled-content></term>
      <def>
        <p>Die Commandline (engl. <italic>command line
        interface</italic> (CLI)), auch Kommandozeile, Konsole, Terminal
        oder Eingabeaufforderung genannt, ist die direkteste Methode zur
        Interaktion eines Menschen mit einem Computer. Programme ohne
        eine grafische Benutzeroberfläche
        (<xref alt="GUI" rid="glossary-gui">GUI</xref>) werden i. d. R.
        durch Texteingabe in die Commandline gesteuert. Um die
        Commandline zu öffnen, klicken Sie auf Ihrem Mac „cmd“ +
        „space“, geben „Terminal“ ein und doppelklicken auf das
        Suchergebnis. Bei Windows klicken Sie die Windowstaste + „R“,
        geben „cmd.exe“ ein und klicken Enter.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-data-mining">Data
      Mining</styled-content></term>
      <def>
        <p>Data Mining gehört zum Fachbereich
        <xref alt="Information Retrieval" rid="glossary-information-retrieval">Information
        Retrieval</xref> und bezieht sich auf die systematische
        Anwendung computergestützter Methoden, die darauf abzielt, in
        vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu
        erkennen. Textbasierte Formen des Data Minings sind u. a.
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>,
        <xref alt="Web Mining" rid="glossary-web-mining">Web
        Mining</xref> und
        <xref alt="Opinion Mining" rid="glossary-opinion-mining">Opinion
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-distant-reading">Distant
      Reading</styled-content></term>
      <def>
        <p>Distant Reading ist ein Ansatz aus den digitalen
        Literaturwissenschaften, bei dem computationelle Verfahren auf
        häufig große Mengen an Textdaten angewandt werden, ohne dass die
        Texte selber gelesen werden. Meist stehen hier quantitative
        Analysen im Vordergrund, es lassen sich jedoch auch qualitative
        <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>
        quantitativ vergleichen. Als Gegenbegriff zu
        <xref alt="Close Reading" rid="glossary-close-reading"><italic>Close
        Reading</italic></xref> wurde der Begriff insbesondere von
        Franco Moretti (2000) geprägt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-domain-adaption">Domäneadaption</styled-content></term>
      <def>
        <p>Domäneadaption beschreibt die Anpassung einer in einem
        Fachgebiet entwickelten digitalen Methode an ein anderes
        Fachgebiet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-feature">Feature</styled-content></term>
      <def>
        <p>Unter Features können Einzelfunktionen eines Tools verstanden
        werden, die beispielsweise komplexe Funktionen wie die
        Visualisierung eines Textes als
        <xref alt="Wordcloud" rid="glossary-wordcloud">Wordcloud</xref>
        ermöglichen, oder auch kleinere Funktionseinheiten wie den
        Abgleich einzelner Spracheigenschaften
        (<xref alt="Properties" rid="glossary-property">Properties</xref>)
        mit
        <xref alt="annotierten" rid="glossary-annotation">annotierten</xref>
        Beispieltexten darstellen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-gui">GUI</styled-content></term>
      <def>
        <p>GUI steht für <italic>Graphical User Interface</italic> und
        bezeichnet eine grafische Benutzeroberfläche. Ein GUI ermöglicht
        es, Tools mithilfe von grafischen Schaltflächen zu bedienen, um
        somit beispielsweise den Umgang mit der
        <xref alt="Commandline" rid="glossary-commandline">Commandline</xref>
        zu umgehen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-information-retrieval">Information
      Retrieval</styled-content></term>
      <def>
        <p>Die Teildisziplin der Informatik, das Information Retrieval,
        beschäftigt sich mit der computergestützten Suche und
        Erschließung komplexer Informationen in meist unstrukturierten
        Datensammlungen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-korpus">Korpus</styled-content></term>
      <def>
        <p>Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural
        für „das Korpus“) sind typischerweise nach Textsorte, Epoche,
        Sprache oder Autor*in zusammengestellt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z. B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-nlp">NLP</styled-content></term>
      <def>
        <p><italic>Natural Language Processing</italic> (NLP),
        maschinelle Sprachverarbeitung zu Deutsch, ist ein Teilgebiet
        der Linguistik, der Informatik und der künstlichen Intelligenz,
        welches sich damit beschäftigt, wie Computer so programmiert
        werden, dass sie große Mengen an natürlichsprachlichen Daten
        verarbeiten und analysieren können.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-opinion-mining">Opinion
      Mininig</styled-content></term>
      <def>
        <p>Unter Opinion Mining, oder Sentiment Analysis, versteht man
        die Analyse von Stimmungen oder Haltungen gegenüber einem Thema,
        durch die Analyse natürlicher Sprache. Das Opinion Mining gehört
        zu den Verfahren des
        <xref alt="Text Minings" rid="glossary-text-mining">Text
        Minings</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic>, oder „Wortart“
        auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-property">Property</styled-content></term>
      <def>
        <p>Property steht für „Eigenschaft“, „Komponente“ oder
        „Attribut“. In der automatischen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        dienen konkrete Worteigenschaften wie Groß- und Kleinschreibung
        zur Klassifizierung von Wörtern oder Phrasen. Durch die
        Berücksichtigung solcher Eigenschaften in den
        <xref alt="Features" rid="glossary-feature">Features</xref>
        eines Tools kann
        <xref alt="maschinelles Lernen" rid="glossary-machine-learning">maschinelles
        Lernen</xref> bestimmter Phänomene umgesetzt werden. In der
        manuellen Annotation können als Properties auch Eigenschaften
        von
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        benannt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-text-mining">Text
      Mining</styled-content></term>
      <def>
        <p>Das Text Mining ist eine textbasierte Form des
        <xref alt="Data Minings" rid="glossary-data-mining">Data
        Minings</xref>. Prozesse &amp; Methoden, computergestützt und
        automatisch Informationen bzw. Wissen aus unstrukturierten
        Textdaten zu extrahieren, werden als Text Mining
        zusammengefasst.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-web-mining">Web
      Mining</styled-content></term>
      <def>
        <p>Unter Web Mining versteht man die Anwendung von Techniken des
        <xref alt="Data Mining" rid="glossary-data-mining">Data
        Mining</xref> zur Extraktion von Informationen aus dem World
        Wide Web. Das Web Mining ist ein Teilbereich des Data Minings
        und zählt zu einem der wichtigsten Anwendungsgebiete für das
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-wordcloud">Wordcloud</styled-content></term>
      <def>
        <p>Eine <italic>Wordcloud</italic>, oder auch Schlagwortwolke,
        ist eine Form der Informationsvisualisierung, beispielsweise von
        Worthäufigkeiten in einem Text oder einer Textsammlung. Dabei
        werden unterschiedlich gewichtete Wörter, wie die häufigsten
        Wörter, i.d.R. größer oder auf andere Weise hervorgehoben
        dargestellt. Die horizontale/vertikale Ausrichtung und die Farbe
        der dargestellten Wörter hat meistens allerdings keinen
        semantischen Mehrwert.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-brüttingNamenUndIhre2013">
    <mixed-citation>Brütting, Richard. 2013. <italic>Namen und ihre
    Geheimnisse in Erzählwerken der Moderne</italic>. Hamburg:
    Baar.</mixed-citation>
  </ref>
  <ref id="ref-chlopczykStorytellingNarrativeAnsatze2017">
    <mixed-citation>Chlopczyk, Jaques. 2017. <italic>Beyond
    Storytelling. Narrative Ansätze und die Arbeit mit Geschichten in
    Organisationen</italic>. Berlin: Springer Gabler.</mixed-citation>
  </ref>
  <ref id="ref-cunninghamInformationExtractionAutomatic2005">
    <mixed-citation>Cunningham, H. 2005. Information extraction,
    automatic. In: <italic>Encyclopedia of Language and
    Linguistics</italic>, hg. von Keith Brown, 665–677. Oxford:
    Elsevier.</mixed-citation>
  </ref>
  <ref id="ref-dalen-oskamCorpusbasedApproachesNames2016">
    <mixed-citation>Dalen-Oskam, Karina. 2016. Corpus-based Approaches
    to Names in Literature. In: <italic>The Oxford Handbook of Names and
    Naming</italic>, hg. von Carole Hoigh. Oxford: Oxford University
    Press.</mixed-citation>
  </ref>
  <ref id="ref-ederFigurImFilm2013">
    <mixed-citation>Eder, Jens. 2013. <italic>Die Figur im Film.
    Grundlagen der Figurenanalyse</italic>. Marburg:
    Schüren.</mixed-citation>
  </ref>
  <ref id="ref-faruquiTrainingEvaluatingGerman2010">
    <mixed-citation>Faruqui, Manaal und Sebastian Padó. 2010. Training
    and Evaluating a German Named Entity Recognizer with Semantic
    Generalization. In: <italic>Proceedings of Konvens 2010</italic>.
    Saarbrücken.
    <ext-link ext-link-type="uri" xlink:href="https://nlpado.de/~sebastian/pub/papers/konvens10_faruqui.pdf">https://nlpado.de/~sebastian/pub/papers/konvens10_faruqui.pdf</ext-link>
    (zugegriffen: 4. Mai 2018).</mixed-citation>
  </ref>
  <ref id="ref-fludernikErzahltheorieEinfuhrung2008">
    <mixed-citation>Fludernik, Monika. 2008. <italic>Erzähltheorie. Eine
    Einführung</italic>. Darmstadt: Wissenschaftliche
    Buchgesellschaft.</mixed-citation>
  </ref>
  <ref id="ref-hansenCorporateStorytelling2013">
    <mixed-citation>Hansen, Per Krogh, Brigitte Narlyk und Marianne
    Wolff Lundholt. 2013. Corporate Storytelling. In: <italic>the living
    handbook of narratology</italic>, hg. von Peter Hühn, Jan Christoph
    Meister, John Pier, und Wolf Schmid. Hamburg: Hamburg University.
    <ext-link ext-link-type="uri" xlink:href="http://www.lhn.uni-hamburg.de/article/corporate-storytelling">http://www.lhn.uni-hamburg.de/article/corporate-storytelling</ext-link>
    (zugegriffen: 8. Mai 2018).</mixed-citation>
  </ref>
  <ref id="ref-jannidisFigurUndPerson2004">
    <mixed-citation>Jannidis, Fotis. 2004. <italic>Figur und Person.
    Beitrag zu einer historischen Narratologie</italic>. Berlin: de
    Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-jannidisCharacter2012">
    <mixed-citation>———. 2012. Character. In: <italic>the living
    handbook of narratology</italic>, hg. von Peter Hühn, Jan Christoph
    Meister, John Pier, und Wolf Schmid. Hamburg: Hamburg University.
    <ext-link ext-link-type="uri" xlink:href="http://www.lhn.uni-hamburg.de/article/character">http://www.lhn.uni-hamburg.de/article/character</ext-link>
    (zugegriffen: 8. Mai 2018).</mixed-citation>
  </ref>
  <ref id="ref-jannidisAutomatischeErkennungFiguren2015a">
    <mixed-citation>Jannidis, Fotis, Markus Krug, Frank Puppe, Isabella
    Reger, Martin Toepfer und Lukas Weimer. 2015. Automatische Erkennung
    von Figuren in deutschsprachigen Romanen. In: <italic>DHd 2015. Von
    Daten zu Erkenntnissen. Book of Abstracts</italic>.
    <ext-link ext-link-type="uri" xlink:href="http://gams.uni-graz.at/o:dhd2015.abstracts-vortraege">http://gams.uni-graz.at/o:dhd2015.abstracts-vortraege</ext-link>
    (zugegriffen: 4. Mai 2018).</mixed-citation>
  </ref>
  <ref id="ref-krappmannNamenUweJohnsons2012">
    <mixed-citation>Krappmann, Tamara. 2012. <italic>Die Namen in Uwe
    Johnsons „Jahrestagen&quot;</italic>. Göttingen: V &amp; R
    Unipress.</mixed-citation>
  </ref>
  <ref id="ref-lampingNameErzahlungZur1983">
    <mixed-citation>Lamping, Dieter. 1983. <italic>Der Name in der
    Erzählung. Zur Poetik des Personennamens</italic>. Bonn:
    Bouvier.</mixed-citation>
  </ref>
  <ref id="ref-mikotaLehrerAlsTater2014">
    <mixed-citation>Mikota, Jana. 2014. Lehrer als Täter - Schüler als
    Opfer, oder doch umgekehrt? Schule in der Gegenwartsliteratur.
    <italic>Der Deutschunterricht</italic> 1: 70–78.</mixed-citation>
  </ref>
  <ref id="ref-mixSchulenNationBildungskritik1995">
    <mixed-citation>Mix, York-Gothart. 1995. <italic>Die Schulen der
    Nation. Bildungskritik in der Literatur der Moderne</italic>.
    Stuttgart: Metzler.</mixed-citation>
  </ref>
  <ref id="ref-morettiDistantReading2013">
    <mixed-citation>Moretti, Franco. 2013. <italic>Distant
    Reading</italic>. London, New York: Verso.</mixed-citation>
  </ref>
  <ref id="ref-pauldrachNichtFurLeben2016">
    <mixed-citation>Pauldrach, Matthias. 2016. „Nicht für das Leben,
    sondern für die Schule lernen wir!“ Eine Reflexion der Beziehung von
    Schule und Leben anhand von Wes Andersons Spielfilm Rushmore.
    <italic>Schule in Literatur und Film. Zeitschrift für den
    Deutschunterricht in Wissenschaft und Schule</italic> 1:
    20–29.</mixed-citation>
  </ref>
  <ref id="ref-piattiGeografieLiteraturSchauplatze2008">
    <mixed-citation>Piatti, Barbara. 2008. <italic>Die Geografie der
    Literatur. Schauplätze, Handlungsräume, Raumphantasien</italic>.
    Göttingen: Wallstein.</mixed-citation>
  </ref>
  <ref id="ref-reuschelModellingUncertainGeodata2012">
    <mixed-citation>Reuschel, Ann Kathrin, Barbara Piatti und Lorenz
    Hurni. 2012. Modelling Uncertain Geodata for the Literary Atlas of
    Europe. In: <italic>Understanding Different Geographies</italic>,
    hg. von Karel Kritz, William Cartwright, und Michaela Kinberger,
    135–157. Berlin, Heidelberg: Springer.</mixed-citation>
  </ref>
  <ref id="ref-röserBildHoherenSchule1975">
    <mixed-citation>Röser, Dietmar. 1975. <italic>Das Bild der höheren
    Schule in der neueren deutschen Literatur</italic>. Köln:
    Dissertationsdruck Hansen.</mixed-citation>
  </ref>
  <ref id="ref-ryanSpace2012">
    <mixed-citation>Ryan, Marie-Laure. 2012. Space. In: <italic>the
    living handbook of narratology</italic>, hg. von Peter Hühn, Jan
    Christoph Meister, John Pier, und Wolf Schmid. Hamburg: Hamburg
    University.
    <ext-link ext-link-type="uri" xlink:href="http://www.lhn.uni-hamburg.de/node/55.html">http://www.lhn.uni-hamburg.de/node/55.html</ext-link>
    (zugegriffen: 8. Mai 2018).</mixed-citation>
  </ref>
  <ref id="ref-schumacherToolbeitragAbbyyFineReader2019">
    <mixed-citation>Schumacher, Mareike. 2024a. Toolbeitrag: Abbyy
    FineReader. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 3.
    Textdigitalisierung und Edition (12. Juni). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3742">10.48694/fortext.3742</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/abbyy-finereader">https://fortext.net/tools/tools/abbyy-finereader</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-schumacherToolbeitragStanfordNamed2018">
    <mixed-citation>———. 2024b. Toolbeitrag: Stanford Named Entity
    Recognizer. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 9.
    Named Entity Recognition (30. Oktober). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3767">10.48694/fortext.3767</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/stanford-named-entity-recognizer">https://fortext.net/tools/tools/stanford-named-entity-recognizer</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-stieglerAufgabeNamensUntersuchung1994">
    <mixed-citation>Stiegler, Bernd. 1994. <italic>Die Aufgabe des
    Namens. Untersuchung zur Funktion der Eigennamen in der Literatur
    des zwanzigsten Jahrhunderts</italic>. München:
    Fink.</mixed-citation>
  </ref>
  <ref id="ref-thierEntdeckungNarrativenFur2004">
    <mixed-citation>Thier, Karin. 2004. <italic>Die Entdeckung des
    Narrativen für Organisationen. Entwicklung einer effizienten
    Story-Telling-Methode</italic>. Hamburg: Kovač.</mixed-citation>
  </ref>
  <ref id="ref-traunerNamenweltKinderUnd2012">
    <mixed-citation>Trauner, Karl. 2012. <italic>Die Namenwelt in den
    Kinder- und Hausmärchen der Brüder Grimm</italic>. Szentendre:
    Tillinger.</mixed-citation>
  </ref>
  <ref id="ref-viehhauser-meryDigitalNarratologySpace2017">
    <mixed-citation>Viehhauser-Mery, Gabriel und Florian Barth. 2017.
    Towards a Digital Narratology of Space. In: <italic>Digital
    Humanities 2017. Conference Abstracts</italic>. Montréal, Canada.
    <ext-link ext-link-type="uri" xlink:href="https://dh2017.adho.org/abstracts/DH2017-abstracts.pdf">https://dh2017.adho.org/abstracts/DH2017-abstracts.pdf</ext-link>
    (zugegriffen: 3. Mai 2018).</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
