<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3759</article-id>
<title-group>
<article-title>Methodenbeitrag: Netzwerkanalyse</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0002-7952-4194</contrib-id>
<name>
<surname>Schumacher</surname>
<given-names>Mareike</given-names>
</name>
<email>Mareike.Schumacher@sprachlit.uni-regensburg.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Regensburg</institution>
</institution-wrap>
</aff>
</contrib-group>
<pub-date date-type="pub" publication-format="electronic" iso-8601-date="2024-08-30">
<day>30</day>
<month>8</month>
<year>2024</year>
</pub-date>
<volume>1</volume>
<issue>6</issue>
<issue-title>Netzwerkanalyse</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 12.11.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/netzwerkanalyse">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2018-11-12">
<day>12</day>
<month>11</month>
<year>2018</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 12.11.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/netzwerkanalyse">fortext.net</ext-link></p>
<sec id="definition">
  <title>1. Definition</title>
  <p>In der Netzwerkanalyse werden zuvor bestimmte Größen (z. B.
  Figuren, Autoren, Orte) in ihrer Beziehung zueinander als Netzwerk aus
  Knotenpunkten (auch als Ecke oder mit dem englischen Ausdruck
  <italic>Node</italic> bezeichnet) und Verbindungslinien (auch Kanten,
  Relationen oder auf Englisch <italic>Edges</italic> genannt)
  untersucht. Die Verbindungslinien können gerichtet (meist in Form von
  Pfeilen dargestellt) oder ungerichtet (Linien) sein. Gerade in der
  digitalen Netzwerkanalyse werden zur Netzwerkanalyse häufig
  Visualisierungen
  (<xref alt="Horstmann und Stange 2024" rid="ref-horstmannMethodenbeitragTextvisualisierung2018" ref-type="bibr">Horstmann
  und Stange 2024</xref>) genutzt. Dadurch treten zunächst quantitative
  Aspekte des relationalen Systems, in erster Linie die Anzahl von
  Knoten, Verbindungslinien und Verknüpfungen, deutlich hervor, die als
  Basis einer qualitativen Analyse dienen können. Netzwerkanalysen
  werden durch digitale Programme erleichtert, können aber auch manuell
  durchgeführt werden.</p>
</sec>
<sec id="anwendungsbeispiel">
  <title>2. Anwendungsbeispiel</title>
  <p>Sie wollen die Figurenkonstellation in E.T.A. Hoffmanns Erzähltext
  <italic>Der Sandmann</italic> analysieren. Die Methode der
  Netzwerkanalyse kann Sie dabei unterstützen. Ihre Hypothese ist, dass
  die Figur der Klara besonders stark mit Figuren des familiären
  Umfeldes vernetzt ist und dass die Verbindung dieses Unternetzwerkes
  zur Hauptfigur Nathanael hauptsächlich über Klara hergestellt wird.
  Nathanael hingegen scheint – so Ihre intuitive Beobachtung – geradezu
  in einem anderen Unternetzwerk gefangen zu sein: dem von den Figuren
  Sandmann/Coppelius/Coppola/Professor/Olimpia gebildeten, das Nathanael
  von anderen, positiven Sozialkontakten weitgehend isoliert. Das
  Gesamtnetzwerk, dass Ihre Ausgangshypothese zur Figurenkonstellation
  der <italic>Der Sandmann</italic> abbildet, sieht damit in etwa so
  aus:</p>
  <fig>
    <caption><p>Netzwerkanalyse ist eine Methode, die analog und digital
    durchgeführt werden kann.</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Netzwerk_analog-p-ohne_Transparenz.png" />
  </fig>
  <p>Die Verbindungen zwischen den Figuren, die hier als Kanten
  visualisiert sind, wären hier definiert als deren Interaktionen
  (miteinander sprechen, einander treffen, einander schreiben usw.). Der
  Text liegt Ihnen in digitaler Form (vgl.
  <xref alt="OCR" rid="glossary-ocr">OCR</xref>) vor und Sie haben
  bereits eine Liste aller vorkommenden Figuren erstellt und markiert
  (vgl.
  <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>;
  <xref alt="Tagset" rid="glossary-tagset">Tagset</xref>), wo Figuren
  miteinander in Interaktion treten. Diese Daten visualisieren Sie nun
  mit einem Netzwerkanalysetool wie z. B. Gephi
  (<xref alt="Schumacher 2024" rid="ref-schumacherToolbeitragGephi2019" ref-type="bibr">Schumacher
  2024</xref>):</p>
  <fig>
    <caption><p>Digital mit Gephi erstelltes
    Figuren-Netzwerk</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Netzwerk_Gephi-p.png" />
  </fig>
  <p>In der Analyse des Netzwerkes wird deutlich, dass Nathanael – im
  Gegensatz zu Ihrer Ausgangshypothese – zwar einerseits durchaus mit
  allen Figuren direkt vernetzt ist. Neben der Beziehung zu Klara ist
  vor allem die zu seiner Mutter von großer Bedeutung, aber auch mit
  Lothar, seinem Freund und Klaras Bruder, steht er in relativ
  intensivem Kontakt. Im Netzwerk zeigt sich andererseits jedoch auch
  deutlich, dass die Verbindung Nathanaels zu Klara die am stärksten
  ausgeprägte in der gesamten Erzählung ist. Aus den Vorarbeiten – unter
  anderem dem Versuch, ein gerichtetes Netzwerk zu erstellen – wissen
  Sie, dass die Stärke dieser Verbindung vor allem darauf beruht, dass
  es sich hierbei um eine gegenseitige Beziehung handelt. Nathanaels
  empfundene Liebe zu Olimpia wird zwar häufiger erwähnt als seine
  Gefühle für Klara, Olimpia kann aber aufgrund der Tatsache, dass sie
  eine Puppe ist, natürlich nur wenig zurückgeben. Bei dem Netzwerk der
  Figuren in <italic>Der Sandmann</italic> von E.T.A. Hoffmann handelt
  es sich also um ein stark auf die Hauptfigur zentriertes Netzwerk. Die
  Grundannahme Ihrer Analyse, dass Nathanael stärker sozial isoliert ist
  als Klara, ist somit zunächst falsifiziert. Darüber hinaus werden Sie
  auf weitere Phänomene aufmerksam, die Sie in Anschlussuntersuchungen
  betrachten möchten. Welche Rolle spielen z. B. der Erzähler und der
  implizite Leser für das Figurennetzwerk? Inwiefern wirkt hier der
  Erzählanlass auf das narrative Gefüge ein? Eine umfassendere
  Netzwerkanalyse sämtlicher figuraler Instanzen kann also auch einen
  explorativen Zugang ermöglichen und interessantere Perspektiven
  eröffnen als das eher schematisch-hypothetische, manuell erstellte
  Netzwerk, mit dem Sie Ihre Fallstudie begonnen haben.</p>
</sec>
<sec id="literaturwissenschaftliche-tradition">
  <title>3. Literaturwissenschaftliche Tradition</title>
  <p>Der Begriff des Netzwerks findet sich bereits im Grimmschen
  Wörterbuch aus dem 18. Jahrhundert belegt. Er wurde damals allerdings
  als Bezeichnung für netzartige Verzierungen z. B. von Mode oder
  Einrichtungsgegenständen gebraucht. Netzwerke in dem heute
  gebräuchlichen Sinn eines Konstrukts aus Verbindungen zwischen
  einzelnen Punkten sind in der Wissenschaftsgeschichte in
  unterschiedlichen Disziplinen belegt. Über Technik, Ökonomie,
  Sozialwissenschaft und schließlich Soziolinguistik gelangte der
  Begriff auch in die Literaturwissenschaften
  (<xref alt="Sauder 2003, 167f" rid="ref-sauderNetzwerkAufklarungMercks2003" ref-type="bibr">Sauder
  2003, 167f</xref>.).</p>
  <p>Die literarische Netzwerkanalyse ist eine Methodik, die in
  unterschiedlichen Traditionen der Literaturwissenschaft verankert ist,
  von denen hier vier skizziert seien. Netzwerke können</p>
  <list list-type="order">
    <list-item>
      <p>Figurenkonstellationen darstellen
      (<xref alt="Moretti 2011" rid="ref-morettiNetworkTheoryPlot2011" ref-type="bibr">Moretti
      2011</xref>),</p>
    </list-item>
    <list-item>
      <p>Korrespondenzen von Autoren verbildlichen
      (<xref alt="Hildenbrandt und Kamzelak 2014" rid="ref-hildenbrandtImExilErweitert2014" ref-type="bibr">Hildenbrandt
      und Kamzelak 2014</xref>),</p>
    </list-item>
    <list-item>
      <p>intertextuelle Bezüge aufzeigen
      (<xref alt="Bartalesi u. a. 2015" rid="ref-bartalesiSemanticNetworkDante2015" ref-type="bibr">Bartalesi
      u. a. 2015</xref>) oder</p>
    </list-item>
    <list-item>
      <p>Ähnlichkeiten literarischer Stilistik visualisieren
      (<xref alt="Eder 2017" rid="ref-ederVisualizationStylometryCluster2017" ref-type="bibr">Eder
      2017</xref>).</p>
    </list-item>
  </list>
  <p>Auch in stärker thematisch oder kontextuell orientierter
  literaturwissenschaftlicher Forschung werden Netzwerke entworfen und
  zur Analyse herangezogen, auch wenn diese nicht immer als solche
  benannt werden. So untersucht beispielsweise Rieger
  (<xref alt="1985" rid="ref-riegerGeschlechterrollenUndFamilienstrukturen1985" ref-type="bibr">1985</xref>)
  die Machtstrukturen in Kleists Erzählungen anhand mehrerer
  (gerichteter) Netzwerke, die er nicht als solche, sondern als
  Abbildung der Familienstrukturen bezeichnet. In den letzten fünfzig
  Jahren wurde eine Zunahme im Einsatz von Netzwerkanalysen in
  zahlreichen Disziplinen u. a. in den Geisteswissenschaften beobachtet
  (<xref alt="Jannidis 2017, 147" rid="ref-jannidisNetzwerkanalyse2017" ref-type="bibr">Jannidis
  2017, 147</xref>).</p>
  <list list-type="order">
    <list-item>
      <p>Die Analyse der Figurenkonstellation gehört zu den
      grundlegenden Techniken der Literaturwissenschaft, da Figuren
      immer/meistens in Relation zu anderen Figuren stehen und diese
      Wechselbeziehungen mithilfe einer Netzwerkanalyse ermittelt sowie
      visualisiert werden können. Diese kann grundsätzlich sowohl
      manuell als auch mit digitalen Hilfsmitteln erstellt werden,
      bestimmte Aspekte, wie z. B. die Gewichtung bestimmter Figuren
      oder Relationen auf Basis quantitativer Aspekte, sind allerdings
      leichter mit digitalen Tools zu ermitteln
      (<xref alt="Moretti 2011" rid="ref-morettiNetworkTheoryPlot2011" ref-type="bibr">Moretti
      2011</xref>). Meist wird die Analyse von Figurenkonstellationen
      entweder anhand von Kollokationen (vgl.
      <xref alt="Kollokation" rid="glossary-kollokation">Kollokation</xref>)
      durchgeführt oder mittels qualitativer Kriterien der Relationen
      zwischen einzelnen Figuren wie z. B. Liebesbeziehungen oder
      Rivalität
      (<xref alt="Schneider 2003, 21" rid="ref-schneiderEinfuhrungRomanAnalyse2003" ref-type="bibr">Schneider
      2003, 21</xref>). Die Analyse der Figurenkonstellation dient dazu,
      die Kompositionsstruktur eines Werkes besser zu verstehen (vgl.
      ebd., 22). Nicht immer werden zur Analyse der Figurenkonstellation
      Grafiken genutzt; wenn dies der Fall ist, haben sie aber häufig
      die Form eines ungerichteten (z. B. im Falle der
      Kollokationsanalyse) oder gerichteten (z. B. im Falle der Analyse
      von Liebesbeziehungen) Netzwerkes. Auch in interdisziplinären
      Forschungsansätzen konnten Netzwerke literarischer Figuren
      gewinnbringend eingesetzt werden. So analysieren Schweizer und
      Schnegg (1998) Netzwerke in Ingo Schulzes Roman <italic>Simple
      Stories</italic> aus ethnologischer Perspektive. In dieser
      interdisziplinär angelegten Studie wird unter anderem deutlich,
      dass sich die Figurenkonstellation im betrachteten literarischen
      Werk von tatsächlichen sozialen Systemen dadurch unterscheidet,
      dass die Figuren untereinander sehr viel stärker vernetzt sind als
      tatsächliche Personen (vgl. Schweizer und Schnegg 1998).</p>
    </list-item>
    <list-item>
      <p>Fast noch naheliegender als bei der Figurenkonstellation ist
      das Erstellen von Netzwerken als Analysemethode bei
      Korrespondenzen. Briefe sind in soziale Kommunikationsprozesse
      eingebunden und haben darum eine inhärente netzwerkbildende
      Funktion
      (<xref alt="Hildenbrandt und Kamzelak 2014, 175" rid="ref-hildenbrandtImExilErweitert2014" ref-type="bibr">Hildenbrandt
      und Kamzelak 2014, 175</xref>). Als Knotenpunkte eines
      Briefnetzwerkes werden die miteinander kommunizierenden Personen,
      die Orte, mit denen sie verbunden sind (vgl. ebd., 175) oder auch
      Institutionen zum Gegenstand der Betrachtung. In vielen
      Untersuchungen werden mehrere Aspekte gleichzeitig erforscht. Zum
      Beispiel untersucht Siegert sowohl Korrespondenznetzwerke als auch
      die Bedeutung der Postämter, die die Korrespondenz leiten
      (<xref alt="Siegert 1990" rid="ref-siegertNetzwerkeRegimentalitatHarsdorfers1990" ref-type="bibr">Siegert
      1990</xref>). Häufig werden kommunikative Netzwerke ausgehend von
      einer zentralen Figur, also als sog. egozentrierte Netzwerke (mehr
      zum Begriff des egozentrierten Netzwerkes z. B. in Wolf 2010,
      471–483), angelegt und untersucht
      (<xref alt="Widawska 2011, 129" rid="ref-widawskaInformationstransferDeutschpolnischenKorrespondenznetzwerken2011" ref-type="bibr">Widawska
      2011, 129</xref>). Die Netzwerke, die sich durch
      Briefkorrespondenz ergeben, sind komplex, da sie unterschiedliche
      relationale Ebenen abbilden. In der Netzwerkanalyse werden diese
      Ebenen – z. B. die soziale, thematische oder räumliche Ebene –
      einzeln oder gemeinsam betrachtet
      (<xref alt="Hildenbrandt und Kamzelak 2014, 176" rid="ref-hildenbrandtImExilErweitert2014" ref-type="bibr">Hildenbrandt
      und Kamzelak 2014, 176</xref>). Briefnetzwerke einzelner
      Schriftsteller zeigen deren soziale und geografische Position und
      welche Funktion ihnen jeweils innerhalb eines Gefüges
      literarischer Kontakte zukommt. In der Netzwerkanalyse von
      Briefkorrespondenzen werden quantitative Aspekte in Verbindung
      gebracht mit Textanalysen von Briefinhalten und Selbstaussagen des
      Autors und dadurch mehrdeutig interpretiert
      (<xref alt="Sauder 2003" rid="ref-sauderNetzwerkAufklarungMercks2003" ref-type="bibr">Sauder
      2003</xref>). In der Literatursoziologie werden Knotenpunkte und
      Verbindungen eines Netzwerkes kontextuell bzw. in einem
      gesellschaftlichen Systemzusammenhang betrachtet. In Siegerts
      (1990) Analyse von Briefnetzwerken, die gänzlich ohne
      Visualisierung des Netzwerkes auskommt, werden z. B. Postämter zu
      Knotenpunkten, zwischen denen nicht nur Briefe hin- und
      hergeschickt werden können bzw. durch die Monopolisierung auch
      müssen, sondern die gleichzeitig auch die Transportwege anderer
      Akteure, nämlich von Personen, sind
      (<xref alt="Siegert 1990, 537" rid="ref-siegertNetzwerkeRegimentalitatHarsdorfers1990" ref-type="bibr">Siegert
      1990, 537</xref>). Eine weitere Besonderheit von Briefnetzwerken
      ist, dass die Relationen nicht nur die neutralen Werte gerichtet
      oder ungerichtet oder qualitative Auszeichnungen wie
      „freundschaftlich“, „feindschaftlich“, „tröstend“, „bittend“ und
      viele weitere haben können, sondern dass sie Teil eines
      Wissenssystems sind (vgl. ebd., 550) und zum Kulturtransfer
      beitragen können
      (<xref alt="Widawska 2011, 130" rid="ref-widawskaInformationstransferDeutschpolnischenKorrespondenznetzwerken2011" ref-type="bibr">Widawska
      2011, 130</xref>). Gerade diese Komplexität ist es, die sich auch
      in der Methode der Netzwerkanalyse widerspiegelt: Der systemische
      Charakter kann immer mitgedacht werden.</p>
    </list-item>
    <list-item>
      <p>In der Intertextualitätsforschung gibt es die Basisannahme,
      dass Texte nicht für sich allein, als abgeschlossene Systeme
      wirken, sondern dass sie in Bezug zu einem referentiellen
      Wissenssystem von Autor*innen auf der einen und von Leser*innen
      auf der anderen Seite stehen
      (<xref alt="Helbling 1995, 8" rid="ref-helblingVernetzteTexteLiterarisches1995" ref-type="bibr">Helbling
      1995, 8</xref>), wobei der Leserschaft über die Interpretation der
      Intertextualitäten eine besondere Rolle zukommt
      (<xref alt="Pfister 1985, 20" rid="ref-pfisterKonzepteIntertextualitat1985" ref-type="bibr">Pfister
      1985, 20</xref>). Darüber hinaus wurde Bachtins (1979) Idee der
      sog. <italic>Dialogizität</italic> in dieser
      literaturwissenschaftlichen Traditionslinie weitergedacht; von
      einer Kommunikation zwischen zwei Texten hin zu einer
      Vielstimmigkeit, die Texte nicht nur untereinander sondern auch
      mit der Gesellschaft verbindet
      (<xref alt="Pfister 1985" rid="ref-pfisterKonzepteIntertextualitat1985" ref-type="bibr">Pfister
      1985</xref>). Auch hier gibt es also die Basiskomponenten eines
      Netzwerkes: Knotenpunkte in Form kultureller Werke (Texte) und
      Beziehungen dieser Werke untereinander und/oder zu
      gesellschaftlichen Phänomenen, die innerhalb der
      Intertextualitätsforschung zum Teil ebenfalls als „Text“
      verstanden werden
      (<xref alt="Pfister 1985, 7" rid="ref-pfisterKonzepteIntertextualitat1985" ref-type="bibr">Pfister
      1985, 7</xref>). Intertextuelle Bezüge können – ähnlich wie
      Autorenkorrespondenzen – als egozentrierte Netzwerke modelliert
      werden, in deren Fokus ein bestimmtes Werk steht. Die Referenzen
      zu vorhergehenden Texten der Literaturgeschichte oder eigenen
      Werken (intratextuell) und auch innerhalb des Textes (inner- oder
      intratextuell) bilden ein System, das seinerseits eingebettet ist
      in einen übergeordneten Diskurs
      (<xref alt="Gray 2017, 127" rid="ref-grayIntertextualitatVernetzung2017" ref-type="bibr">Gray
      2017, 127</xref>). Intertextuelle Bezüge können im literarischen
      Text sowohl über die Sprache als auch intermedial z. B. über
      Abbildungen aufgerufen werden (vgl. ebd., 128). Grundsätzlich ist
      es sehr schwierig, vielleicht sogar unmöglich, Intertextualität so
      zu operationalisieren, dass sie exakt messbar wird
      (<xref alt="Pfister 1985, 26" rid="ref-pfisterKonzepteIntertextualitat1985" ref-type="bibr">Pfister
      1985, 26</xref>). Jegliche Analyse, auch die mit Hilfe von
      Netzwerken, ist dadurch stark von heuristischen Interpretationen
      abhängig (vgl. ebd., 25–26).</p>
    </list-item>
    <list-item>
      <p>In der digitalen Forschung zum Autor*innenstil werden dagegen
      ganz konkrete textuelle Merkmale statistisch ausgewertet. Anhand
      von Kriterien wie Worthäufigkeiten können dann Texte
      unterschiedlicher Autoren miteinander verglichen und klassifiziert
      werden
      (<xref alt="Weitin, Gilli und Kunkel 2016, 107" rid="ref-weitinAuslegenUndAusrechnen2016" ref-type="bibr">Weitin,
      Gilli und Kunkel 2016, 107</xref>). Hier wird meist eher der
      Versuch unternommen, Autoren voneinander zu unterscheiden
      (<xref alt="Barth 2018, 95" rid="ref-barthZwischenElisabethHauptmann2018" ref-type="bibr">Barth
      2018, 95</xref>), statt sie wie in der Intertextualitätsforschung
      miteinander in Verbindung zu setzen. Allerdings können die
      ermittelten Zahlenwerte auch dazu dienen, Netzwerkvisualisierungen
      von Autoren zu erstellen, die aufzeigen, welche Autoren sich
      stilistisch nahe stehen. Diese können dann wiederum zum
      Ausgangspunkt einer Netzwerkanalyse werden
      (<xref alt="Eder 2017" rid="ref-ederVisualizationStylometryCluster2017" ref-type="bibr">Eder
      2017</xref>).</p>
    </list-item>
  </list>
</sec>
<sec id="diskussion">
  <title>4. Diskussion</title>
  <p>Jede Form der Netzwerkanalyse, sei sie analog oder digital
  unterstützt durchgeführt, bietet zunächst den Vorteil, Strukturen im
  Text fassbar zu machen, die nicht auf den ersten Blick sichtbar sind
  (vgl. Abschnitt 3). Darüber hinaus können komplexe Kontexte mit Hilfe
  dieser Methode besonders gut berücksichtigt werden. Grundsätzlich
  birgt die Methode bzw. ihre Anwendung in der Literaturwissenschaft
  allerdings auch nachteilige Aspekte wie z. B. eine relativ hohe
  Abstraktion vom Text und die Konzentration auf einzelne Aspekte
  desselben.
  Speziell die digitale Netzwerkanalyse bietet den Vorteil, dass eine
  große Datenbasis berücksichtigt werden kann und dass mathematische
  Verfahren die Auswertung dieser Daten unterstützen (vgl.
  <xref alt="Text Mining" rid="glossary-text-mining">Text
  Mining</xref>). Auf dieser Grundlage können Berechnungen darüber in
  die Analyse einfließen, welcher Art die Verbindungen zwischen zwei
  Figuren sind. Es kann z. B. berücksichtigt werden, dass Nathanael in
  einem Verhältnis der Angst zur Figur des Sandmannes steht, dass er
  hingegen für Olimpia Liebe empfindet und dass die Automate Olimpia
  zwar in einem Schöpfungsverhältnis zum Professor steht und häufig mit
  Nathanael kopräsent ist, dass von ihr aber keinerlei Emotionen
  ausgehen. Darüber hinaus könnte abgebildet werden, dass Nathanaels
  Angst vor dem Sandmann größer ist als die vor dem Professor. Es können
  also einerseits skalare Größen mit einbezogen und andererseits
  komplexe Verhältnisse der Figuren untereinander abgebildet werden.
  Henning zeigt anhand ihrer Analyse von Thomas Manns
  <italic>Zauberberg</italic> auf, dass Netzwerkanalyse versteckte
  soziale Strukturen in Narrativen aufzeigt und dass diese Methode dabei
  eine vergleichsweise hohe Präzision ermöglicht
  (<xref alt="Henning 2006, 466" rid="ref-henningNetzwerkanalyseLiterarischerTexte2006" ref-type="bibr">Henning
  2006, 466</xref>). Auch Moretti
  (<xref alt="2011, 4" rid="ref-morettiNetworkTheoryPlot2011" ref-type="bibr">2011,
  4</xref>) verweist darauf, dass die vergleichsweise hohe Abstraktion
  einer Netzwerkanalyse besonders geeignet ist, um verborgene Strukturen
  sichtbar zu machen, und damit auch Vorteile hat. Wie das
  Anwendungsbeispiel <italic>Der Sandmann</italic> gezeigt hat, kann die
  Möglichkeit, eine große Datenmenge zu berücksichtigen, auch einen
  explorativen Zugang zu Texten ermöglichen.
  Einer der größten Vorteile der digitalen Netzwerkanalyse ist die
  Möglichkeit, sehr komplexe Zusammenhänge und/oder sehr viele Parameter
  abbilden zu können. Dies birgt aber umgekehrt auch die Gefahr, dass
  das Netzwerk unübersichtlich und als Hilfsmittel zur
  Textinterpretation unbrauchbar wird. Es ist also auch für die digitale
  Netzwerkanalyse zunächst eine Komplexitätsreduktion und eine klare
  Definition dessen erforderlich, was in den Fokus der Betrachtung
  gerückt werden soll. Mit digitalen Hilfsmitteln erstellte
  Netzwerkvisualisierungen wirken selbst bei vorangegangener
  Konzentration auf Kernaspekte häufig noch sehr komplex; eine Tatsache,
  die verschleiert, dass nicht sämtliche Aspekte eines
  Forschungsgegenstandes wie z. B. der Figurenkonstellation des
  <italic>Sandmann</italic> abgebildet werden.
  Der größte Nachteil der digitalen Netzwerkanalyse in der
  Literaturwissenschaft ist aber, dass sie stets nur eine Art der
  Verbindung und nur eine im mathematischen Sinne positive anzeigen
  kann. In unserem Beispiel <italic>Der Sandmann</italic> hat Nathanael
  eine ungerichtete Verbindung zu seinem Vater (Vater – Sohn). Außerdem
  erwähnt Nathanael seinen Vater gegenüber Lothar, was als gerichtete
  Verbindung visualisiert werden könnte. Da aber stets nur eine Art der
  Verbindung in einer Netzwerkvisualisierung angezeigt werden kann, muss
  hier eine Auswahl getroffen werden. Im oben genannten Beispiel fiel
  diese auf die ungerichtete Variante, unter der dann auch gerichtete
  Arten der Kommunikation subsumiert wurden. Dieser Kompromiss ist für
  dieses Beispiel hinnehmbar, dass aber etwas, das nicht stattfindet,
  auch nicht oder nur unzureichend in die Visualisierung einbezogen
  werden kann, ist hier von entscheidender Bedeutung. Ein zentraler
  Bestandteil des Erzähltextes ist, dass Nathanael nach dem ersten
  Zusammentreffen mit Coppelius nicht mit seinem Vater darüber spricht.
  Diese nicht stattfindende Kommunikation bedingt, dass die
  Zusammenarbeit zwischen Coppelius und Nathanaels Vater mystifiziert
  bleibt. In der Netzwerkvisualisierung bleibt dieses Nicht-Gespräch
  (das im Falle unseres Beispiels als negativer Wert einbezogen wurde,
  der in die Berechnung der Verbindungsstärke eingeflossen ist und somit
  die Verbindung zwischen Vater und Sohn geschwächt hat) verborgen.
  In der digitalen Netzwerkanalyse treten quantitativ bedeutsame
  Phänomene besonders hervor und werden dadurch mit Bedeutung versehen.
  Dies bewirkt nicht nur, wie oben bereits ausgeführt, dass nicht
  Stattfindendes nicht oder nur unzureichend einbezogen werden kann,
  sondern auch, dass selten stattfindende Ereignisse weniger betont
  werden. Im oben genannten Fallbeispiel haben Coppelius, der Sandmann
  und Coppola eine von Nathanael unterstellte Verbindung, die gar nicht
  stärker sein könnte – er glaubt, sie seien eine Person. Der einzige
  Hinweis darauf, dass diese Vermutung richtig sein könnte, ist, dass
  die drei Figuren nie gemeinsam in Aktion treten. Dieses nicht zusammen
  Agieren, das auf die stärkste mögliche Verbindung hindeutet, kann aber
  im digital erstellten Netzwerk nicht angezeigt werden. Was sichtbar
  wird, ist die relativ selten von Nathanael geäußerte Vermutung, dass
  es sich um eine einzige Person handeln könnte, eine nicht besonders
  auffällig erscheinende Verbindung unter anderen.
  In Verbindung mit anderen digitalen Textanalysetools kann
  Netzwerkanalyse als reine
  <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
  Reading</xref>-Methode eingesetzt werden. In diesem Falle können
  vollautomatisch Kanten und Verbindungen berechnet werden. Hier müssen
  die Parameter sehr bewusst ausgewählt und möglichst in der Analyse
  auch offengelegt werden. Geschieht dies nicht, so kann es dazu kommen,
  dass das resultierende Netzwerk zwar objektiv erscheint, dass es aber
  undurchsichtig bleibt, da nicht klar wird, welche Aspekte von Texten
  einbezogen und auf welche verzichtet wurde. Die Methode wird dann zu
  einer sog. Black Box, von der unklar ist, ob sie es tatsächlich
  vermag, Texte zu entschlüsseln, oder ob sie nicht eher Gegenteiliges
  bewirkt.</p>
</sec>
<sec id="technische-grundlagen">
  <title>5. Technische Grundlagen</title>
  <p>Die digital unterstützte Form der Netzwerkanalyse ist grundsätzlich
  ohne tiefgreifende technische Kenntnisse durchführbar. Bei der
  Erstellung einer Netzwerkanalyse gibt es unterschiedliche Verfahren,
  die grob in drei Ansätze unterteilt werden können.</p>
  <list list-type="order">
    <list-item>
      <p>Nutzung einer Netzwerk-Visualisierungs-Software (wie z. B.
      Gephi
      (<xref alt="Schumacher 2024" rid="ref-schumacherToolbeitragGephi2019" ref-type="bibr">Schumacher
      2024</xref>)), die als Eingabemaske für im
      <xref alt="Close Reading" rid="glossary-close-reading">Close
      Reading</xref>-Verfahren am Text festgestellte Merkmale verwendet
      wird. Der Computer rechnet dann lediglich die Häufigkeiten der
      Eingaben oder die selbst vergebenen Gewichtungen zusammen.</p>
    </list-item>
    <list-item>
      <p>Nutzung eines semi-automatischen Verfahrens, bei dem mit Hilfe
      einer anderen Software bestimmte Parameter wie z. B.
      Kollokation/Kopräsenz untersucht wurden, die dann manuell in ein
      Netzwerkanalysetool (wie z. B. Ezlinavis
      (<xref alt="Flüh 2024" rid="ref-fluhToolbeitragEzlinavis2019" ref-type="bibr">Flüh
      2024</xref>)) übertragen werden. Auch hier können noch
      Gewichtungen vorgenommen werden.</p>
    </list-item>
    <list-item>
      <p>Übertragung von statistischen Daten, die mit einem anderen Tool
      (wie z. B. des Stilometrie-Tools Stylo
      (<xref alt="Horstmann 2024a" rid="ref-horstmannToolbeitragStylo2024" ref-type="bibr">Horstmann
      2024a</xref>;
      <xref alt="Horstmann 2024b" rid="ref-horstmannMethodenbeitragStilometrie2024" ref-type="bibr">Horstmann
      2024b</xref>)) generiert wurden, in das Netzwerkanalyse-Tool, das
      diese Daten dann für die Visualisierung
      (<xref alt="Horstmann und Stange 2024" rid="ref-horstmannMethodenbeitragTextvisualisierung2018" ref-type="bibr">Horstmann
      und Stange 2024</xref>) auswertet.</p>
    </list-item>
  </list>
  <p>Gängige Tools stellen grafische Benutzeroberflächen (vgl.
  <xref alt="GUI" rid="glossary-gui">GUI</xref>), Bedienungsanleitungen
  und Tutorials bereit und machen es möglich, Netzwerkvisualisierungen
  zu erstellen, ohne Programmcodes nutzen zu müssen. Allerdings sind
  gewisse mathematische und statistische Verfahren grundlegend, deren
  Kenntnis bei der Interpretation des Netzwerkes sehr hilfreich ist.
  Eine umfassende Einführung in diese Grundlagen finden Sie bei Jannidis
  (2017, 147–161). Im Folgenden seien nur einige zentrale Aspekte davon
  aufgeführt:</p>
  <list list-type="bullet">
    <list-item>
      <p><bold>Graphentheorie:</bold> Ein Netzwerk ist ein Graph, der
      aus Knoten und Verbindungen besteht. Außer diesen beiden sind
      zunächst keine weiteren Parameter mit Bedeutung versehen. Es
      können allerdings sowohl bei den Knoten- als auch bei den
      Kantenelementen Bedeutungen hinzugefügt werden, dazu gehören:</p>
      <list list-type="bullet">
        <list-item>
          <p><italic>Verbindungen</italic>: Richtung, Dicke, Länge und
          Farbe (um z. B. die Verbindungsstärke oder -qualität zwischen
          zwei Figuren zu zeigen)</p>
        </list-item>
        <list-item>
          <p><italic>Knoten</italic>: Größe und Farbe des Knotens, um z.
          B. die (quantitative) Bedeutung einer Figur innerhalb einer
          Figurenkonstellation hervorzuheben</p>
        </list-item>
      </list>
    </list-item>
    <list-item>
      <p><bold>Zentralitätsmaß:</bold> Vor allem bei egozentrierten
      Netzwerken ist es wichtig offenzulegen, welche Parameter einen
      Knoten ins Zentrum rücken. Ein wichtiges Maß für Zentralität ist
      z. B. die Menge der Verbindungen eines Knotens. Auch die Position
      zwischen zwei Teilbereichen eines Netzwerkes kann einen Knoten ins
      Zentrum rücken (wie in unserem Beispiel Nathanael). Nutzt man
      digitale Tools mit vorgegebenen Layouts, ist es wichtig zu wissen,
      welcher Art das zu Grunde liegende Zentralitätsmaß ist bzw. ob das
      Layout ein solches überhaupt verwendet (dies ist z. B. der Fall
      beim sog. <italic>Force Directed Network Graph</italic>).</p>
    </list-item>
    <list-item>
      <p><bold>Abstandsmessungen:</bold> Bei automatischen Verfahren zur
      Erstellung der Datengrundlage eines Netzwerkes werden häufig
      Algorithmen benutzt, die ermitteln, welche Knotenpunkte wie nah
      beieinander liegen. Dazu wird zuerst ermittelt, zu welchem anderen
      Knotenpunkt ein Ausgangsknoten besonders dicht steht
      (<italic>nearest neighbours</italic>) Dann wird einbezogen, mit
      welchen Knotenpunkten der Ausgangsknoten über einen anderen Knoten
      verbunden ist (<italic>second neighbours</italic>) usw. Die
      Abstandsmessungen können beliebig viele Ausgangsknoten
      berücksichtigen und dementsprechend komplex werden. Bei der
      vollautomatischen Erstellung von Netzwerkvisualisierungen kann oft
      ausgewählt werden, welche Relationsabstände berücksichtigt werden
      sollen (z. B. nur <italic>nearest neighbours</italic>).</p>
    </list-item>
    <list-item>
      <p><bold>Manuelle Anpassung der Visualisierung:</bold> Es gehört
      zu den gängigen Funktionen von Netzwerkanalysetools, dass eine
      Visualisierung zuerst statistisch erstellt und dann manuell
      nachbearbeitet wird. Dabei ist es nicht nur möglich, die unter dem
      Punkt Graphentheorie aufgeführten Bedeutungsebenen einzuarbeiten,
      sondern auch Zentralität und Abstand zu verändern. Dieser
      Arbeitsschritt ist essentiell für die Methode, sollte aber in dem
      Bewusstsein durchgeführt werden, dass damit bestimmte Aspekte der
      vorangegangenen Berechnungen verändert werden. Ebenso wie bei der
      Aufbereitung der Daten, die wie oben beschrieben in
      unterschiedlicher Weise durchgeführt werden kann, handelt es sich
      hierbei um einen interpretatorischen Arbeitsschritt. Am Ende
      verdeutlicht also auch das digital erstellte Netzwerk das Ergebnis
      einer Interpretation und macht diese nachvollziehbar (zu der nur
      vermeintlichen Objektivität von Visualisierungen vgl.
      Textvisualisierung
      (<xref alt="Horstmann und Stange 2024" rid="ref-horstmannMethodenbeitragTextvisualisierung2018" ref-type="bibr">Horstmann
      und Stange 2024</xref>)).</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-close-reading">Close
      Reading</styled-content></term>
      <def>
        <p>Close Reading bezeichnet die sorgfältige Lektüre und
        Interpretation eines einzelnen oder weniger Texte. Close Reading
        ist in der digitalen Literaturwissenschaft außerdem mit der
        manuellen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        textueller Phänomene verbunden (vgl. auch
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref> als Gegenbegriff).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-commandline">Commandline</styled-content></term>
      <def>
        <p>Die Commandline (engl. <italic>command line
        interface</italic> (CLI)), auch Kommandozeile, Konsole, Terminal
        oder Eingabeaufforderung genannt, ist die direkteste Methode zur
        Interaktion eines Menschen mit einem Computer. Programme ohne
        eine grafische Benutzeroberfläche
        (<xref alt="GUI" rid="glossary-gui">GUI</xref>) werden i. d. R.
        durch Texteingabe in die Commandline gesteuert. Um die
        Commandline zu öffnen, klicken Sie auf Ihrem Mac „cmd“ +
        „space“, geben „Terminal“ ein und doppelklicken auf das
        Suchergebnis. Bei Windows klicken Sie die Windowstaste + „R“,
        geben „cmd.exe“ ein und klicken Enter.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-data-mining">Data
      Mining</styled-content></term>
      <def>
        <p>Data Mining gehört zum Fachbereich
        <xref alt="Information Retrieval" rid="glossary-information-retrieval">Information
        Retrieval</xref> und bezieht sich auf die systematische
        Anwendung computergestützter Methoden, die darauf abzielt, in
        vorhandenen Datenbeständen Muster, Trends oder Zusammenhänge zu
        erkennen. Textbasierte Formen des Data Minings sind u. a.
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>,
        <xref alt="Web Mining" rid="glossary-web-mining">Web
        Mining</xref> und
        <xref alt="Opinion Mining" rid="glossary-opinion-mining">Opinion
        Mining</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-distant-reading">Distant
      Reading</styled-content></term>
      <def>
        <p>Distant Reading ist ein Ansatz aus den digitalen
        Literaturwissenschaften, bei dem computationelle Verfahren auf
        häufig große Mengen an Textdaten angewandt werden, ohne dass die
        Texte selber gelesen werden. Meist stehen hier quantitative
        Analysen im Vordergrund, es lassen sich jedoch auch qualitative
        <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>
        quantitativ vergleichen. Als Gegenbegriff zu
        <xref alt="Close Reading" rid="glossary-close-reading"><italic>Close
        Reading</italic></xref> wurde der Begriff insbesondere von
        Franco Moretti (2000) geprägt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-gui">GUI</styled-content></term>
      <def>
        <p>GUI steht für <italic>Graphical User Interface</italic> und
        bezeichnet eine grafische Benutzeroberfläche. Ein GUI ermöglicht
        es, Tools mithilfe von grafischen Schaltflächen zu bedienen, um
        somit beispielsweise den Umgang mit der
        <xref alt="Commandline" rid="glossary-commandline">Commandline</xref>
        zu umgehen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-information-retrieval">Information
      Retrieval</styled-content></term>
      <def>
        <p>Die Teildisziplin der Informatik, das Information Retrieval,
        beschäftigt sich mit der computergestützten Suche und
        Erschließung komplexer Informationen in meist unstrukturierten
        Datensammlungen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-kollokation">Kollokation</styled-content></term>
      <def>
        <p>Als Kollokation bezeichnet man das häufige, gemeinsame
        Auftreten von Wörtern oder Wortpaaren in einem vordefinierten
        Textabschnitt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z. B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-ocr">OCR</styled-content></term>
      <def>
        <p>OCR steht für <italic>Optical Character Recognition</italic>
        und bezeichnet die automatische Texterkennung von gedruckten
        Texten, d. h. ein Computer „liest“ ein eingescanntes Dokument,
        erkennt und erfasst den Text darin und generiert daraufhin eine
        elektronische Version.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-opinion-mining">Opinion
      Mininig</styled-content></term>
      <def>
        <p>Unter Opinion Mining, oder Sentiment Analysis, versteht man
        die Analyse von Stimmungen oder Haltungen gegenüber einem Thema,
        durch die Analyse natürlicher Sprache. Das Opinion Mining gehört
        zu den Verfahren des
        <xref alt="Text Minings" rid="glossary-text-mining">Text
        Minings</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic>, oder „Wortart“
        auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-tagset">Tagset</styled-content></term>
      <def>
        <p>Ein Tagset definiert die Taxonomie, anhand derer
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        in einem Projekt erstellt werden. Ein Tagset beinhaltet immer
        mehrere Tags und ggf. auch Subtags. Ähnlich der
        <xref alt="Type/Token" rid="glossary-type-token">Type/Token</xref>
        -Differenz in der Linguistik sind Tags deskriptive Kategorien,
        wohingegen Annotationen die einzelnen Vorkommnisse dieser
        Kategorien im Text sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-text-mining">Text
      Mining</styled-content></term>
      <def>
        <p>Das Text Mining ist eine textbasierte Form des
        <xref alt="Data Minings" rid="glossary-data-mining">Data
        Minings</xref>. Prozesse &amp; Methoden, computergestützt und
        automatisch Informationen bzw. Wissen aus unstrukturierten
        Textdaten zu extrahieren, werden als Text Mining
        zusammengefasst.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-web-mining">Web
      Mining</styled-content></term>
      <def>
        <p>Unter Web Mining versteht man die Anwendung von Techniken des
        <xref alt="Data Mining" rid="glossary-data-mining">Data
        Mining</xref> zur Extraktion von Informationen aus dem World
        Wide Web. Das Web Mining ist ein Teilbereich des Data Minings
        und zählt zu einem der wichtigsten Anwendungsgebiete für das
        <xref alt="Text Mining" rid="glossary-text-mining">Text
        Mining</xref>.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-bachtinAsthetikWortes1979">
    <mixed-citation>Bachtin, Michail. 1979. <italic>Die Ästhetik des
    Wortes</italic>. Frankfurt: Suhrkamp.</mixed-citation>
  </ref>
  <ref id="ref-bartalesiSemanticNetworkDante2015">
    <mixed-citation>Bartalesi, Valentina, Carlo Megini, Paola Andriani
    und Mirko Tavoni. 2015. Towards a Semantic Network of Dante’s Works
    and Their Contextual Knowledge. <italic>Digital Scholarship in the
    Humanities</italic> 30, Nr. 1: i28–i35. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1093/llc/fqv044">10.1093/llc/fqv044</ext-link>,.</mixed-citation>
  </ref>
  <ref id="ref-barthZwischenElisabethHauptmann2018">
    <mixed-citation>Barth, Florian. 2018. Zwischen Elisabeth Hauptmann
    und Bertolt Brecht: Stilometrische Studien einer Zusammenarbeit. In:
    <italic>Quantitative Ansätze in den Literatur- und
    Geisteswissenschaften. Systematische und historische
    Perspektiven</italic>, hg. von Toni Bernhard, Markus Willand, Sandra
    Richter, und Andrea Albrecht, 95–120. Berlin, Boston: de Gruyter.
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1515/9783110523300-005">https://doi.org/10.1515/9783110523300-005</ext-link>
    (zugegriffen: 8. November 2018).</mixed-citation>
  </ref>
  <ref id="ref-ederVisualizationStylometryCluster2017">
    <mixed-citation>Eder, Maciej. 2017. Visualization in stylometry:
    Cluster analysis using networks. <italic>Digital Scholarship in the
    Humanities</italic> 32, Nr. 1: 50–64. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1093/llc/fqv061">10.1093/llc/fqv061</ext-link>,
    (zugegriffen: 13. November 2018).</mixed-citation>
  </ref>
  <ref id="ref-fluhToolbeitragEzlinavis2019">
    <mixed-citation>Flüh, Marie. 2024. Toolbeitrag: Ezlinavis. Hg. von
    Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 6. Netzwerkanalyse (30.
    August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3784">10.48694/fortext.3784</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/ezlinavis">https://fortext.net/tools/tools/ezlinavis</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-gamperKnotenUndKanten2012">
    <mixed-citation>Gamper, Markus, Linda Reschke und Michael Schönhuth.
    2012. <italic>Knoten und Kanten 2.0. Soziale Netzwerkanalyse in
    Medienforschung und Kulturanthropologie</italic>. Bielefeld:
    Transcript.</mixed-citation>
  </ref>
  <ref id="ref-giessmannNetzeUndNetzwerke2006">
    <mixed-citation>Giessmann, Sebastian. 2006. <italic>Netze und
    Netzwerke. Archäologie einer Kulturtechnik 1740-1840</italic>.
    Bielefeld: Transcript.</mixed-citation>
  </ref>
  <ref id="ref-grayIntertextualitatVernetzung2017">
    <mixed-citation>Gray, Richard T. 2017. Intertextualität/Vernetzung.
    In: <italic>W. G. Sebald Handbuch</italic>, hg. von Claudia
    Öhlschläger und Michael Niehaus, 122–129. Stuttgart:
    Springer.</mixed-citation>
  </ref>
  <ref id="ref-helblingVernetzteTexteLiterarisches1995">
    <mixed-citation>Helbling, Brigitte. 1995. <italic>Vernetzte Texte.
    Ein literarisches Verfahren von Weltenbau. Mit den Fallbeispielen
    Ingeborg Bachmann, Uwe Johnson und einer Digression zum Comic Strip
    Doonesburry</italic>. Würzburg: Königshausen &amp;
    Neumann.</mixed-citation>
  </ref>
  <ref id="ref-henningNetzwerkanalyseLiterarischerTexte2006">
    <mixed-citation>Henning, Martina. 2006. Netzwerkanalyse
    literarischer Texte – am Beispiel Thomas Manns „Der Zauberberg“. In:
    <italic>Qualitative Netzwerkanalyse</italic>, hg. von Martina
    Hollstein und Florian Strauss, 465–480. Wiesbaden: VS Verlag für
    Sozialwissenschaften.</mixed-citation>
  </ref>
  <ref id="ref-hildenbrandtImExilErweitert2014">
    <mixed-citation>Hildenbrandt, Vera und Roland S. Kamzelak. 2014. Im
    Exil erweitert sich die Welt. Neue Zugangswege zu Korrespondenzen
    durch Visualisierung. <italic>Internationales Jahrbuch für
    Editionswissenschaft</italic> 28, Nr. 1: 175–192. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1515/editio-2014-011">10.1515/editio-2014-011</ext-link>,
    (zugegriffen: 12. November 2018).</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragStilometrie2024">
    <mixed-citation>Horstmann, Jan. 2024b. Methodenbeitrag: Stilometrie.
    Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 1. Stilometrie
    (26. Februar). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3769">10.48694/fortext.3769</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/stilometrie">https://fortext.net/routinen/methoden/stilometrie</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannToolbeitragStylo2024">
    <mixed-citation>———. 2024a. Toolbeitrag: Stylo. Hg. von Evelyn Gius.
    <italic>forTEXT</italic> 1, Nr. 1. Stilometrie (26. Februar). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3770">10.48694/fortext.3770</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/stylo">https://fortext.net/tools/tools/stylo</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragTextvisualisierung2018">
    <mixed-citation>Horstmann, Jan und Jan-Erik Stange. 2024.
    Methodenbeitrag: Textvisualisierung. Hg. von Evelyn Gius.
    <italic>forTEXT</italic> 1, Nr. 5. Textvisualisierung (7. August).
    doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3772">10.48694/fortext.3772</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/textvisualisierung">https://fortext.net/routinen/methoden/textvisualisierung</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-jannidisNetzwerkanalyse2017">
    <mixed-citation>Jannidis, Fotis. 2017. Netzwerkanalyse. In:
    <italic>Digital Humanities. Eine Einführung</italic>, hg. von Fotis
    Jannidis, Hubertus Kohle, und Malte Rehbein, 147–161. Stuttgart:
    Metzler.</mixed-citation>
  </ref>
  <ref id="ref-morettiNetworkTheoryPlot2011">
    <mixed-citation>Moretti, Franco. 2011. Network Theory, Plot
    Analysis. <italic>Stanford Literary Lab Pamphlets 2</italic>.
    <ext-link ext-link-type="uri" xlink:href="https://litlab.stanford.edu/LiteraryLabPamphlet2.pdf">https://litlab.stanford.edu/LiteraryLabPamphlet2.pdf</ext-link>
    (zugegriffen: 10. Oktober 2018).</mixed-citation>
  </ref>
  <ref id="ref-pfisterKonzepteIntertextualitat1985">
    <mixed-citation>Pfister, Manfred. 1985. Konzepte der
    Intertextualität. In: <italic>Intertextualität. Formen, Funktionen,
    anglistische Fallstudien</italic>, hg. von Ulrich Broich und Manfred
    Pfister, 1–30. Tübingen: Niemeyer.</mixed-citation>
  </ref>
  <ref id="ref-riegerGeschlechterrollenUndFamilienstrukturen1985">
    <mixed-citation>Rieger, Bernhard. 1985. <italic>Geschlechterrollen
    und Familienstrukturen in den Erzählungen Heinrich von
    Kleists</italic>. Frankfurt am Main: Lang.</mixed-citation>
  </ref>
  <ref id="ref-sauderNetzwerkAufklarungMercks2003">
    <mixed-citation>Sauder, Gerhard. 2003. Netzwerk der Aufklärung:
    Mercks Briefe. In: <italic>Netzwerk der Aufklärung. Neue Lektüren zu
    Johann Heinrich Merck</italic>, hg. von Ulrike Leuschner und
    Matthias Luserke-Jaqui, 167–182. Berlin: de
    Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-schneiderEinfuhrungRomanAnalyse2003">
    <mixed-citation>Schneider, Jost. 2003. <italic>Einführung in die
    Roman-Analyse</italic>. Darmstadt: Wissenschaftliche
    Buchgesellschaft.</mixed-citation>
  </ref>
  <ref id="ref-schumacherToolbeitragGephi2019">
    <mixed-citation>Schumacher, Mareike. 2024. Toolbeitrag: Gephi. Hg.
    von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 6. Netzwerkanalyse
    (30. August). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3783">10.48694/fortext.3783</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/gephi">https://fortext.net/tools/tools/gephi</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-siegertNetzwerkeRegimentalitatHarsdorfers1990">
    <mixed-citation>Siegert, Bernhard. 1990. Netzwerke der
    Regimentalität Harsdörfers Teutscher Secretarius und die
    Schicklichkeit der Briefe im 17. Jahrhundert. <italic>Modern
    Language Notes</italic> 105, Nr. 3: 536–562.
    <ext-link ext-link-type="uri" xlink:href="https://www.jstor.org/stable/pdf/2905073.pdf">https://www.jstor.org/stable/pdf/2905073.pdf</ext-link>
    (zugegriffen: 2. November 2018).</mixed-citation>
  </ref>
  <ref id="ref-spoerhaseManuscriptFurFreunde2014">
    <mixed-citation>Spoerhase, Carlos. 2014. „Manuscript für Freunde“,
    die materielle Textualität literarischer Netzwerke, 1760-1830
    (Gleim, Klopstock, Lavatar, Fichte, Reinhold, Goethe).
    <italic>Deutsche Vierteljahrsschrift für Literaturwissenschaft und
    Geistesgeschichte</italic> 88, Nr. 2: 172–205. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/BF03374726">10.1007/BF03374726</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://link.springer.com/article/10.1007/BF03374726">https://link.springer.com/article/10.1007/BF03374726</ext-link>
    (zugegriffen: 5. November 2018).</mixed-citation>
  </ref>
  <ref id="ref-trilckeSocialNetworkAnalysis2013">
    <mixed-citation>Trilcke, Peer. 2013. Social Network Analysis (SNA)
    als Methode einer textempirischen Literaturwissenschaft. In:
    <italic>Empirie in der Literaturwissenschaft</italic>, hg. von
    Philip Ajouri, Katja Mellmann, und Christoph Rauen, 201–247. Brill |
    mentis, 1. Januar. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.30965/9783957439710_012">10.30965/9783957439710_012</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://www.mentis.de/view/book/edcoll/9783957439710/B9783957439710_s012.xml">https://www.mentis.de/view/book/edcoll/9783957439710/B9783957439710_s012.xml</ext-link>
    (zugegriffen: 8. September 2021).</mixed-citation>
  </ref>
  <ref id="ref-weitinAuslegenUndAusrechnen2016">
    <mixed-citation>Weitin, Thomas, Thomas Gilli und Nico Kunkel. 2016.
    Auslegen und Ausrechnen. Zum Verhältnis hermeneutischer und
    quantitativer Verfahren in den Literaturwissenschaften.
    <italic>Zeitschrift für Literaturwissenschaft und
    Linguistik</italic> 46, Nr. 1: 103–115. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s41244-016-0004-8">10.1007/s41244-016-0004-8</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://link.springer.com/article/10.1007/s41244-016-0004-8">https://link.springer.com/article/10.1007/s41244-016-0004-8</ext-link>
    (zugegriffen: 8. November 2018).</mixed-citation>
  </ref>
  <ref id="ref-widawskaInformationstransferDeutschpolnischenKorrespondenznetzwerken2011">
    <mixed-citation>Widawska, Barbara. 2011. Informationstransfer in den
    deutsch-polnischen Korrespondenznetzwerken der zweiten Hälfte des
    19. Jahrhunderts. Zum Briefwerk von Albert Zipper (1855-1936).
    <italic>Studia Germanica Gedanensia</italic> 25: 128–142.
    <ext-link ext-link-type="uri" xlink:href="https://fil.ug.edu.pl/sites/default/files/_nodes/strona-filologiczny/14508/files/sgg_25drukarnia.pdf#page=125">https://fil.ug.edu.pl/sites/default/files/_nodes/strona-filologiczny/14508/files/sgg_25drukarnia.pdf#page=125</ext-link>
    (zugegriffen: 5. November 2018).</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
