<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3769</article-id>
<title-group>
<article-title>Methodenbeitrag: Stilometrie</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0001-8047-2232</contrib-id>
<name>
<surname>Horstmann</surname>
<given-names>Jan</given-names>
</name>
<email>dh@jan-horstmann.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Münster</institution>
</institution-wrap>
</aff>
</contrib-group>
<pub-date date-type="pub" publication-format="electronic" iso-8601-date="2024-02-26">
<day>26</day>
<month>2</month>
<year>2024</year>
</pub-date>
<volume>1</volume>
<issue>1</issue>
<issue-title>Stilometrie</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 06.09.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/stilometrie">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2018-09-06">
<day>06</day>
<month>09</month>
<year>2018</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
<kwd-group kwd-group-type="author">
<kwd>Stil</kwd>
<kwd>Stilanalyse</kwd>
<kwd>Distant Reading</kwd>
<kwd>Autorschaft</kwd>
<kwd>Genre</kwd>
<kwd>Epoche</kwd>
<kwd>Most Frequent Words (MFW)</kwd>
<kwd>Vergleichende AnalyseBurrows’ Delta</kwd>
<kwd>Principal Component Analysis (PCA)</kwd>
</kwd-group>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 06.09.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/stilometrie">fortext.net</ext-link></p>
<sec id="definition">
  <title>1. Definition</title>
  <fig>
    <caption><p>Bootstrap Consensus Tree des dramatischen und epischen
    Œuvres Johann Wolfgang von Goethes</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Goethe_Consensus_cut-p.png" />
  </fig>
  <p>In der digitalen Stilometrie werden Texte oder Textpassagen auf
  Grundlage statistischer Verteilungen (i. d. R. der häufigsten Wörter)
  stilistisch miteinander verglichen. So lässt sich beispielsweise die
  stilistische Entwicklung oder Differenzierung eines literarischen
  Textes, eines Œuvres, oder gar einer ganzen Epoche quantitativ
  nachvollziehen. Insbesondere werden stilometrische Methoden bei
  Autorschaftsattributionen, Genreklassifikationen,
  Epochendifferenzierungen oder auch in der forensischen Linguistik
  eingesetzt.</p>
</sec>
<sec id="anwendungsbeispiel">
  <title>2. Anwendungsbeispiel</title>
  <p>Sie beschäftigen sich mit einem unter Pseudonym veröffentlichten
  literarischen Text und möchten herausbekommen, wer die Verfasserin
  oder der Verfasser gewesen ist, um eine kontextsensitive
  literaturwissenschaftliche Analyse des Textes auf dieser Grundlage
  rechtfertigen zu können. Die Themenwahl, Figurenzeichnung,
  Plotentwicklung, das Setting oder auch der Stil erinnern Sie an andere
  Texte und Ihnen fallen drei Autorinnen ein (oder Sie ziehen dafür
  philologische Forschungsbeiträge zu Rate), die diesen Text potentiell
  geschrieben haben könnten. Sie stellen daher eine digitale
  Textsammlung (vgl.
  <xref alt="Korpus" rid="glossary-korpus">Korpus</xref>) aller Texte
  dieser Autorinnen zusammen, derer Sie habhaft werden können, und
  reichern diese Sammlung außerdem mit Texten weiterer vergleichbarer
  Autor*innen an, um die Möglichkeit fehlerhafter Ergebnisse zu
  minimieren. Eine digitale stilometrische Analyse wird Ihnen mit großer
  Zuverlässigkeit anzeigen, wem die Autorschaft des Textes am ehesten
  zugeschrieben werden kann.</p>
</sec>
<sec id="literaturwissenschaftliche-tradition">
  <title>3. Literaturwissenschaftliche Tradition</title>
  <p>In mehreren Formen der literaturwissenschaftlichen Stilistik lassen
  sich Traditionslinien der digitalen Stilometrie ausmachen.</p>
  <p>Die Stilanalyse bzw. Stilistik (damals noch mehr als normative
  Stilistik verstanden) löst als Textanalysemethode im späten 18.
  Jahrhundert die Rhetorik ab. Novalis erkannte 1798/99 in ihr „ungemein
  viel Aehnlichkeit mit der Declamationslehre - oder der Redekunst im
  strengern Sinne“
  (<xref alt="Czapla 2003, 515" rid="ref-czaplaStilistik2003" ref-type="bibr">Czapla
  2003, 515</xref>). Nach Schaffrick und Willand
  (<xref alt="2014, 29" rid="ref-schaffrickTheorienUndPraktiken2014" ref-type="bibr">2014,
  29</xref>) richtet sich die Stilometrie „grundsätzlich an einer
  vergleichenden Fragestellung aus und stellt den Stil verschiedener
  Epochen, Werke, Gattungen oder […] Autoren gegenüber“. Manuell wurde
  dies bereits im 19. Jahrhundert vollzogen
  (<xref alt="Holmes 1998, 112" rid="ref-holmesEvolutionStylometryHumanities1998" ref-type="bibr">Holmes
  1998, 112</xref>;
  <xref alt="Kelih 2008, 31–44" rid="ref-kelihGeschichteAnwendungQuantitativer2008" ref-type="bibr">Kelih
  2008, 31–44</xref>;
  <xref alt="Tuldava 2005, 370f" rid="ref-tuldavaStylisticsAuthorIdentification2005" ref-type="bibr">Tuldava
  2005, 370f</xref>.).
  Die Stilanalyse als angewandte Stilforschung vor dem Hintergrund
  verschiedener Stiltheorien
  (<xref alt="Plummer 2007, 2007" rid="ref-plummerStilistik2007" ref-type="bibr">Plummer
  2007, 2007</xref>) wird von Meyer
  (<xref alt="2007, 70" rid="ref-meyerStilanalyse2007" ref-type="bibr">2007,
  70</xref>) auch als „Schlüsselqualifikation
  literaturwissenschaftlicher Arbeit“ bezeichnet, da „Basiskenntnisse im
  Bereich der Stilanalyse eine Voraussetzung für jede professionelle
  Beschäftigung mit literarischen wie auch nichtliterarischen Texten“
  seien. Diese Schlüsselqualifikation findet in Form der digitalen
  Stilometrie ihre Tradition vor allem in quantitativ-stilistischen,
  aber auch in formalistisch und strukturalistisch ausgerichteten
  Stilanalysen. In der formalistischen Stilanalyse Michael Riffaterres
  (<xref alt="Czapla 2003, 517" rid="ref-czaplaStilistik2003" ref-type="bibr">Czapla
  2003, 517</xref>), auch „Funktionalstilistik“, genannt wird Stil als
  Normabweichung interpretiert
  (<xref alt="Meyer 2007, 74" rid="ref-meyerStilanalyse2007" ref-type="bibr">Meyer
  2007, 74</xref>). In der strukturalistischen Stilanalyse wird hingegen
  die Regelhaftigkeit stilistischer Äquivalenz- und
  Oppositionsbeziehungen und damit die Erfüllung einer stilistischen
  Norm untersucht. Die strukturalistische Stilanalyse interessiert sich
  für „positive Merkmale einer poetischen Sprache, für artifizielle
  Gleichförmigkeiten (Isomorphien)“
  (<xref alt="Meyer 2007, 75" rid="ref-meyerStilanalyse2007" ref-type="bibr">Meyer
  2007, 75</xref>). Sowohl die formalistische als auch die
  strukturalistische Stilanalyse können somit als Vorgänger der
  digitalen Stilometrie betrachtet werden, da sie sowohl Abweichungen
  als auch Isomorphien exploriert.
  Ganz besonders jedoch knüpft die digitale Stilometrie an die Vorstöße
  der statistischen Stilanalyse an, die sich mit
  „Wortwiederholungshäufigkeiten, Wortverteilungshäufigkeiten,
  Strukturanalogien, Bildung semantischer Felder etc.“
  (<xref alt="Meyer 2007, 70" rid="ref-meyerStilanalyse2007" ref-type="bibr">Meyer
  2007, 70</xref>) beschäftigt. Auch deshalb bezeichnet beispielsweise
  Czapla
  (<xref alt="2003, 515" rid="ref-czaplaStilistik2003" ref-type="bibr">2003,
  515</xref>) die Stilistik als „Bindeglied zwischen Sprach- und
  Literaturwissenschaft“.
  In der statistischen Stilanalyse begreift Doležel
  (<xref alt="1971, 253" rid="ref-dolezelBegriffsrahmenFurStatistische1971" ref-type="bibr">1971,
  253</xref>) Stil als „Wahrscheinlichkeitsbegriff“, d. h. unter der
  gegebenen Bedingung X (z. B. dass ein Text von einer bestimmten
  Autorin stammt) kommt die stilistische Erscheinung A (z. B. eine
  bestimmte Satzlänge) nur zu einer gewissen Wahrscheinlichkeit vor.
  Diese Art und Weise der Skizzierung von Stil arbeitet der späteren
  digitalen Modellierung bereits sehr entgegen und trägt der Tatsache
  Rechnung, dass eine Autorin, die für ihre kurzen Sätze bekannt ist, in
  ihren Texten auch längere Sätze schreiben kann und wird. Doležel
  (<xref alt="1971, 264" rid="ref-dolezelBegriffsrahmenFurStatistische1971" ref-type="bibr">1971,
  264</xref>) konstatiert außerdem: „[J]eder Text kann in einem
  multidimensionalen Raum beschrieben werden, in dem die Werte [der
  messbaren Textcharakteristiken] die individuellen Faktoren bilden“ und
  nimmt damit eine Grundidee der digitalen Stilometrie vorweg.</p>
</sec>
<sec id="diskussion">
  <title>4. Diskussion</title>
  <p>Gern und häufig wird eine der bislang populärsten Verwendungen
  computergestützter stilometrischer Verfahren herangezogen, wenn es
  darum geht, die Wirkkraft dieser digitalen Methode zu
  veranschaulichen: Der unter dem Pseudonym „Robert Gailbraith“ 2013
  veröffentlichte Roman <italic>The Cuckoo’s Calling</italic> wurde
  mithilfe einer stilometrischen Analyse der Bestsellerautorin J. K.
  Rowling zugeschrieben, die sich daraufhin zur Autorschaft bekannte und
  dadurch nicht nur die Verkaufszahlen des Buches in die Höhe schnellen
  ließ, sondern nebenher auch noch die Methode selbst berühmt machte
  (<xref alt="Juola 2015" rid="ref-juolaRowlingCaseProposed2015" ref-type="bibr">Juola
  2015</xref>). Der Algorithmus, der hinter diesem Verfahren steckt,
  heißt Burrows’ Delta und ist der am häufigsten angewendete in der
  computergestützten Stilometrie.
  Die sog. Delta-Messung wird auch nach ihrem Erfinder „Burrows’ Delta“
  genannt
  (<xref alt="Burrows 2002" rid="ref-burrowsDeltaMeasureStylistic2002a" ref-type="bibr">Burrows
  2002</xref>). Bei dieser Methode wird Stil jedoch anders gedacht als
  in vielen der traditionelleren Stilanalysen: Statt semantischer
  Inhaltswörter werden hier besonders Funktionswörter betrachtet, oder
  um genau zu sein: die häufigsten Wörter (noch genauer: Tokens (vgl.
  <xref alt="Type/Token" rid="glossary-type-token">Type/Token</xref>))
  eines Textes oder einer Textsammlung. Diese <italic>most frequent
  words</italic> (MFW) werden von Autor*innen „kaum bewusst manipuliert“
  (<xref alt="Jannidis und Lauer 2014, 180" rid="ref-jannidisBurrowsDeltaIts2014" ref-type="bibr">Jannidis
  und Lauer 2014, 180</xref>) und bieten aufgrund ihres schlicht
  häufigeren Vorkommens eine verlässlichere Datenbasis für eine
  automatische Vergleichsanalyse als seltene Wörter.
  Eine Charakterisierung des Stils einer bestimmten Autorin à la „XY
  benutzt besonders viele Neologismen“ wird es in der digitalen
  Stilometrie daher nicht geben. Gerade im Zusammenhang mit der
  Untersuchung des Phänomens Autorenstil bedarf es jedoch numerischer
  Merkmale, die unabhängig von Textsorte, Thema und dem Verstreichen von
  Zeit wiederkehren
  (<xref alt="Jannidis und Lauer 2014, 178" rid="ref-jannidisBurrowsDeltaIts2014" ref-type="bibr">Jannidis
  und Lauer 2014, 178</xref>). In der vergleichenden Stilanalyse Thomas
  und Heinrich Manns und Hermann Hesses untersucht Grimm
  (<xref alt="1991" rid="ref-grimmMythosIndividualstilMikrostilistische1991" ref-type="bibr">1991</xref>)
  daher beispielsweise die Vorkommnisse von syntaktischen, lexikalischen
  und morphologischen Mitteln, aber auch von Semikola oder Auslassungen
  durch drei Punkte. Da viele Autor*innen im Laufe ihres Lebens ihren
  Stil verändern (oder der Stil sich unbewusst verändert), ist es nach
  wie vor nicht gelungen, einen genuinen Autorenstil, der sich über das
  jeweilige Œuvre als Ganzes erstreckt, statistisch dingfest zu machen.
  Jannidis und Lauer
  (<xref alt="2014" rid="ref-jannidisBurrowsDeltaIts2014" ref-type="bibr">2014</xref>)
  unterscheidet in diesem Zusammenhang einen starken und einen schwachen
  Begriff von Autorstil, wobei der starke Begriff sämtliche Texte eines
  Autors/einer Autorin meint, der schwache jedoch nur einige Texte. Die
  Konzentration auf den schwachen Begriff von Autorenstil macht es
  möglich, ein Œuvre als Ganzes zu begreifen und dennoch seine
  dynamische stilistische Entwicklung zu beschreiben.
  „Welche Stilprinzipien jeweils für eine Epoche, Textsorte oder
  Autor-Individualität von tendenzieller Geltung sind und was dabei
  jeweils als sprachliche Angemessenheit, Ornamentik, Eleganz o. ä.
  postuliert wird, ist von zeitgebundenen Paradigmen abhängig“
  (<xref alt="Michel 2003, 520" rid="ref-michelStilprinzip2003" ref-type="bibr">Michel
  2003, 520</xref>). Die digitale Stilometrie bringt mit ihrer
  Konzentration auf die <italic>most frequent words</italic> in den
  Kanon dieser Stilprinzipien eine neue Perspektive ein, die einen
  großen Erkenntniszuwachs bringt, die anderen Aspekte jedoch nicht
  ablösen kann: Über Ornamentik, Eleganz etc. von Texten vermag sie
  keine Aussage zu treffen.
  Die digitale Stilometrie ist zudem rein textimmanent und kann
  extratextuelle Zeichen wie z. B. die Beschaffenheit des Manuskripts
  mit all seinen stilistischen Zusatzinformationen, die in der
  Druckfassung verloren gegangen sind
  (<xref alt="Meyer 2007, 78" rid="ref-meyerStilanalyse2007" ref-type="bibr">Meyer
  2007, 78</xref>), nicht mit deuten. Dies ist freilich ein generelles
  Problem vieler digitaler Methoden und betrifft insbesondere die
  Möglichkeiten der Textdigitalisierung
  (<xref alt="Horstmann 2024b" rid="ref-horstmannMethodenbeitragMoglichkeitenTextdigitalisierung2018" ref-type="bibr">Horstmann
  2024b</xref>) und die digitale Manuskriptanalyse
  (<xref alt="Horstmann 2024c" rid="ref-horstmannMethodenbeitragDigitaleManuskriptanalyse2018" ref-type="bibr">Horstmann
  2024c</xref>).
  Die Konzentration auf ein bestimmtes Stilmerkmal beim Vergleich
  unterschiedlicher Texte, Gattungen oder Œuvres macht die Stilanalyse
  jedoch handhabbar, oder wie Jannidis und Lauer
  (<xref alt="2014, 172" rid="ref-jannidisBurrowsDeltaIts2014" ref-type="bibr">2014,
  172</xref>) zusammenfasst: „Deutlich moderater wäre ein Test, dem es
  gelingt, aufgrund bestimmter Merkmale und Merkmalskombinationen die
  Texte eines Autors von den Texten anderer Autoren zu unterscheiden,
  also ein individualisierendes oder unterscheidendes Verfahren“. Man
  sollte die vergleichsweise unbewusste Verwendung von häufigen
  Funktionswörtern in Texten jedoch nicht mit einer Art ‚stilistischem
  Fingerabdruck‘ von Autor*innen gleichsetzen, denn einzigartige
  Merkmale oder Merkmalsbündel, die Stil individuell definitiv
  bestimmen, gibt es nicht. Stilometrische Verfahren liefern stattdessen
  <italic>wahrscheinliche</italic> Autorschaftszuschreibungen und diese
  Wahrscheinlichkeit kann höher oder niedriger sein
  (<xref alt="Jannidis und Lauer 2014, 183" rid="ref-jannidisBurrowsDeltaIts2014" ref-type="bibr">Jannidis
  und Lauer 2014, 183</xref>).
  Neben der Autorschaftsattribution kann die stilometrische Analyse nach
  Burrows in weiteren Zusammenhängen fruchtbar gemacht werden: So lässt
  sie Rückschlüsse auf Textsortenzugehörigkeiten, Œuvreperiodisierungen,
  Übersetzungsstilistiken, Epochenzusammenhänge, Genderzugehörigkeiten
  etc. zu. Es hat sich zudem gezeigt, dass die Wahl der Menge der
  häufigsten Wörter sprachabhängig ist
  (<xref alt="Rybicki und Eder 2011" rid="ref-rybickiDeeperDeltaGenres2011a" ref-type="bibr">Rybicki
  und Eder 2011</xref>), da „bei Sprachen mit größerer morphologischer
  Formenvielfalt zu erwarten [ist], daß die relative Häufigkeit der
  häufigen Wörter insgesamt weniger groß ist“
  (<xref alt="Bock u. a. 2016, 9" rid="ref-bockEinsatzQuantitativerTextanalyse2016" ref-type="bibr">Bock
  u. a. 2016, 9</xref>). Rybicki und Eder
  (<xref alt="2011" rid="ref-rybickiDeeperDeltaGenres2011a" ref-type="bibr">2011</xref>)
  kommen in ihren Experimenten daher zu dem Ergebnis, dass Burrows’
  Delta am besten mit englischen oder deutschen Prosatexten
  funktioniert.
  Die quantitative digitale Stilometrie ermöglicht einen neuen Blick auf
  Stile in Textsammlungen. Für gute Ergebnisse ist eine ausreichende
  (möglichst große) Datengrundlage jedoch unumgänglich. Ist diese
  gegeben, spricht die Qualität der Ergebnisse für sich: Sie sind mit so
  hoher Wahrscheinlichkeit korrekt, dass die Verfahren sogar in der
  forensischen Linguistik Anwendung finden und als vor Gericht haltbar
  gelten können
  (<xref alt="Fobbe 2011, 109f" rid="ref-fobbeForensischeLinguistikEinfuhrung2011" ref-type="bibr">Fobbe
  2011, 109f</xref>.). Dieser quantitative Blick (vgl.
  <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
  Reading</xref>) ist jedoch nur eine Perspektive auf Stil und kann und
  will (insbesondere bei kürzeren Texten) die qualitative Stilanalyse
  (vgl. <xref alt="Close Reading" rid="glossary-close-reading">Close
  Reading</xref>) nicht ersetzen
  (<xref alt="Tuldava 2005, 369" rid="ref-tuldavaStylisticsAuthorIdentification2005" ref-type="bibr">Tuldava
  2005, 369</xref>).</p>
</sec>
<sec id="technische-grundlagen">
  <title>5. Technische Grundlagen</title>
  <p>Die stilometrische Analyse mit Burrows’ Delta betrachtet die
  häufigsten Wörter der Textsammlung. In Burrows’ eigenem Beispiel sind
  das die 30 häufigsten Wörter und diese MFW (<italic>most frequent
  words</italic>) bezeichnet er als „markers of potentially equal power“
  (<xref alt="Burrows 2002, 271" rid="ref-burrowsDeltaMeasureStylistic2002a" ref-type="bibr">Burrows
  2002, 271</xref>) für Stildifferenzen. Nun ist es bei nach
  Häufigkeiten angeordneten Wortlisten so, dass die Zahlenwerte sehr
  schnell abfallen, dass also beispielsweise die ersten 3 bis 5 Wörter
  sehr viel häufiger vorkommen als die Wörter 6-10 usw. Damit die
  häufigsten dieser häufigen Wörter das Ergebnis der stilometrischen
  Analyse nicht allein dominieren, sondern alle 30 häufigsten Wörter in
  der Berechnung ein gleiches Gewicht bekommen, wird nicht mit
  Rohwerten, sondern mit dem sog. <italic>z-score</italic> gerechnet. Im
  <italic>z-score</italic> wird vom Zahlenwert der häufigsten Wörter der
  Mittelwert abgezogen und das Ergebnis wird durch die
  Standardabweichung (d. h. die durchschnittliche Streuung um den
  Mittelwert) geteilt.
  Um schließlich das Delta zu berechnen, werden die 30 (bzw.
  <italic>n</italic>) <italic>z-scores</italic> des einen Textes oder
  der einen Textsammlung von den 30 <italic>z-scores</italic> des
  anderen Textes oder der anderen Textsammlung abgezogen. Diese
  Differenzen werden aufaddiert und das Ergebnis wird durch die gewählte
  Menge der häufigsten Wörter (in diesem Beispiel 30) geteilt. Bei
  dieser rechnerischen Komplexitätsreduktion kommt ein numerischer Wert
  heraus; Delta kann also in einer Zahl angegeben werden und wird auch
  als Distanzmaß bezeichnet
  (<xref alt="Schöch 2017, 292" rid="ref-schochQuantitativeAnalyse2017" ref-type="bibr">Schöch
  2017, 292</xref>). Kleinere Deltawerte (im Verhältnis zu allen in
  einem Analysedurchgang jeweils errechneten Deltawerten) stehen laut
  dieser Berechnung für größere stilistische Nähe bzw. für kleinere
  stilistische Differenz. Eine etwas ausführlichere Erläuterung dieser
  Rechnung findet sich bei Jannidis und Lauer
  (<xref alt="2014, 183–185" rid="ref-jannidisBurrowsDeltaIts2014" ref-type="bibr">2014,
  183–185</xref>). Eine Vereinfachung der Formel (bei welcher der
  Mittelwert herausgekürzt und somit der Bezug auf einen normgebenden
  Haupttext geschmälert wird) bietet Argamon
  (<xref alt="2007" rid="ref-argamonInterpretingBurrowsDelta2007" ref-type="bibr">2007</xref>).
  Bei der quantitativen Berechnung stilistischer Unterschiedlichkeit
  entstehen schnell Werte, die durch eine Vielzahl von Faktoren bestimmt
  werden. Wenn in einer Textsammlung von nur 10 Texten beispielsweise
  die jeweils 30 häufigsten Wörter stilometrisch analysiert werden
  sollen
  (<xref alt="Rybicki und Eder 2011" rid="ref-rybickiDeeperDeltaGenres2011a" ref-type="bibr">Rybicki
  und Eder 2011</xref>), lässt sich jeder einzelne Text durch einen
  Vektor mit 30 Zahlen repräsentieren: die Frequenzen der jeweils
  häufigsten 30 Wörter. Dadurch nimmt jeder Text einen spezifischen
  Punkt in einem 30-dimensionalen Raum ein.
  Um dieses hochdimensionale Raumkonstrukt greifbar zu machen, werden
  die 30 Dimensionen auf zwei Achsen reduziert. Dazu braucht man die
  sog. <italic>principal component analysis</italic> (PCA) (vgl.
  <xref alt="PCA" rid="glossary-pca">PCA</xref>). Anstatt für jedes Wort
  eine neue Dimension zu eröffnen, bildet dabei die Varianz selbst die
  Grundlage für die neu definierten Dimensionen: x-Achse = PC1 und
  y-Achse = PC2 (bei Bedarf noch eine z-Achse = PC3). Entlang der Achse
  Principal Component 1 werden somit die Texte in Bezug auf die größte
  Varianz aufgefächert, entlang der Achse Principal Component 2 in Bezug
  auf die zweitgrößte Varianz usw. Damit hat man in der Regel schon eine
  so große Menge an Daten abgedeckt, dass weitere Principal Components
  vernachlässigt werden können, ohne dass der Informationsverlust zu
  groß wäre.
  Die Reduktion auf zwei Dimensionen bietet den großen Vorteil, dass
  sämtliche Texte einer stilometrischen Analyse innerhalb eines
  Koordinatensystems wie auf einer Karte visualisiert werden können, in
  dem räumliche Nähe (da Delta ein Distanzmaß ist) auch für stilistische
  Nähe steht. (Zu den Chancen und Risiken von unterschiedlichen
  Datenvisualisierungen vgl. Textvisualisierung
  (<xref alt="Horstmann und Stange 2024" rid="ref-horstmannMethodenbeitragTextvisualisierung2018" ref-type="bibr">Horstmann
  und Stange 2024</xref>)). Statt die Vollständigkeit der gesamten Daten
  abzubilden, liegt der Fokus der PCA-Analyse also auf Aspekten, die für
  die stilistische Varianz von besonderer Bedeutung sind
  (<xref alt="Bock u. a. 2016" rid="ref-bockEinsatzQuantitativerTextanalyse2016" ref-type="bibr">Bock
  u. a. 2016</xref>;
  <xref alt="Tweedie 2005, 388" rid="ref-tweedieStatisticalModelsStylistics2005" ref-type="bibr">Tweedie
  2005, 388</xref>).
  Bei dieser und auch den im Folgenden erwähnten Verfahren und
  Möglichkeiten der Ergebnisvisualisierung bestimmen immer Sie selbst
  die jeweiligen Parameter, die in die Analyse einbezogen werden, und
  auch die Ergebnisse müssen von Ihnen vor dem Hintergrund Ihres
  literaturwissenschaftlichen Fachwissens gedeutet werden. Diese
  Aufgaben kann die digitale Methode nicht übernehmen. Eine häufiger
  verwendete Möglichkeit, stilistische Nähe von Texten zu visualisieren,
  ist die Darstellung in einem Baumdiagramm oder Dendrogramm, bei dem i.
  d. R. die vertikale Anordnung von Textgruppen in sog. Clustern auf den
  gleichen Ästen des Diagramms die stilistische Nähe dieser Texte
  zueinander anzeigt.
  Die in diesem Beitrag aufgeführte Visualisierung (s. o.) nennt sich
  <italic>Bootstrap Consensus Tree</italic> und wurde mit Stylo
  (<xref alt="Horstmann 2024a" rid="ref-horstmannToolbeitragStylo2024" ref-type="bibr">Horstmann
  2024a</xref>) (s. nächsten Absatz) erstellt. Sie zeigt die
  stilistische Varianz von Goethes dramatischem und epischem Œuvre. Die
  Visualisierung beruht (im Gegensatz zum Dendrogramm) auf wiederholten
  und vergleichenden Durchläufen der Berechnung mit unterschiedlichen
  Parametern (bspw. jeweils unterschiedlich viele MFW) und zeigt
  stilistisch ähnliche Texte an den gleichen Ästen an. Dabei werden nur
  diejenigen Ähnlichkeiten angezeigt, die in einem vorher festgelegten
  prozentualen Anteil der Analysedurchläufe auftreten. Die Entfernung
  vom Zentrum hat dabei keine semantische Aussagekraft, sondern ist
  lediglich der visuellen Darstellbarkeit geschuldet.
  Auch für Einsteiger*innen nach kurzer Einführung relativ leicht
  zugänglich und nutzbar ist das sog. „Stylo“-Package
  (<xref alt="Eder, Rybicki und Kestemont 2016" rid="ref-ederStylometryPackageComputational2016" ref-type="bibr">Eder,
  Rybicki und Kestemont 2016</xref>), das in der Java-basierten
  statistischen Programmierumgebung
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.r-project.org/">R</ext-link>
  kostenlos angewendet werden kann und bei Bedarf sogar über eine
  grafische interaktive Benutzeroberfläche (vgl.
  <xref alt="GUI" rid="glossary-gui">GUI</xref>) verfügt. Die
  grundlegenden Befehle werden hier über speziell dafür eingerichtete
  Buttons ausgeführt und Skript- oder Codekenntnisse sind (bis auf das
  Laden und Starten des Programms) nicht zwangsläufig vonnöten.</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>R Project:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.r-project.org/">https://web.archive.org/save/https://www.r-project.org/</ext-link>
      (Letzter Zugriff: 20.02.2024)</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-close-reading">Close
      Reading</styled-content></term>
      <def>
        <p>Close Reading bezeichnet die sorgfältige Lektüre und
        Interpretation eines einzelnen oder weniger Texte. Close Reading
        ist in der digitalen Literaturwissenschaft außerdem mit der
        manuellen
        <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>
        textueller Phänomene verbunden (vgl. auch
        <xref alt="Distant Reading" rid="glossary-distant-reading">Distant
        Reading</xref> als Gegenbegriff).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-commandline">Commandline</styled-content></term>
      <def>
        <p>Die Commandline (engl. <italic>command line
        interface</italic> (CLI)), auch Kommandozeile, Konsole, Terminal
        oder Eingabeaufforderung genannt, ist die direkteste Methode zur
        Interaktion eines Menschen mit einem Computer. Programme ohne
        eine grafische Benutzeroberfläche
        (<xref alt="GUI" rid="glossary-gui">GUI</xref>) werden i. d. R.
        durch Texteingabe in die Commandline gesteuert. Um die
        Commandline zu öffnen, klicken Sie auf Ihrem Mac „cmd“ +
        „space“, geben „Terminal“ ein und doppelklicken auf das
        Suchergebnis. Bei Windows klicken Sie die Windowstaste + „R“,
        geben „cmd.exe“ ein und klicken Enter.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-distant-reading">Distant
      Reading</styled-content></term>
      <def>
        <p>Distant Reading ist ein Ansatz aus den digitalen
        Literaturwissenschaften, bei dem computationelle Verfahren auf
        häufig große Mengen an Textdaten angewandt werden, ohne dass die
        Texte selber gelesen werden. Meist stehen hier quantitative
        Analysen im Vordergrund, es lassen sich jedoch auch qualitative
        <xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>
        quantitativ vergleichen. Als Gegenbegriff zu
        <xref alt="Close Reading" rid="glossary-close-reading"><italic>Close
        Reading</italic></xref> wurde der Begriff insbesondere von
        Franco Moretti (2000) geprägt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-gui">GUI</styled-content></term>
      <def>
        <p>GUI steht für <italic>Graphical User Interface</italic> und
        bezeichnet eine grafische Benutzeroberfläche. Ein GUI ermöglicht
        es, Tools mithilfe von grafischen Schaltflächen zu bedienen, um
        somit beispielsweise den Umgang mit der
        <xref alt="Commandline" rid="glossary-commandline">Commandline</xref>
        zu umgehen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-korpus">Korpus</styled-content></term>
      <def>
        <p>Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural
        für „das Korpus“) sind typischerweise nach Textsorte, Epoche,
        Sprache oder Autor*in zusammengestellt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z.B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pca">PCA</styled-content></term>
      <def>
        <p>PCA steht für <italic>Principal Component Analysis</italic> .
        Die Hauptkomponentenanalyse ist ein komplexes, statistisches
        Verfahren zur Reduktion und Veranschaulichung umfangreicher
        Datensätze.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic> , oder
        „Wortart“ auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-argamonInterpretingBurrowsDelta2007">
    <mixed-citation>Argamon, S. 2007. Interpreting Burrows’s Delta:
    Geometric and Probabilistic Foundations. <italic>Literary and
    Linguistic Computing</italic> 23, Nr. 2 (1. Oktober): 131–147. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1093/llc/fqn003">10.1093/llc/fqn003</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://academic.oup.com/dsh/article-lookup/doi/10.1093/llc/fqn003">https://academic.oup.com/dsh/article-lookup/doi/10.1093/llc/fqn003</ext-link>
    (zugegriffen: 13. Dezember 2019).</mixed-citation>
  </ref>
  <ref id="ref-bockEinsatzQuantitativerTextanalyse2016">
    <mixed-citation>Bock, Sina, Keli Du, Michael Huber, Stefan Pernes
    und Steffen Pielström. 2016. Der Einsatz quantitativer Textanalyse
    in den Geisteswissenschaften: Bericht über den Stand der Forschung.
    DARIAH Working Papers Nr. 18: 4–9.
    <ext-link ext-link-type="uri" xlink:href="http://webdoc.sub.gwdg.de/pub/mon/dariah-de/dwp-2016-18.pdf">http://webdoc.sub.gwdg.de/pub/mon/dariah-de/dwp-2016-18.pdf</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-burrowsDeltaMeasureStylistic2002a">
    <mixed-citation>Burrows, John. 2002. Delta: A Measure for Stylistic
    Difference and a Guide to Likely Authorship. <italic>Literary and
    Linguistic Computing</italic> 17, Nr. 3: 267–287.</mixed-citation>
  </ref>
  <ref id="ref-czaplaStilistik2003">
    <mixed-citation>Czapla, Ralf Georg. 2003. Stilistik. In:
    <italic>Reallexikon der deutschen Literaturwissenschaft.
    Neubearbeitung des Reallexikons der deutschen
    Literaturgeschichte</italic>, 3: P-Z:515–518. Berlin, New York: de
    Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-dolezelBegriffsrahmenFurStatistische1971">
    <mixed-citation>Doležel, Lubomír. 1971. Ein Begriffsrahmen für die
    statistische Stilanalyse. In: <italic>Literaturwissenschaft und
    Linguistik. Ergebnisse und Perspektiven</italic>, hg. von Jens Ihwe,
    1: Grundlagen und Voraussetzungen:253–273. Frankfurt am Main:
    Athenäum.</mixed-citation>
  </ref>
  <ref id="ref-ederStylometryPackageComputational2016">
    <mixed-citation>Eder, Maciej, Jan Rybicki und Mike Kestemont. 2016.
    Stylometry with R: A Package for Computational Text Analysis.
    <italic>The R Journal</italic> 8, Nr. 1: 107–121.
    <ext-link ext-link-type="uri" xlink:href="https://journal.r-project.org/archive/2016-1/eder-rybicki-kestemont.pdf">https://journal.r-project.org/archive/2016-1/eder-rybicki-kestemont.pdf</ext-link>
    (zugegriffen: 12. November 2018).</mixed-citation>
  </ref>
  <ref id="ref-fobbeForensischeLinguistikEinfuhrung2011">
    <mixed-citation>Fobbe, Eilika. 2011. <italic>Forensische Linguistik.
    Eine Einführung</italic>. Tübingen: Narr.</mixed-citation>
  </ref>
  <ref id="ref-grimmMythosIndividualstilMikrostilistische1991">
    <mixed-citation>Grimm, Christian. 1991. <italic>Zum Mythos
    Individualstil. Mikrostilistische Untersuchungen zu Thomas
    Mann</italic>. Würzburg: Königshausen &amp;
    Neumann.</mixed-citation>
  </ref>
  <ref id="ref-holmesEvolutionStylometryHumanities1998">
    <mixed-citation>Holmes, D. I. 1998. The Evolution of Stylometry in
    Humanities Scholarship. <italic>Literary and Linguistic
    Computing</italic> 13, Nr. 3 (1. September): 111–117. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1093/llc/13.3.111">10.1093/llc/13.3.111</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://academic.oup.com/dsh/article-lookup/doi/10.1093/llc/13.3.111">https://academic.oup.com/dsh/article-lookup/doi/10.1093/llc/13.3.111</ext-link>
    (zugegriffen: 13. Dezember 2019).</mixed-citation>
  </ref>
  <ref id="ref-horstmannToolbeitragStylo2024">
    <mixed-citation>Horstmann, Jan. 2024a. Toolbeitrag: Stylo. Hg. von
    Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 1. Stilometrie (26.
    Februar). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3770">10.48694/fortext.3770</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/stylo">https://fortext.net/tools/tools/stylo</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragDigitaleManuskriptanalyse2018">
    <mixed-citation>———. 2024c. Methodenbeitrag: Digitale
    Manuskriptanalyse. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1,
    Nr. 3. Textdigitalisierung und Edition (12. Juni). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3744">10.48694/fortext.3744</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/digitale-manuskriptanalyse">https://fortext.net/routinen/methoden/digitale-manuskriptanalyse</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragMoglichkeitenTextdigitalisierung2018">
    <mixed-citation>———. 2024b. Methodenbeitrag: Möglichkeiten der
    Textdigitalisierung. Hg. von Evelyn Gius. <italic>forTEXT</italic>
    1, Nr. 3. Textdigitalisierung und Edition (12. Juni). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3741">10.48694/fortext.3741</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/moeglichkeiten-der-textdigitalisierung">https://fortext.net/routinen/methoden/moeglichkeiten-der-textdigitalisierung</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragTextvisualisierung2018">
    <mixed-citation>Horstmann, Jan und Jan-Erik Stange. 2024.
    Methodenbeitrag: Textvisualisierung. Hg. von Evelyn Gius.
    <italic>forTEXT</italic> 1, Nr. 5. Textvisualisierung (7. August).
    doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3772">10.48694/fortext.3772</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/textvisualisierung">https://fortext.net/routinen/methoden/textvisualisierung</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-jannidisBurrowsDeltaIts2014">
    <mixed-citation>Jannidis, Fotis und Gerhard Lauer. 2014. Burrows’s
    Delta and Its Use in German Literary History. In: <italic>Distant
    Readings: Topologies of German Culture in the Long Nineteenth
    Century</italic>, hg. von Matt Erlin und Lynne Tatlock, 29–54.
    Rochester, New York: Camden House.</mixed-citation>
  </ref>
  <ref id="ref-juolaAuthorshipAttribution2006">
    <mixed-citation>Juola, Patrick. 2006. Authorship Attribution.
    <italic>Foundations and Trends in Information Retrieval</italic> 1,
    Nr. 3: 233–334. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1561/1500000005">10.1561/1500000005</ext-link>,.</mixed-citation>
  </ref>
  <ref id="ref-juolaRowlingCaseProposed2015">
    <mixed-citation>———. 2015. The Rowling Case: A Proposed Standard
    Analytic Protocol for Authorship Questions. <italic>Digital
    Scholarship in The Humanities</italic> 30, Nr. 1: 100–113. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1093/llc/fqv040">10.1093/llc/fqv040</ext-link>,
    (zugegriffen: 3. September 2018).</mixed-citation>
  </ref>
  <ref id="ref-kelihGeschichteAnwendungQuantitativer2008">
    <mixed-citation>Kelih, Emmerich. 2008. <italic>Geschichte der
    Anwendung quantitativer Verfahren in der russischen Sprach- und
    Literaturwissenschaft</italic>. Hamburg: Kovač.</mixed-citation>
  </ref>
  <ref id="ref-meyerStilanalyse2007">
    <mixed-citation>Meyer, Urs. 2007. Stilanalyse. In: <italic>Handbuch
    Literaturwissenschaft</italic>, hg. von Thomas Anz, 2: Methoden und
    Theorien:70–80. Stuttgart, Weimar: Metzler.</mixed-citation>
  </ref>
  <ref id="ref-michelStilprinzip2003">
    <mixed-citation>Michel, Georg. 2003. Stilprinzip. In:
    <italic>Reallexikon der deutschen Literaturwissenschaft.
    Neubearbeitung des Reallexikons der deutschen
    Literaturgeschichte</italic>, III: P-Z:518–521. Berlin, New York: de
    Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-plummerStilistik2007">
    <mixed-citation>Plummer, Patricia. 2007. Stilistik. In:
    <italic>Metzler Lexikon Literatur. Begriffe und
    Definitionen</italic>, hg. von Dieter Burdorf, Christoph Fasbender,
    und Burkhard Moenninghoff, 734. Stuttgart, Weimar:
    Metzler.</mixed-citation>
  </ref>
  <ref id="ref-rybickiDeeperDeltaGenres2011a">
    <mixed-citation>Rybicki, Jan und Maciej Eder. 2011. Deeper Delta
    Across Genres and Languages: Do We Really Need the Most Frequent
    Words? <italic>Literary and Linguistic Computing</italic> 26, Nr. 3:
    315–321.</mixed-citation>
  </ref>
  <ref id="ref-schaffrickTheorienUndPraktiken2014">
    <mixed-citation>Schaffrick, Matthias und Marcus Willand, Hrsg. 2014.
    <italic>Theorien und Praktiken der Autorschaft</italic>. Berlin,
    Boston: de Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-schochQuantitativeAnalyse2017">
    <mixed-citation>Schöch, Christof. 2017. Quantitative Analyse. In:
    <italic>Digital Humanities. Eine Einführung</italic>, hg. von Fotis
    Jannidis, Hubertus Kohle, und Malte Rehbein, 279–298. Stuttgart:
    Metzler.</mixed-citation>
  </ref>
  <ref id="ref-stamatatosSurveyModernAuthorship2009">
    <mixed-citation>Stamatatos, Efstathios. 2009. A survey of modern
    authorship attribution methods. <italic>Journal of the American
    Society for Information Science and Technology</italic> 60, Nr. 3:
    538–556. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1002/asi.21001">10.1002/asi.21001</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://onlinelibrary.wiley.com/doi/abs/10.1002/asi.21001">https://onlinelibrary.wiley.com/doi/abs/10.1002/asi.21001</ext-link>
    (zugegriffen: 13. Dezember 2019).</mixed-citation>
  </ref>
  <ref id="ref-tuldavaStylisticsAuthorIdentification2005">
    <mixed-citation>Tuldava, Juhan. 2005. Stylistics, author
    identification. In: <italic>Quantitative Linguistik: ein
    internationales Handbuch</italic>, hg. von Reinhard Köhler, Gerold
    Ungeheuer, und Herbert Ernst Wiegand, 368–387. Berlin, New York: de
    Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-tweedieStatisticalModelsStylistics2005">
    <mixed-citation>Tweedie, Fiona J. 2005. Statistical Models in
    Stylistics and Forensic Linguistics. In: <italic>Quantitative
    Linguistik: ein internationales Handbuch</italic>, hg. von Reinhard
    Köhler, Gerold Ungeheuer, und Herbert Ernst Wiegand, 387–397.
    Berlin, New York: de Gruyter.</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
