<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3741</article-id>
<title-group>
<article-title>Methodenbeitrag: Möglichkeiten der
Textdigitalisierung</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0001-8047-2232</contrib-id>
<name>
<surname>Horstmann</surname>
<given-names>Jan</given-names>
</name>
<email>dh@jan-horstmann.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Münster</institution>
</institution-wrap>
</aff>
</contrib-group>
<volume>1</volume>
<issue>3</issue>
<issue-title>Textdigitalisierung und Edition</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 24.01.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/moeglichkeiten-der-textdigitalisierung">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2018-01-24">
<day>24</day>
<month>01</month>
<year>2018</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 24.01.2018 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/moeglichkeiten-der-textdigitalisierung">fortext.net</ext-link></p>
<sec id="definition">
  <title>1. Definition</title>
  <fig>
    <caption><p>Kafkas Verwandlung in analoger und digitialisierter
    Form</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Die_Verwandlung_analog_zu_digital-p.png" />
  </fig>
  <p>Textdigitalisierung bezeichnet den Prozess der Umwandlung eines
  gedruckten oder handschriftlichen Textes in einen maschinell lesbaren
  elektronischen Text. Je nach Beschaffenheit des Ausgangstextes kommen
  in diesem Prozess der Texterfassung bzw. Transkription mehrere
  potentielle Bearbeitungsschritte in Frage – automatisierte (optical
  character recognition (OCR): optische Zeichenerkennung) (vgl.
  <xref alt="OCR" rid="glossary-ocr">OCR</xref>) wie manuelle (keying)
  (vgl. <xref alt="Keying" rid="glossary-keying">Keying</xref>).</p>
</sec>
<sec id="anwendungsbeispiel">
  <title>2. Anwendungsbeispiel</title>
  <p>Angenommen, Sie wollen das Prosaoeuvre von Ingeborg Bachmann (vgl.
  <xref alt="Korpus" rid="glossary-korpus">Korpus</xref>) erforschen und
  sich dabei digital unterstützen lassen. Das Problem ist, dass
  Bachmanns Texte nicht gemeinfrei und damit nicht als fertige
  Textdigitalisate zugänglich sind. Sie haben nun die Möglichkeit, die
  gedruckten Texte selbst in digital lesbare Textdateien umzuwandeln, um
  anschließend die Methoden und Tools der digitalen Textanalyse nutzen
  zu können. Zu welchen Problemen es bei einer automatisierten
  Texterfassung kommen kann, wird anhand eines Ausschnittes aus
  Bachmanns Erzählung <italic>Das Gebell</italic> (1972) unter Punkt 5
  dieses Beitrags veranschaulicht. Texte, die urheberrechtlich geschützt
  sind, dürfen jedoch nur für den privaten bzw. eigenen
  wissenschaftlichen Gebrauch digitalisiert und nicht veröffentlicht
  oder vervielfältigt werden.</p>
</sec>
<sec id="literaturwissenschaftliche-tradition">
  <title>3. Literaturwissenschaftliche Tradition</title>
  <p>Die Digitalisierung von Texten führt mehrere Traditionslinien fort:
  (1) die Editionsphilologie und Textkritik, (2) die Paläografie und
  auch (3) das Setzen von Manuskripten seit der Erfindung des
  Buchdrucks.</p>
  <list list-type="order">
    <list-item>
      <label>1)</label>
      <p>Mit der Erfindung der Schrift vor über 5000 Jahren wurde eine
      Möglichkeit geschaffen, die auch als Leitbild der
      Textdigitalisierung verstanden werden kann: „die konsistente
      Bewahrung der sprachlichen Äußerung durch sie repräsentierende
      Zeichen“
      (<xref alt="Nutt-Kofoth 2007, 1" rid="ref-nutt-kofothTextkritikUndTextbearbeitung2007" ref-type="bibr">Nutt-Kofoth
      2007, 1</xref>). Möchte man einen Text elektronisch lesbar machen,
      sollten einige Maximen der Editionswissenschaft, die sich mit
      dieser konsistenten Bewahrung beschäftigt, beachtet werden. Dies
      gilt insbesondere für Texte, die selbst aus historisch-kritischen
      Ausgaben stammen, denn hier ist eine korrekte Texterfassung die
      Basis für jede wissenschaftlich tragbare Weiterverarbeitung und
      auch in der elektronischen Version sollten einzelne Elemente der
      Edition
      (<xref alt="Sproll 2007, 178" rid="ref-sprollEditionstechnik2007" ref-type="bibr">Sproll
      2007, 178</xref>) differenziert werden können.
      Historisch-kritische Ausgaben, kritische Ausgaben, Studienausgaben
      oder Leseausgaben stellen in der Editionswissenschaft
      unterschiedliche Ansprüche an die Authentizität der
      Textwiedergabe. In vielen Ausgaben der einzelnen Editionsvarianten
      (außer der (historisch-)kritischen) greifen die jeweiligen
      Herausgeber*innen normalisierend in Orthografie und Interpunktion
      ein
      (<xref alt="Nutt-Kofoth 2007, 6f" rid="ref-nutt-kofothTextkritikUndTextbearbeitung2007" ref-type="bibr">Nutt-Kofoth
      2007, 6f</xref>.). Was in der Editionsphilologie ein
      „diplomatischer Abdruck“
      (<xref alt="Grubmüller und Weimar 1997, 414" rid="ref-grubmüllerEdition1997" ref-type="bibr">Grubmüller
      und Weimar 1997, 414</xref>) genannt wird, sollte jedoch auch das
      Ziel der digitalen Erfassung eines gedruckten Textes sein: die
      „urkundlich genaue, zeichengetreue Wiedergabe eines Textes, d. h.
      unter Bewahrung aller Besonderheiten und auch Uneinheitlichkeiten
      von Orthografie und Interpunktion“ (ebd.). Historische Orthografie
      korrekt abzubilden, ist für die automatische Texterkennung (OCR),
      die ihre Ergebnisse auf Grundlage aktueller Rechtschreibung
      korrigiert, eine Herausforderung, jedoch ein wichtiger
      Orientierungspunkt, denn sie „ist nichts Äußerliches,
      Akzidentelles, sondern als ein Teil der historischen Form
      bedeutungskonstituierendes Merkmal“
      (<xref alt="Kraft 2001, 72" rid="ref-kraftEditionsphilologie2001" ref-type="bibr">Kraft
      2001, 72</xref>). Auch die Wahrung des Lautstandes ist hierbei ein
      wichtiger Grund der originalgetreuen Wiedergabe
      (<xref alt="Kraft 2001, 85" rid="ref-kraftEditionsphilologie2001" ref-type="bibr">Kraft
      2001, 85</xref>). Der Umgang mit dem Original statt einem
      Faksimile ist eine Maxime der textkritischen Arbeit, denn
      „[b]ereits durch eine Verkleinerung oder eine Vergrößerung des
      Originals tritt ein ‚Informationsverlust‘ ein“
      (<xref alt="Kraft 2001, 63" rid="ref-kraftEditionsphilologie2001" ref-type="bibr">Kraft
      2001, 63</xref>). Der im ersten Schritt der Textdigitalisierung
      erstellte Scan (s. u.) muss demnach dem Original so ähnlich wie
      möglich sehen, um einen solchen Informationsverlust zu vermeiden.
      Die Prinzipien der Textkritik, die sich im engeren Sinne mit der
      Herstellung eines Archetypus anhand überlieferter Textzeugen eines
      verlorengegangenen Textes beschäftigt, in den neueren Philologien
      jedoch in der Editionstechnik aufgeht, finden im übertragenen
      Sinne ebenfalls eine Fortführung in der Textdigitalisierung.
      Recensio (mustern), examinatio (prüfen) und emendatio (verbessern)
      (<xref alt="Kocher 2007, 761" rid="ref-kocherTextkritik2007" ref-type="bibr">Kocher
      2007, 761</xref>) sind auf den Prozess der Vergleichsarbeit von
      gedrucktem und digitalisiertem Text übertragbar, wobei hier
      freilich der gedruckte Text als das Original vorliegt und nicht
      erschlossen werden muss. Dennoch müssen beispielsweise auch hier
      „Druck- und Schreibfehler sowie Schäden des Textträgers“
      (<xref alt="Kocher 2007, 762" rid="ref-kocherTextkritik2007" ref-type="bibr">Kocher
      2007, 762</xref>) als solche identifiziert und ein Umgang mit
      ihnen gefunden werden.</p>
    </list-item>
    <list-item>
      <label>2)</label>
      <p>Auch die Digitalisierung von Handschriften geht zurück auf eine
      literaturwissenschaftliche Tradition im weiteren Sinne bzw. eine
      ihrer Hilfswissenschaften, nämlich die Paläografie, in der es
      „ganz allgemein um das Lesenkönnen der alten Schriften […] aber
      auch die Physiologie und Psychologie des Schreibens“
      (<xref alt="Rohr 2015, 125" rid="ref-rohrHistorischeHilfswissenschaftenEinfuhrung2015" ref-type="bibr">Rohr
      2015, 125</xref>) geht
      (<xref alt="Schneider 2003, 1" rid="ref-schneiderPalaographie2003" ref-type="bibr">Schneider
      2003, 1</xref>). Wesentliche Kategorien sind hier u. a. die
      Differenzierung unterschiedlicher Schreib- und Beschreibstoffe
      sowie die Identifikation von Abkürzungen und Sonderzeichen, des
      Duktus, Ligaturen, des Schriftwinkels oder der jeweils gebrauchten
      Schriftart (z. B. Druck- oder Schreibschrift, vereinfachte
      Ausgangsschrift, Majuskel- oder Minuskelschrift etc.), denn
      „verschiedene Schriftarten entstehen für unterschiedliche Zwecke,
      lassen sich in ihren Entwicklungsphasen und Blütezeiten
      nachvollziehen und werden schließlich von neuen Erscheinungen
      unterlaufen und letztlich abgelöst“
      (<xref alt="Schneider 2014, 13" rid="ref-schneiderPalaographieUndHandschriftenkunde2014" ref-type="bibr">Schneider
      2014, 13</xref>).</p>
    </list-item>
    <list-item>
      <label>3)</label>
      <p>Schließlich finden sich auch Veränderungen, die im Zuge des
      Buchdrucks die Umwandlung von Manuskripten in einen Drucksatz
      betrafen, in der heutigen Textdigitalisierung wieder. Beim Setzen
      geht es darum, das Manuskript buchstabengetreu wiederzugeben und
      häufig wurde dies durch einen Setzer und nicht den Autor selbst
      ausgeführt. „Eine der großen editorischen Schwierigkeiten
      bezüglich der Literatur der Frühen Neuzeit, der ersten
      Jahrhunderte nach Gutenberg bis zum Barock, besteht in der Klärung
      der Frage, […] wie sich der Text durch vielfache Wiederabdrucke
      verschlechtert hat“
      (<xref alt="Nutt-Kofoth 2007, 11" rid="ref-nutt-kofothTextkritikUndTextbearbeitung2007" ref-type="bibr">Nutt-Kofoth
      2007, 11</xref>). Diese Frage sollte auch an ein Textdigitalisat
      gestellt werden.</p>
    </list-item>
  </list>
</sec>
<sec id="diskussion">
  <title>4. Diskussion</title>
  <p>Die automatische Texterfassung mittels sogenannter Optical
  Character Recognition (OCR) eignet sich besonders für sauber gedruckte
  Texte mit einer gewöhnlichen Schriftart und ohne manuell hinzugefügte
  Annotationen (vgl.
  <xref alt="Annotation" rid="glossary-annotation">Annotation</xref>).
  Je mehr ein Text von diesem Ideal der Erfassbarkeit abweicht, desto
  schwieriger wird es, mittels automatisierter Verfahren ein annehmbares
  Ergebnis als Digitalisat zu erhalten. Die Tradition der optischen
  Zeichenerkennung reicht überraschend weit zurück. Der bereits in der
  Antike lebendige Traum, menschliche Fähigkeiten durch Maschinen
  nachzubilden, findet mit der Erfindung eines Retinascanners durch C.
  R. Carey 1870 in Massachusetts eine vorläufige Erfüllung
  (<xref alt="Eikvil 1993, 8" rid="ref-eikvilOCROpticalCharacter1993" ref-type="bibr">Eikvil
  1993, 8</xref>).</p>
  <p>Die Muster in heutigen OCR-Datenbanken, mit denen die erfassten
  Buchstaben abgeglichen werden, sind schriftartenspezifisch, weshalb
  auch die Wahl des OCR-Programms entscheidend zum Erfolg der
  Textdigitalisierung beiträgt. Die gängigsten Druckschriftarten sind in
  alle OCR-Softwares implementiert, moderne Anwendungen können zudem auf
  weitere Schriftarten „trainiert“ (vgl.
  <xref alt="Machine Learning" rid="glossary-machine-learning">Machine
  Learning</xref>) werden. Formatierungen wie eine Kursivierung oder
  Unterstreichung von Buchstaben oder Wörtern, unterschiedliche
  Schriftarten innerhalb eines Dokumentes und auch ein uneinheitlicher
  Buchstabenabstand (z. B. in Texten, die mit einer Schreibmaschine
  geschrieben wurden) können hier zu Schwierigkeiten führen. Ebenso
  können komplexere Layouts – z. B. ein Text mit mehreren Spalten oder
  Abbildungen – für die automatische Texterfassung große
  Herausforderungen bilden.</p>
  <p>Fortgeschrittenere Programme gleichen die Ergebnisse in einem
  weiteren Schritt mit Wörterbucheinträgen ab und passen sie diesen bei
  Bedarf an. Problematisch sind hier historische Texte (die ein
  historisches Wörterbuch voraussetzen), uneinheitliche Schreibungen von
  Wörtern oder die Häufung von Eigennamen, die in der Regel nicht in
  einem Wörterbuch aufgeführt werden, jedoch häufig gerade in
  fiktionalen Texten vorkommen. Auch mehrsprachige Texte führen hier zu
  Schwierigkeiten. Auf Frakturschrift sind nur verhältnismäßig wenig
  Programme spezialisiert, am häufigsten wird hier der ABBYY FineReader
  (<xref alt="Schumacher 2024a" rid="ref-schumacherToolbeitragAbbyyFineReader2019" ref-type="bibr">Schumacher
  2024a</xref>) genannt, der jedoch nicht kostenfrei zu nutzen ist.</p>
  <p>Die Angabe von Fehlerquoten bei der Evaluierung einzelner
  OCR-Programme ist mit Vorsicht zu genießen, da sie sich manchmal auf
  die Menge korrekt erfasster Wörter, manchmal aber auch auf die Menge
  korrekt erkannter Buchstaben in einem Textdokument bezieht. Zudem
  bleibt dabei der Effekt, den das jeweilige Preprocessing auf die
  Fehlerquote hat, im Dunkeln. Schließlich ist das Überprüfen von
  Fehlern in automatisch erfassten Texten sehr aufwändig und wird nur
  selten umfassend betrieben: eine Gegebenheit, die zu nicht
  repräsentativen Quoten führt. Das DFG-Projekt
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://ocr-d.de/">OCR-D</ext-link>
  widmet sich diesen Missständen und arbeitet außerdem daran, bestehende
  Verfahren zur automatischen Texterfassung in Hinblick auf die
  Besonderheiten von deutschsprachigen Texten des 16.–19. Jahrhunderts
  zu optimieren.</p>
  <p>Komplizierter als die automatische Erkennung von gedruckter Schrift
  ist der Bereich der automatischen Handschriftenerkennung (vgl.
  <xref alt="HTR" rid="glossary-htr">HTR</xref>) (Digitale
  Manuskriptanalyse
  (<xref alt="Horstmann 2024a" rid="ref-horstmannMethodenbeitragDigitaleManuskriptanalyse2018" ref-type="bibr">Horstmann
  2024a</xref>)). Handgeschriebene Schrift folgt sehr individuellen
  Mustern und variiert nicht nur zwischen unterschiedlichen Autor*innen
  stark, sondern häufig auch innerhalb des Werkes oder gar einzelner
  Texte von individuellen Autor*innen. Das Transkribus-Projekt
  (<xref alt="Horstmann 2024b" rid="ref-horstmannToolbeitragTranskribus2018" ref-type="bibr">Horstmann
  2024b</xref>) bietet im Umgang mit Handschriften und ihrer
  Digitalisierung eine verlässliche Anlaufstelle.</p>
  <p>Wegen der genannten Schwierigkeiten greift man in der Regel gerade
  bei Handschriften auf die Methode des <italic>Keying</italic> (d. h.
  dem manuellen Abtippen des Textes) zurück, um eine wissenschaftlich
  verwertbare Genauigkeit des digitalisierten Textes zu erreichen.
  Exemplarische Untersuchungen der Textsammlung des Deutschen
  Textarchivs
  (<xref alt="Horstmann und Kern 2024" rid="ref-horstmannRessourcenbeitragDeutschesTextarchiv2018" ref-type="bibr">Horstmann
  und Kern 2024</xref>) haben ergeben, dass die Erfassungsgenauigkeit
  sehr viel höher ist, wenn statt einer automatisierten optischen
  Zeichenerkennung das manuelle Verfahren des Double Keyings (vgl.
  <xref alt="Double-keying" rid="glossary-double-keying">Double-keying</xref>)
  eingesetzt wird
  (<xref alt="Geyken u. a. 2012, 9" rid="ref-geykenTEIUndTextkorpora2012" ref-type="bibr">Geyken
  u. a. 2012, 9</xref>). Beim Keying tippt lediglich eine Person den zu
  digitalisierenden Text händisch ab, wodurch es zu Lese- oder
  Flüchigkeitsfehlern kommen oder schlecht lesbarer Text falsch
  interpretiert werden kann. Im Double Keying-Verfahren hingegen
  erfassen zwei Personen den Text jeweils einmal manuell. Daraufhin
  werden Uneinheitlichkeiten in den beiden getrennt voneinander
  entstandenen Digitalisaten automatisch erfasst und von einer dritten
  Person händisch überprüft und ggf. korrigiert. Das Double Keying wird
  häufig an externe Anbieter ausgelagert, erfordert größere finanzielle
  Mittel als das OCR-Verfahren, überzeugt jedoch durch seine sehr hohe
  Genauigkeit (99.95% bis 99.98%). Auch bei diesen Quoten ist jedoch
  darauf zu achten, dass die Tests häufig nur beispielhaft anhand
  verhältnismäßig kleiner Textausschnitte durchgeführt wurden und es oft
  keine genaueren Angaben über die tatsächliche Textmenge, das
  Textgenre, die Art der gefundenen Fehler oder über die Transkriptoren
  gibt
  (<xref alt="Haaf, Wiegand und Geyken 2013" rid="ref-haafMeasuringCorrectnessDoubleKeying2013" ref-type="bibr">Haaf,
  Wiegand und Geyken 2013</xref>).</p>
</sec>
<sec id="technische-grundlagen">
  <title>5. Technische Grundlagen</title>
  <p>Wenn Sie die Texte, die Sie erforschen wollen, selbst einscannen,
  achten Sie auf eine hohe Bildauflösung. Programme zur automatisierten
  Texterfassung kommen schnell an ihre Grenzen, wenn die
  zugrundegelegten Scans mangelhaft sind. An der folgenden Abbildung
  (ein Ausschnitt aus Ingeborg Bachmanns Erzählung <italic>Das Gebell
  </italic>(1972)) kann dies demonstriert werden.</p>
  <fig>
    <caption><p>Scan eines Ausschnittes aus Ingeborg Bachmanns Erzählung
    <italic>Das Gebell</italic> (1972)</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Bachmann_Das_Gebell-p.png" />
  </fig>
  <p>Die OCR-Funktion des Adobe Acrobat Pro erkennt darin folgenden
  Text:</p>
  <p>LJrritiert und verletzt zu sein. Auch hörte sie erleichtert von
  der alten Frau, als auf diese schweren Zeiten die Rede
  kam, daß Leo nämlich von einer unermeßlichen Dankbar-.
  keit war und diesem Johanpes sehr geholfen hatte, der in
  vielen persönlichen Schwierigkeiten steckte, über die man
  jl besser nicht sprach. Die alte Frau zögerte und sagte ermutigt,
  weil sie immerhin der Frau eines Psychiaters gegenübersa.
  : Sie müssen nämlich wissen, der Johannes ist seu
  uell. . ” .</p>
  <p>Wir sehen, dass das Programm offensichtlich Schwierigkeiten mit
  Schmutzflecken (z. B. „Johanpes“), Trennstrichen („seu uell“),
  gelegentlich dem Buchstaben ß „gegenübersa.:“ sowie manuellen
  Textannotationen („LJrritiert“) hat. Diese Fehler müssen nun entweder
  im Anschluss der automatischen Texterkennung manuell korrigiert
  werden, man beugt ihnen vor, indem man eine bessere Papier- und
  Scanqualität zugrunde legt, oder man findet ein OCR-Programm, das mit
  dem jeweiligen Text besser umgehen kann und besser verwertbare
  Ergebnisse liefert.</p>
  <p>Eine OCR-Software identifiziert Abbildungen als solche und schließt
  sie aus der folgenden Texterkennung aus (Segmentierungsprozess).
  Ebenso werden Wortgrenzen, Zeilen und Absätze als solche festgestellt
  und Überschriften, Fußzeilen, Seitenzahlen etc. anhand ihres Abstandes
  zu den Blöcken des Haupttextes bzw. aufgrund divergierender
  Schriftarten gekennzeichnet. Jeder Punkt der Bilddatei wird entweder
  als Hintergrund oder als Text klassifiziert. In diesem Schritt der
  „Binarisierung“
  (<xref alt="Rehbein 2017, 194" rid="ref-rehbeinDigitalisierung2017" ref-type="bibr">Rehbein
  2017, 194</xref>) wurde der Fleck unter „Johannes“ als Text
  klassifiziert und führte daher zur fehlerhaften Texterkennung. Die als
  „Text“ identifizierten Pixel erhalten eine 1, die „Hintergrund“-Pixel
  eine 0. Das Schema der Einsen wird dann mit den Mustern in der
  OCR-Datenbank abgeglichen. Da dem Fleck unter dem „n“ des Johannes
  ebenfalls eine 1 zugeordnet wurde, entsprach das Schema eher dem
  Buchstaben und wurde als solcher umgesetzt.</p>
  <p>Um Fehler zu vermeiden, können in einigen OCR- oder Scanprogrammen
  im Zuge des „Preprocessing“ (vgl.
  <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
  diejenigen Bereiche des Dokumentes ausgewählt werden, die als Text
  erfasst werden sollen und die Abfolge der einzelnen Textfelder kann
  definiert werden (beispielsweise bei mehreren Spalten). Außerdem
  empfiehlt sich in diesem Schritt eine Optimierung der Farb- und
  Kontrastwerte (vgl. hierzu Kapitel 3 der
  <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.dfg.de/resource/blob/176108/898bf3574ad0ff3b1db525fa7d04c86c/12-151-v1216-de-data.pdf">DFG-Praxisregeln
  zur Digitalisierung</ext-link>).</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>Preprocessing-Programme</p>
      <list list-type="bullet">
        <list-item>
          <p>ScanTailor (nicht für Mac):
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://scantailor.org/">https://web.archive.org/save/http://scantailor.org/</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
        <list-item>
          <p>ImageMagick:
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.imagemagick.org/script/index.php">https://web.archive.org/save/https://www.imagemagick.org/script/index.php</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
        <list-item>
          <p>Unpaper:
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://github.com/Flameeyes/unpaper">https://web.archive.org/save/https://github.com/Flameeyes/unpaper</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
        <list-item>
          <p>Leptonica:
          &lt;<ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://www.leptonica.com/">https://web.archive.org/save/http://www.leptonica.com/</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
      </list>
    </list-item>
    <list-item>
      <p>OCR-Freeware</p>
      <list list-type="bullet">
        <list-item>
          <p>OCR4all:
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://lists.uni-wuerzburg.de/mailman/listinfo/ocr4all">https://web.archive.org/save/https://lists.uni-wuerzburg.de/mailman/listinfo/ocr4all</ext-link>
          (Letzter Zugriff: 04.06.2024), (vgl. OCR4all
          (<xref alt="Schumacher 2024b" rid="ref-schumacherToolbeitragOCR4all2019" ref-type="bibr">Schumacher
          2024b</xref>))</p>
        </list-item>
        <list-item>
          <p>Tesseract:
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://github.com/tesseract-ocr/tesseract">https://web.archive.org/save/https://github.com/tesseract-ocr/tesseract</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
        <list-item>
          <p>OCRopus:
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://github.com/tmbdev/ocropy">https://web.archive.org/save/https://github.com/tmbdev/ocropy</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
        <list-item>
          <p>PDF XChange View (nicht für Mac):
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.tracker-software.com/product/pdf-xchange-viewer">https://web.archive.org/save/https://www.tracker-software.com/product/pdf-xchange-viewer</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
        <list-item>
          <p>Google Docs:
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://support.google.com/drive/answer/176692?hl=de&amp;co=GE-NIE.Platform=D…%5D">https://web.archive.org/save/https://support.google.com/drive/answer/176692?hl=de&amp;co=GE-NIE.Platform=D…%5D</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
      </list>
    </list-item>
    <list-item>
      <p>Kostenpflichtige OCR-Software</p>
      <list list-type="bullet">
        <list-item>
          <p>ABBYY FineReader:
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.abbyy.com/de-de/finereader/">https://web.archive.org/save/https://www.abbyy.com/de-de/finereader/</ext-link>
          (Letzter Zugriff: 04.06.2024), (vgl. Abbyy FineReader
          (<xref alt="Schumacher 2024a" rid="ref-schumacherToolbeitragAbbyyFineReader2019" ref-type="bibr">Schumacher
          2024a</xref>))</p>
        </list-item>
        <list-item>
          <p>Adobe Reader Pro:
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://acrobat.adobe.com/de/de/acrobat/acrobat-pro.html">https://web.archive.org/save/https://acrobat.adobe.com/de/de/acrobat/acrobat-pro.html</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
        <list-item>
          <p>Omnipage:
          <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://www.nuance.de/for-business/by-product/omnipage/index.html">https://web.archive.org/save/http://www.nuance.de/for-business/by-product/omnipage/index.html</ext-link>
          (Letzter Zugriff: 04.06.2024)</p>
        </list-item>
      </list>
    </list-item>
    <list-item>
      <p>DFG-Praxisregeln zur Digitalisierung:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://web.archive.org/save/https://www.dfg.de/resource/blob/176108/898bf3574ad0ff3b1db525fa7d04c86c/12-151-v1216-de-data.pdf">https://web.archive.org/save/https://web.archive.org/save/https://www.dfg.de/resource/blob/176108/898bf3574ad0ff3b1db525fa7d04c86c/12-151-v1216-de-data.pdf</ext-link>
      (Letzter Zugriff: 04.06.2024)</p>
    </list-item>
    <list-item>
      <p>OCR-Bibliothek aus dem Projekt OCR-D:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.zotero.org/groups/418719/ocr-d">https://web.archive.org/save/https://www.zotero.org/groups/418719/ocr-d</ext-link>
      (Letzter Zugriff: 04.06.2024)</p>
    </list-item>
    <list-item>
      <p>OCR-D:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/http://ocr-d.de">https://web.archive.org/save/http://ocr-d.de</ext-link>
      (Letzter Zugriff: 04.06.2024)</p>
    </list-item>
    <list-item>
      <p>Transkribus:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.transkribus.org">https://web.archive.org/save/https://www.transkribus.org</ext-link>
      (Letzter Zugriff: 04.06.2024), (vgl. Transkribus
      (<xref alt="Horstmann 2024b" rid="ref-horstmannToolbeitragTranskribus2018" ref-type="bibr">Horstmann
      2024b</xref>))</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-double-keying">Double-keying</styled-content></term>
      <def>
        <p>Double-Keying ist eine Variante des
        <xref alt="Keying" rid="glossary-keying">Keying</xref>, bei der
        zwei Personen den Inhalt eines Dokumentes abtippen. Anschließend
        sucht ein Computerprogramm nach Differenzen zwischen den beiden
        Versionen. Gefundene Tippfehler werden dann von einer dritten
        Person korrigiert. So entstehen nahezu fehlerfreie
        Textdigitalisate.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-htr">HTR</styled-content></term>
      <def>
        <p>HTR steht für <italic>Handwritten Text Recognition</italic>
        und ist eine Form der Mustererkennung, wie auch die
        <xref alt="OCR" rid="glossary-ocr">OCR</xref>. HTR bezeichnet
        die automatische Erkennung von Handschriften und die Umformung
        dieser in einen elektronischen Text. Die Automatisierung beruht
        auf einem
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-keying">Keying</styled-content></term>
      <def>
        <p>In den Bibliotheks- und Textwissenschaften beschreibt Keying
        das manuelle Erfassen, also das Abtippen, eines Textes im Zuge
        seiner Digitalisierung (siehe auch
        <xref alt="Double-Keying" rid="glossary-double-keying">Double-Keying</xref>).</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-korpus">Korpus</styled-content></term>
      <def>
        <p>Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural
        für „das Korpus“) sind typischerweise nach Textsorte, Epoche,
        Sprache oder Autor*in zusammengestellt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-ocr">OCR</styled-content></term>
      <def>
        <p>OCR steht für <italic>Optical Character Recognition</italic>
        und bezeichnet die automatische Texterkennung von gedruckten
        Texten, d. h. ein Computer „liest“ ein eingescanntes Dokument,
        erkennt und erfasst den Text darin und generiert daraufhin eine
        elektronische Version.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic> , oder
        „Wortart“ auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-berlin-brandenburgischeakademiederwissenschaftenDeutschesTextarchivGrundlage2018">
    <mixed-citation>Berlin-Brandenburgische Akademie der Wissenschaften.
    2018. Deutsches Textarchiv. Grundlage für ein Referenzkorpus der
    neuhochdeutschen Sprache. <italic>Deutsches Textarchiv</italic>.
    <ext-link ext-link-type="uri" xlink:href="https://www.deutschestextarchiv.de/">https://www.deutschestextarchiv.de/</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-deutscheforschungsgemeinschaftDFGPraxisregelnDigitalisierung2016">
    <mixed-citation>Deutsche Forschungsgemeinschaft und Digitalisierung.
    2016. <italic>DFG-Praxisregeln. „Digitalisierung“</italic>.
    <ext-link ext-link-type="uri" xlink:href="http://www.dfg.de/formulare/12_151/12_151_de.pdf">http://www.dfg.de/formulare/12_151/12_151_de.pdf</ext-link>
    (zugegriffen: 12. Juli 2018).</mixed-citation>
  </ref>
  <ref id="ref-eikvilOCROpticalCharacter1993">
    <mixed-citation>Eikvil, Line. 1993. <italic>OCR. Optical Character
    Recognition</italic>.
    <ext-link ext-link-type="uri" xlink:href="https://www.nr.no/~eikvil/OCR.pdf">https://www.nr.no/~eikvil/OCR.pdf</ext-link>
    (zugegriffen: 22. Januar 2018).</mixed-citation>
  </ref>
  <ref id="ref-geykenTEIUndTextkorpora2012">
    <mixed-citation>Geyken, Alexander, Mathhias Boenig, Susanne Haaf,
    Bryan Jurish, Christian Thomas und Frank Wiegand. 2012. TEI und
    Textkorpora: Fehlerklassifikation und Qualitätskontrolle vor,
    während und nach der Texterfassung im Deutschen Textarchiv.
    <italic>Jahrbuch für Computerphilologie</italic>.
    <ext-link ext-link-type="uri" xlink:href="http://www.computerphilologie.de/jg09/geykenetal.html">http://www.computerphilologie.de/jg09/geykenetal.html</ext-link>
    (zugegriffen: 22. Januar 2018).</mixed-citation>
  </ref>
  <ref id="ref-grubmüllerEdition1997">
    <mixed-citation>Grubmüller, Klaus und Klaus Weimar. 1997. Edition.
    In: <italic>Reallexikon der deutschen Literaturwissenschaft.
    Neubearbeitung des Reallexikons der deutschen
    Literaturgeschichte</italic>, hg. von Klaus Weimar, 1: A-G:414–418.
    Berlin, New York: de Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-haafMeasuringCorrectnessDoubleKeying2013">
    <mixed-citation>Haaf, Susanne, Frank Wiegand und Alexander Geyken.
    2013. Measuring the Correctness of Double-Keying: Error
    Classification and Quality Control in a Large Corpus of
    TEI-Annotated Historical Text. <italic>Journal of the Text Encoding
    Initiative</italic>, Nr. 4. doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.4000/jtei.739">10.4000/jtei.739</ext-link>,
    (zugegriffen: 22. Januar 2018).</mixed-citation>
  </ref>
  <ref id="ref-horstmannMethodenbeitragDigitaleManuskriptanalyse2018">
    <mixed-citation>Horstmann, Jan. 2024a. Methodenbeitrag: Digitale
    Manuskriptanalyse. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1,
    Nr. 3. Textdigitalisierung und Edition (12. Juni). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3744">10.48694/fortext.3744</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/routinen/methoden/digitale-manuskriptanalyse">https://fortext.net/routinen/methoden/digitale-manuskriptanalyse</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannToolbeitragTranskribus2018">
    <mixed-citation>———. 2024b. Toolbeitrag: Transkribus. Hg. von Evelyn
    Gius. <italic>forTEXT</italic> 1, Nr. 3. Textdigitalisierung und
    Edition (12. Juni). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3746">10.48694/fortext.3746</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/transkribus">https://fortext.net/tools/tools/transkribus</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-horstmannRessourcenbeitragDeutschesTextarchiv2018">
    <mixed-citation>Horstmann, Jan und Alexandra Kern. 2024.
    Ressourcenbeitrag: Deutsches Textarchiv (DTA). Hg. von Evelyn Gius.
    <italic>forTEXT</italic> 1, Nr. 11. Bibliografie (29. November).
    doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3791">10.48694/fortext.3791</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/ressourcen/textsammlungen/deutsches-textarchiv-dta">https://fortext.net/ressourcen/textsammlungen/deutsches-textarchiv-dta</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-kocherTextkritik2007">
    <mixed-citation>Kocher, Ursula. 2007. Textkritik. In:
    <italic>Metzler Lexikon Literatur. Begriffe und
    Definitionen</italic>, hg. von Dieter Burdorf, Christoph Fasbender,
    und Burkhard Moenninghoff, 761–762. Stuttgart, Weimar:
    Metzler.</mixed-citation>
  </ref>
  <ref id="ref-kraftEditionsphilologie2001">
    <mixed-citation>Kraft, Herbert. 2001.
    <italic>Editionsphilologie</italic>. Frankfurt am Main (u.a.):
    Lang.</mixed-citation>
  </ref>
  <ref id="ref-nutt-kofothTextkritikUndTextbearbeitung2007">
    <mixed-citation>Nutt-Kofoth, Rüdiger. 2007. Textkritik und
    Textbearbeitung. In: <italic>Handbuch
    Literaturwissenschaft</italic>, hg. von Thomas Anz, 2: Methoden und
    Theorie:1–27. Stuttgart, Weimar: Metzler.</mixed-citation>
  </ref>
  <ref id="ref-rehbeinDigitalisierung2017">
    <mixed-citation>Rehbein, Malte. 2017. Digitalisierung. In:
    <italic>Digital Humanities. Eine Einführung</italic>, hg. von Fotis
    Jannidis, Hubertus Kohle, und Malte Rehbein, 179–198. Stuttgart:
    Metzler.</mixed-citation>
  </ref>
  <ref id="ref-rohrHistorischeHilfswissenschaftenEinfuhrung2015">
    <mixed-citation>Rohr, Christian. 2015. <italic>Historische
    Hilfswissenschaften: eine Einführung</italic>. Wien (u.a.):
    Böhlau.</mixed-citation>
  </ref>
  <ref id="ref-schneiderPalaographie2003">
    <mixed-citation>Schneider, Karin. 2003. Paläographie. In:
    <italic>Reallexikon der deutschen Literaturwissenschaft.
    Neubearbeitung des Reallexikons der deutschen
    Literaturgeschichte</italic>, hg. von Jan-Dirk Müller, III: P-Z:1–3.
    Berlin, New York: de Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-schneiderPalaographieUndHandschriftenkunde2014">
    <mixed-citation>———. 2014. <italic>Paläographie und
    Handschriftenkunde für Germanisten: eine Einführung</italic>.
    Berlin, New York: de Gruyter.</mixed-citation>
  </ref>
  <ref id="ref-schumacherToolbeitragAbbyyFineReader2019">
    <mixed-citation>Schumacher, Mareike. 2024a. Toolbeitrag: Abbyy
    FineReader. Hg. von Evelyn Gius. <italic>forTEXT</italic> 1, Nr. 3.
    Textdigitalisierung und Edition (12. Juni). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3742">10.48694/fortext.3742</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/abbyy-finereader">https://fortext.net/tools/tools/abbyy-finereader</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-schumacherToolbeitragOCR4all2019">
    <mixed-citation>———. 2024b. Toolbeitrag: OCR4all. Hg. von Evelyn
    Gius. <italic>forTEXT</italic> 1, Nr. 3. Textdigitalisierung und
    Edition (12. Juni). doi:
    <ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48694/fortext.3743">10.48694/fortext.3743</ext-link>,
    <ext-link ext-link-type="uri" xlink:href="https://fortext.net/tools/tools/ocr4all">https://fortext.net/tools/tools/ocr4all</ext-link>.</mixed-citation>
  </ref>
  <ref id="ref-sprollEditionstechnik2007">
    <mixed-citation>Sproll, Monika. 2007. Editionstechnik. In:
    <italic>Metzler Lexikon Literatur. Begriffe und
    Definitionen</italic>, hg. von Dieter Burdorf, Christoph Fasbender,
    und Burkhard Moenninghoff, 178. Stuttgart, Weimar:
    Metzler.</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
