<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Archiving and Interchange DTD v1.3 20210610//EN"
                  "http://jats.nlm.nih.gov/archiving/1.3/JATS-archivearticle1-3.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" dtd-version="1.3" article-type="other">
<front>
<journal-meta>
<journal-id></journal-id>
<journal-title-group>
<journal-title>forTEXT</journal-title>
</journal-title-group>
<issn publication-format="electronic">2943-212X</issn>
<publisher>
<publisher-name>Universitäts- und Landesbibliothek
Darmstadt</publisher-name>
<publisher-loc>Darmstadt</publisher-loc>
</publisher>
</journal-meta>
<article-meta>
<article-id pub-id-type="doi">10.48694/fortext.3789</article-id>
<title-group>
<article-title>Resourcenbeitrag: Bibliotheca Augustana</article-title>
</title-group>
<contrib-group>
<contrib contrib-type="author">
<contrib-id contrib-id-type="orcid">0000-0002-1707-284X</contrib-id>
<name>
<surname>Flüh</surname>
<given-names>Marie</given-names>
</name>
<email>marie.flueh@uni-hamburg.de</email>
<xref ref-type="aff" rid="aff-1"/>
</contrib>
<aff id="aff-1">
<institution-wrap>
<institution>Universität Hamburg</institution>
</institution-wrap>
</aff>
</contrib-group>
<volume>1</volume>
<issue>11</issue>
<issue-title>Bibliografie</issue-title>
<pub-history>
<event>
<event-desc>Erstveröffentlichung: 29.04.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/ressourcen/textsammlungen/bibliotheca-augustana">fortext.net</ext-link>
<date date-type="origdate" iso-8601-date="2019-04-29">
<day>29</day>
<month>04</month>
<year>2019</year>
</date>
</event-desc>
</event>
</pub-history>
<permissions>
<license license-type="open-access">
<ali:license_ref xmlns:ali="http://www.niso.org/schemas/ali/1.0/">https://creativecommons.org/licenses/by-sa/4.0/</ali:license_ref>
<license-p>-This work is licensed under a Creative Commons
Attribution-ShareAlike 4.0 International License.</license-p>
</license>
</permissions>
</article-meta>
</front>
<body>
<p><bold>Erstveröffentlichung:</bold> 29.04.2019 auf <ext-link ext-link-type="uri" xlink:href="https://fortext.net/ressourcen/textsammlungen/bibliotheca-augustana">fortext.net</ext-link></p>
<sec id="kurzbeschreibung">
  <title>1. Kurzbeschreibung</title>
  <p>Die Bibliotheca Augustana umfasst 15 verschiedene Fachbibliotheken,
  in denen Leben, Werke und Sekundärliteratur von insgesamt über 1000
  Autor*innen – mit hohem ebenso wie eher niedrigem Kanonisierungsgrad –
  vorgestellt werden. Neben ausgewählten deutschsprachigen Texten und
  Übersetzungen ins Deutsche werden Ihnen lateinische, griechische,
  englische, französische, italienische und spanische Texte zur
  Verfügung gestellt.</p>
  <fig>
    <caption><p>Abb. 1: Die Startseite der Bibliotheca
    Augustana</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Bildschirmfoto_20190320_um_17.00-p.png" />
  </fig>
  <p><bold>Steckbrief</bold></p>
  <list list-type="bullet">
    <list-item>
      <p><ext-link ext-link-type="uri" xlink:href="https://www.hs-augsburg.de/~harsch/augustana.html">https://www.hs-augsburg.de/~harsch/augustana.html</ext-link><ext-link ext-link-type="uri" xlink:href="https://web.archive.org/save/https://www.hs-augsburg.de/~harsch/augustana.html">2</ext-link></p>
    </list-item>
    <list-item>
      <p>Im Jahr 1996 von Prof. em. Ulrich Harsch (Lehrgebiet:
      Kommunikationsdesign und Elektronisches Publizieren im Fachbereich
      Gestaltung an der Fachhochschule Augsburg) gegründetes digitales
      Langzeitarchiv, als Privatprojekt bis heute weitergeführt</p>
    </list-item>
    <list-item>
      <p>12 verschiedensprachige Bibliotheken mit jeweils
      unterschiedlichen Sammelschwerpunkten</p>
    </list-item>
    <list-item>
      <p>Weitere Bestandteile der Bibliothek: Archiv digitalisierter
      Kunstwerke (<italic>Museum virtuale</italic>), Musikarchiv
      (<italic>Obeion virtuale</italic>), Filmarchiv
      (<italic>Cinematheca Virtualis</italic>)</p>
    </list-item>
    <list-item>
      <p>Aufteilung der <italic>Bibliotheca Germanica</italic>:
      althochdeutsche (23 Texte) und altniederdeutsche Literatur (5
      Texte), mittelhochdeutsche (36 Texte) und mittelniederdeutsche
      Literatur (13 Texte), frühneuhochdeutsche (83 Texte) und
      frühneuniederdeutsche Literatur (17 Texte), neuhochdeutsche (295
      Texte) und neuniederdeutsche Literatur (20 Texte)</p>
    </list-item>
    <list-item>
      <p>Texte der <italic>Bibliotheca Germanica</italic> entstammen dem
      8. bis 20./21. Jhd., zahlenmäßig überlegen sind Texte aus der Zeit
      zwischen dem 17. und dem 21. Jhd.</p>
    </list-item>
    <list-item>
      <p><xref alt="Metadaten" rid="glossary-metadaten">Metadaten</xref>
      der Ressourcen in der <italic>Bibliotheca Germanica</italic>:
      Werktitel, Name, Datumsangabe des ersten Erscheinens,
      Epochenzugehörigkeit</p>
    </list-item>
    <list-item>
      <p>Textsorten: fiktionale und nicht-fiktionale Texte,
      wissenschaftliche Abhandlungen, Epen und Erzählungen, Gedichte,
      Briefe, Vorträge und weitere Textformen und Dokumente</p>
    </list-item>
    <list-item>
      <p>Enthält ausschließlich gemeinfreie Texte (vgl.
      <xref alt="Open Access" rid="glossary-open-access">Open
      Access</xref>), die sich auf dem Server der FH Augsburg befinden
      und direkt auf der Seite eingebettet sind, oder durch eine
      Verlinkung auf externe Informationsressourcen (z. B. Google Books,
      Internet Archive oder diverse Online-Bibliotheken, etwa Gallica,
      Biblioteca Virtual Miguel de Cervantes oder die Bayerische
      Staatsbibliothek München) zur Verfügung gestellt werden</p>
    </list-item>
    <list-item>
      <p>Herunterladen der Texte nur per copy &amp; paste in ein eigenes
      Dokument, da keine Downloadfunktion zur Verfügung steht</p>
    </list-item>
  </list>
</sec>
<sec id="anwendungsbeispiel">
  <title>2. Anwendungsbeispiel</title>
  <p>Sie sind auf der Suche nach einer ersten Inspiration für ein
  Forschungsprojekt und befinden sich noch in der Phase der Ideen- und
  Themenfindung? Für diese frühe Phase der Projektkonzeption eignet sich
  die Arbeit mit der Bibliotheca Augustana. Hier finden Sie
  biographische Angaben, epochale Werke und hilfreiche Verlinkungen zu
  ausgewählten Autor*innen.</p>
</sec>
<sec id="diskussion">
  <title>3. Diskussion</title>
  <sec id="kann-ich-die-bibliotheca-augustana-für-wissenschaftliche-arbeiten-nutzen">
    <title>3.1 Kann ich die Bibliotheca Augustana für wissenschaftliche
    Arbeiten nutzen?</title>
    <p>Zum Teil, da keine Exportfunktionen für die zur Verfügung
    gestellten Texte existiert, gestaltet sich die wissenschaftliche
    Arbeit mit den Texten schwierig. Die Bibliotheca Augustana ist
    folglich nicht darauf ausgelegt, zitierfähige Primärliteratur für
    weitere literaturwissenschaftliche (digitale) Arbeitsschritte zur
    Verfügung zu stellen, sondern lebt als kreativ gestaltete und
    inhaltlich äußerst vielseitige Literaturdatenbank von der
    seiteninternen Recherche und Lektüre. Quellenangaben finden Sie auf
    der jeweiligen Autor*innenseite unter dem Menüpunkt „Quellen,
    Kolophon“. Die Metadaten sind nicht immer eindeutig oder lückenhaft,
    gleichzeitig wird nicht immer deutlich, welcher Text welcher Ausgabe
    entnommen wurde. Grundlage für die hier dargebotenen Texte sind
    hauptsächlich zitierfähige Printausgaben (Gesamtausgaben oder
    Gesammelte Werke). Die Texte werden entweder von dem Herausgeber
    eingescannt (vgl. <xref alt="OCR" rid="glossary-ocr">OCR</xref>)
    oder von privaten Kooperationspartnern eingeschickt, mit einem
    Editor an das Seitenformat angepasst und Korrektur gelesen
    (<xref alt="Landeck und Starnes 2000" rid="ref-landeckPrimarliteraturImInternet2000" ref-type="bibr">Landeck
    und Starnes 2000</xref>). Nicht für alle in der Bibliothek
    aufgelisteten Titel wurden die entsprechenden Texte bereits
    eingescannt. Die mit Volltexten versehenen Titel erkennen Sie an der
    blauen Schriftfarbe. Darüber hinaus finden sich v. a. unter der
    bereitgestellten Sekundärliteratur einige tote Links.
    Die Auswahl der Texte basiert u. a. auf dem von Hermann Hesse
    verfassten Essay <italic>Eine Bibliothek der Weltliteratur</italic>,
    in dem der persönliche literarische Kanon des
    Schriftstellers/Malers/Dichters vorgestellt wird. Die Bibliothek
    umfasst neben mittelalterlicher Literatur (Titel wie
    <italic>Tristan</italic>, <italic>Carmina Burana</italic> und
    <italic>Das Nibelungenlied</italic> können abgerufen werden) und den
    namhaften Größen des 18. und 19. Jhds. wie Goethe, Schiller und
    Wieland auch eher unbekannte Namen. Die Integration vergleichsweise
    unbekannter Autor*innen wie Christine Ebner, Frau Ava oder Hans von
    Bühel verweisen auf das Bestreben des Herausgebers, eine Plattform
    für Autor*innen und Werke abseits des Bildungskanons zu gestalten.
    Eine hilfreiche Ergänzung stellen die unter „Hilfsmittel“
    vorgestellten Bibliographien, Lexika, Datenbanken,
    Digitalisierungsprojekte und weiterführenden Links zu Fachportalen
    dar, die allen zwölf Bibliotheken zur Seite gestellt werden.</p>
  </sec>
  <sec id="wie-benutzerfreundlich-ist-die-arbeit-mit-der-bibliotheca-augustana">
    <title>3.2 Wie benutzerfreundlich ist die Arbeit mit der Bibliotheca
    Augustana?</title>
    <p>Die Bibliotheca Augustana vereint durch ihren klaren Aufbau, das
    auf Latein verfasste Interface und einen z. T. äußerst
    verschachtelten hierarchischen Aufbau benutzerfreundliche und
    benutzerunfreundliche Aspekte.
    Die klare Struktur der Startseite generiert einen schnellen
    Überblick über die unterschiedlichen zur Verfügung gestellten
    Informationsressourcen und erleichtert die Orientierung in den
    unterschiedlichen Bibliotheken. Benutzerfreundlichkeit wird vor
    allem durch die übersichtlich gestalteten Einzelansichten der
    Autor*innenportraits umgesetzt. Die Informationen zu Leben und Werk
    bereichern die dargebotenen Primärtexte, die dadurch nicht isoliert
    dastehen, sondern in einen zeithistorischen und biographischen
    Kontext eingeordnet werden. Besonders anschaulich sind zahlreiche
    grafische Elemente wie Handschriftenfaksimiles, Bilder der
    vorgestellten Autor*innen oder Titelblätter älterer Ausgaben.
    Als ungewohnt und weniger benutzerfreundlich erweist sich zunächst
    die vollständig auf Latein verfasste Benutzeroberfläche (vgl.
    <xref alt="GUI" rid="glossary-gui">GUI</xref>) der Bibliotheca
    Augustana und das Fehlen einer Navigationsleiste. Texte und
    Metadaten der unterschiedlichen Bibliotheken sind jedoch in der
    Originalsprache der jeweiligen Bibliothek verfasst. Je nachdem, in
    welcher Kategorie Sie sich gerade befinden, wird am oberen und am
    unteren Bildschirmrand eine individuelle Navigationsleiste
    eingeblendet.
    Eine gewisse Einarbeitungszeit muss berücksichtigt werden, da jede
    Seite eine Vielzahl an Informationen und weiterführenden Links (auch
    auf externe Quellen und in seltenen Fällen als Verweis zwischen
    Autor*innen über die einzelnen Bibliotheken hinweg) beinhaltet.</p>
    <fig>
      <caption><p>Abb. 2: Vorstellung eines Autors (Ödön Horváth) und
      zugehöriger Ausschnitt der Werkbibliographie in der Bibliotheca
      Augustana</p></caption>
      <graphic mimetype="image" mime-subtype="png" xlink:href="odon_p.png" />
    </fig>
  </sec>
</sec>
<sec id="wie-funktioniert-die-textsuche-in-der-bibliotheca-augustana">
  <title>4. Wie funktioniert die Textsuche in der Bibliotheca
  Augustana?</title>
  <p>In der Bibliotheca Augustana steht Ihnen keine Suchfunktion (vgl.
  <xref alt="Query" rid="glossary-query">Query</xref>) zur Verfügung. Um
  zügig Ihren gewünschten Text zu finden, empfiehlt sich die Nutzung der
  <xref alt="Browsersuchfunktion" rid="glossary-browsersuchfunktion">Browsersuchfunktion</xref>.
  Bei der Suche nach Werken und Autor*innen müssen Sie auf die durch die
  Bibliothek vorgegebene hierarchische Struktur zurückgreifen. Die
  Ressourcen einer Bibliothek können Sie sich in unterschiedlichen
  Listen anzeigen lassen: Als alphabetisch geordnetes Autor*innen- und
  Textregister oder als chronologisch geordnete Liste, die wiederum aus
  einer alphabetischen Liste der enthaltenen Autor*innen besteht.</p>
  <fig>
    <caption><p>Abb. 3: Links: Die Anzeigeoptionen unterschiedlicher
    Bibliotheken; Rechts: Das Interface der chronologisch und
    alphabetisch geordneten Bibliotheca Germanica</p></caption>
    <graphic mimetype="image" mime-subtype="png" xlink:href="Bibliotheca_Augustana-p.png" />
  </fig>
  <p>Ein Vorteil der nach Epochen gegliederten Ansicht ist die
  übersichtliche Darstellung sämtlicher in ein und derselben Zeit
  wirksamen Schriftsteller*innen. Auf diese Weise werden überschaubare
  Textkorpora (vgl.
  <xref alt="Korpus" rid="glossary-korpus">Korpus</xref>) präsentiert,
  die Sie z. B. für weitere vergleichende Analysen verwenden können. Die
  alphabetische Liste generiert einen Überblick über sämtliche in der
  Bibliothek vertretene Autor*innen. Auf diese Weise können Sie trotz
  fehlender Suchoption zügig herausfinden, ob der/die gesuchte Autor*in
  in der Bibliothek enthalten ist.
  Nachdem Sie sich für eine Listenansicht entschieden haben, gliedert
  sich der Seiteninhalt in die drei Bereiche Autor*in, Werk und
  Sekundäres, wobei biographische Angaben (inkl. Bilder),
  bibliographische Angaben und Sekundärliteratur (u. a. Artikel,
  Verlinkungen auf Websites, Vorlesungen zu Werk/Autor*in, Liste der
  Gesamtausgaben) zur Verfügung gestellt werden. Die biographischen
  Angaben variieren hinsichtlich ihrer Ausführlichkeit. Die Konzeption
  der Bibliothek lädt zum eigenständigen Erkunden und unvoreingenommenen
  Sammeln erster Lektüreerfahrungen ein. Das Design der Seiten mit einem
  ausgewogenen Verhältnis zwischen Text und Bild sowie der Verwendung
  gedeckter Farben machen das Lesen am Bildschirm sehr angenehm.
  Die Textressourcen werden entweder auf der Webseite selbst (über den
  Server der FHS Augsburg) bereitgestellt oder sind über eine
  gekennzeichnete Weiterleitung (Symbol: &gt;&gt;&gt;), die zu weiteren
  Textarchiven führt, abrufbar.
  Unter dem Menüpunkt „Epistulae electronicae“ können Sie per E-Mail mit
  dem Betreiber der Website Kontakt aufnehmen. Ein Handbuch oder weitere
  Informationen über Aufbau und Nutzung der Bibliothek stehen nicht zur
  Verfügung. Der Betreiber reagiert jedoch zügig auf Nachfragen und/oder
  Anmerkungen.</p>
</sec>
<sec id="externe-und-weiterführende-links">
  <title>Externe und weiterführende Links</title>
  <list list-type="bullet">
    <list-item>
      <p>Bibliotheca Augustana:
      <ext-link ext-link-type="uri" xlink:href="https://web.archive.org/web/20241106120751/https://www.hs-augsburg.de/~harsch/augustana.html">https://web.archive.org/web/20241106120751/https://www.hs-augsburg.de/~harsch/augustana.html</ext-link>
      (Letzter Zugriff: 06.11.2024)</p>
    </list-item>
  </list>
</sec>
<sec id="glossar">
  <title>Glossar</title>
  <def-list>
    <def-item>
      <term><styled-content id="glossary-annotation">Annotation</styled-content></term>
      <def>
        <p>Annotation beschreibt die manuelle oder automatische
        Hinzufügung von Zusatzinformationen zu einem Text. Die manuelle
        Annotation wird händisch durchgeführt, während die
        (teil-)automatisierte Annotation durch
        <xref alt="Machine-Learning-Verfahren" rid="glossary-machine-learning">Machine-Learning-Verfahren</xref>
        durchgeführt wird. Ein klassisches Beispiel ist das
        automatisierte
        <xref alt="PoS-Tagging" rid="glossary-pos">PoS-Tagging</xref>
        (Part-of-Speech-Tagging), welches oftmals als Grundlage
        (<xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>)
        für weitere Analysen wie Named Entity Recognition (NER) nötig
        ist. Annotationen können zudem deskriptiv oder analytisch
        sein.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browser">Browser</styled-content></term>
      <def>
        <p>Mit Browser ist in der Regel ein Webbrowser gemeint, also ein
        Computerprogramm, mit dem das Anschauen, Navigieren auf, und
        Interagieren mit Webseiten möglich wird. Am häufigsten genutzt
        werden dafür Chrome, Firefox, Safari oder der Internet
        Explorer.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-browsersuchfunktion">Browsersuchfunktion</styled-content></term>
      <def>
        <p>Um eine
        <xref alt="Browser" rid="glossary-browser">Browser</xref>-Suchfunktion
        durchzuführen, und beispielsweise eine Webseite auf bestimmte
        Suchbegriffe zu filtern, klicken Sie auf Ihrem Mac „cmd“ + „F“
        und auf Ihrem Windows PC „Strg“ + „F“. In das sich öffnende
        Suchfenster tragen Sie Ihren Suchbegriff ein und die jeweils
        geöffnete Seite wird darauf hin durchsucht.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-commandline">Commandline</styled-content></term>
      <def>
        <p>Die Commandline (engl. <italic>command line
        interface</italic> (CLI)), auch Kommandozeile, Konsole, Terminal
        oder Eingabeaufforderung genannt, ist die direkteste Methode zur
        Interaktion eines Menschen mit einem Computer. Programme ohne
        eine grafische Benutzeroberfläche
        (<xref alt="GUI" rid="glossary-gui">GUI</xref>) werden i. d. R.
        durch Texteingabe in die Commandline gesteuert. Um die
        Commandline zu öffnen, klicken Sie auf Ihrem Mac „cmd“ +
        „space“, geben „Terminal“ ein und doppelklicken auf das
        Suchergebnis. Bei Windows klicken Sie die Windowstaste + „R“,
        geben „cmd.exe“ ein und klicken Enter.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-gui">GUI</styled-content></term>
      <def>
        <p>GUI steht für <italic>Graphical User Interface</italic> und
        bezeichnet eine grafische Benutzeroberfläche. Ein GUI ermöglicht
        es, Tools mithilfe von grafischen Schaltflächen zu bedienen, um
        somit beispielsweise den Umgang mit der
        <xref alt="Commandline" rid="glossary-commandline">Commandline</xref>
        zu umgehen.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-html">HTML</styled-content></term>
      <def>
        <p>HTML steht für <italic>Hypertext Markup Language</italic> und
        ist eine textbasierte Auszeichnungssprache zur Strukturierung
        elektronischer Dokumente. HTML-Dokumente werden von
        <xref alt="Webbrowsern" rid="glossary-browser">Webbrowsern</xref>
        dargestellt und geben die Struktur und Online-Darstellung eines
        Textes vor. HTML-Dateien können außerdem zusätzliche
        <xref alt="Metainformationen" rid="glossary-metadaten">Metainformationen</xref>
        enthalten, die auf einer Webseite selbst nicht ersichtlich
        sind.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-korpus">Korpus</styled-content></term>
      <def>
        <p>Ein Textkorpus ist eine Sammlung von Texten. Korpora (Plural
        für „das Korpus“) sind typischerweise nach Textsorte, Epoche,
        Sprache oder Autor*in zusammengestellt.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-lemmatisieren">Lemmatisieren</styled-content></term>
      <def>
        <p>Die Lemmatisierung von Textdaten gehört zu den wichtigen
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritten
        in der Textverarbeitung. Dabei werden alle Wörter
        (<xref alt="Token" rid="glossary-type-token">Token</xref>) eines
        Textes auf ihre Grundform zurückgeführt. So werden
        beispielsweise Flexionsformen wie „schneller“ und „schnelle“ dem
        Lemma „schnell“ zugeordnet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-machine-learning">Machine
      Learning</styled-content></term>
      <def>
        <p>Machine Learning, bzw. maschinelles Lernen im Deutschen, ist
        ein Teilbereich der künstlichen Intelligenz. Auf Grundlage
        möglichst vieler (Text-)Daten erkennt und erlernt ein Computer
        die häufig sehr komplexen Muster und Gesetzmäßigkeiten
        bestimmter Phänomene. Daraufhin können die aus den Daten
        gewonnen Erkenntnisse verallgemeinert werden und für neue
        Problemlösungen oder für die Analyse von bisher unbekannten
        Daten verwendet werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-markup-language">Markup
      Language</styled-content></term>
      <def>
        <p>Markup Language bezeichnet eine maschinenlesbare
        Auszeichnungssprache, wie z. B.
        <xref alt="HTML" rid="glossary-html">HTML</xref>, zur
        Formatierung und Gliederung von Texten und anderen Daten. So
        werden beispielsweise auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        durch ihre Digitalisierung oder ihre digitale Erstellung zu
        Markup, indem sie den Inhalt eines Dokumentes strukturieren.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-metadaten">Metadaten</styled-content></term>
      <def>
        <p>Metadaten oder Metainformationen sind strukturierte Daten,
        die andere Daten beschreiben. Dabei kann zwischen
        administrativen (z. B. Zugriffsrechte, Lizenzierung),
        deskriptiven (z. B. Textsorte), strukturellen (z. B. Absätze
        oder Kapitel eines Textes) und technischen (z. B. digitale
        Auflösung, Material) Metadaten unterschieden werden. Auch
        <xref alt="Annotationen" rid="glossary-annotation">Annotationen</xref>
        bzw.
        <xref alt="Markup" rid="glossary-markup-language">Markup</xref>
        sind Metadaten, da sie Daten/Informationen sind, die den
        eigentlichen Textdaten hinzugefügt werden und Informationen über
        die Merkmale der beschriebenen Daten liefern.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-named-entities">Named
      Entities</styled-content></term>
      <def>
        <p>Eine Named Entity (NE) ist eine Entität, oft ein Eigenname,
        die meist in Form einer Nominalphrase zu identifizieren ist.
        Named Entities können beispielsweise Personen wie „Nils
        Holgerson“, Organisationen wie „WHO“ oder Orte wie „New York“
        sein. Named Entities können durch das Verfahren der Named Entity
        Recognition (NER) automatisiert ermittelt werden.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-ocr">OCR</styled-content></term>
      <def>
        <p>OCR steht für <italic>Optical Character Recognition</italic>
        und bezeichnet die automatische Texterkennung von gedruckten
        Texten, d. h. ein Computer „liest“ ein eingescanntes Dokument,
        erkennt und erfasst den Text darin und generiert daraufhin eine
        elektronische Version.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-open-access">Open
      Access</styled-content></term>
      <def>
        <p>Open Access bezeichnet den freien Zugang zu
        wissenschaftlicher Literatur und anderen Materialien im
        Internet.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-pos">POS</styled-content></term>
      <def>
        <p>PoS steht für <italic>Part of Speech</italic>, oder „Wortart“
        auf Deutsch. Das PoS-
        <xref alt="Tagging" rid="glossary-annotation">Tagging</xref>
        beschreibt die (automatische) Erfassung und Kennzeichnung von
        Wortarten in einem Text und ist of ein wichtiger
        <xref alt="Preprocessing" rid="glossary-preprocessing">Preprocessing</xref>-Schritt,
        beispielsweise für die Analyse von
        <xref alt="Named Entities" rid="glossary-named-entities">Named
        Entities</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-preprocessing">Preprocessing</styled-content></term>
      <def>
        <p>Für viele digitale Methoden müssen die zu analysierenden
        Texte vorab „bereinigt“ oder „vorbereitet“ werden. Für
        statistische Zwecke werden Texte bspw. häufig in gleich große
        Segmente unterteilt (<italic>chunking</italic>), Großbuchstaben
        werden in Kleinbuchstaben verwandelt oder Wörter werden
        <xref alt="lemmatisiert" rid="glossary-lemmatisieren">lemmatisiert</xref>.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-query">Query</styled-content></term>
      <def>
        <p><italic>Query</italic> bedeutet „Abfrage“ oder „Frage“ und
        bezeichnet eine computergestützte Abfrage zur Analyse eines
        Textes. Um Datenbestände zu durchsuchen, werden Abfragesprachen
        eingesetzt, die <italic>Queries</italic> (Anfragen) an den
        Datenbestand senden. So bilden alle möglichen Queries zusammen
        die <italic>Query Language</italic> eines Tools.</p>
      </def>
    </def-item>
    <def-item>
      <term><styled-content id="glossary-type-token">Type/Token</styled-content></term>
      <def>
        <p>Das Begriffspaar „Type/Token“ wird grundsätzlich zur
        Unterscheidung von einzelnen Vorkommnissen (Token) und Typen
        (Types) von Wörtern oder Äußerungen in Texten genutzt. Ein Token
        ist also ein konkretes Exemplar eines bestimmten Typs, während
        ein Typ eine im Prinzip unbegrenzte Menge von Exemplaren (Token)
        umfasst.
        Es gibt allerdings etwas divergierende Definitionen zur
        Type-Token-Unterscheidung. Eine präzise Definition ist daher
        immer erstrebenswert. Der Satz „Ein Bär ist ein Bär.“ beinhaltet
        beispielsweise fünf Worttoken („Ein“, „Bär“, „ist“, „ein“,
        „Bär“) und drei Types, nämlich: „ein“, „Bär“, „ist“. Allerdings
        könnten auch vier Types, „Ein“, „ein“, „Bär“ und „ist“, als
        solche identifiziert werden, wenn Großbuchstaben beachtet
        werden.</p>
      </def>
    </def-item>
  </def-list>
</sec>
</body>
<back>
<ref-list>
  <title>Bibliographie</title>
  <ref id="ref-landeckPrimarliteraturImInternet2000">
    <mixed-citation>Landeck, Nadine und Susanne Starnes. 2000.
    Primärliteratur im Internet. In: <italic>Literaturwissenschaft
    online – offline: Primärliteratur im Internet, elektronische
    Editionen und Hybrideditionen, Lern- und Literatur-CD-ROMs.
    Überblick und Sammelrezension</italic>, hg. von Alexandra
    Hildebrandt, Nadine Landeck, Ursula Rautenberg, und Susanne Starnes.
    <ext-link ext-link-type="uri" xlink:href="http://iasl.uni-muenchen.de/discuss/lisforen/erlangen.htm#Kap21">http://iasl.uni-muenchen.de/discuss/lisforen/erlangen.htm#Kap21</ext-link>.</mixed-citation>
  </ref>
</ref-list>
</back>
</article>
