
<TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:h="http://www.w3.org/1999/xhtml" xmlns:t="http://www.tei-c.org/ns/1.0">
  <teiHeader xml:lang="de">
    <fileDesc>
      <titleStmt>
        <title type="main">Named Entity Recognition (NER)</title>
        <author>
          <persName>
            <forename>Elisabeth</forename>
            <surname>Eder</surname>
          </persName>
        </author>
        <respStmt>
          <resp>Projektleitung</resp>
          <persName>
            <forename>Helmut W.</forename>
            <surname>Klug</surname>
          </persName>
        </respStmt>
        <respStmt>
          <resp>Datenmodellierung</resp>
          <persName>
            <forename>Selina</forename>
            <surname>Galka</surname>
          </persName>
        </respStmt>
        <respStmt>
          <resp>Datenmodellierung</resp>
          <persName>
            <forename>Elisabeth</forename>
            <surname>Steiner</surname>
          </persName>
        </respStmt>
        <funder>Bundesministerium für Wissenschaft, Forschung und Wirtschaft
                    </funder>
      </titleStmt>
      <publicationStmt>
        <publisher>
          <orgName corresp="https://informationsmodellierung.uni-graz.at" ref="http://d-nb.info/gnd/1137284463">Zentrum für
                        Informationsmodellierung - Austrian Centre for Digital Humanities,
                        Karl-Franzens-Universität Graz</orgName>
          <country>Austria</country>
        </publisher>
        <authority>
          <orgName corresp="https://informationsmodellierung.uni-graz.at" ref="http://d-nb.info/gnd/1137284463">Zentrum für
                        Informationsmodellierung - Austrian Centre for Digital Humanities,
                        Karl-Franzens-Universität Graz</orgName>
          <country>Austria</country>
        </authority>
        <distributor>
          <orgName ref="https://gams.uni-graz.at">GAMS - Geisteswissenschaftliches
                        Asset Management System</orgName>
        </distributor>
        <availability>
          <licence target="https://creativecommons.org/licenses/by-nc/4.0">Creative Commons
                            BY 4.0</licence>
        </availability>
        <date when="2021">2021</date>
        <pubPlace>Graz</pubPlace>
        <idno type="PID">o:konde.141</idno>
      </publicationStmt>
      <seriesStmt>
        <title ref="http://gams.uni-graz.at/konde">KONDE Weißbuch</title>
        <respStmt>
          <resp>Projektleitung</resp>
          <persName>
            <forename>Helmut W.</forename>
            <surname>Klug</surname>
          </persName>
        </respStmt>
      </seriesStmt>
      <sourceDesc>
        <bibl>
          <title>Weißbuchartikel: Named Entity Recognition (NER)</title>
          <author>Elisabeth Eder</author>
          <publisher>Herausgegeben von Helmut W. Klug unter Mitarbeit von Selina Galka und Elisabeth Steiner</publisher>
          <date>2021</date>
          <country>Austria</country>
        </bibl>
      </sourceDesc>
    </fileDesc>
    <encodingDesc>
      <projectDesc>
        <ab>
          <ref target="info:fedora/context:konde" type="context">KONDE Weißbuch</ref>
        </ab>
        <p>Im KONDE-Projekt, das aus Hochschulraumstrukturmitteln finanziert wird,
                        beschäftigten sich sieben universitäre Partner und drei weitere
                        Einrichtungen aus unterschiedlichen Blickwinkeln mit theoretischen und
                        praktischen Aspekten der Digitalen Edition. Ein Outcome des Projektes
                        stellt das Weißbuch dar, welches über 200 Artikel zum Thema Digitale
                        Edition umfasst. Die behandelten Themenkomplexe reichen dabei über
                        Digitale Editionswissenschaft im Allgemeinen, Annotation und
                        Modellierung, Interfaces, Archivierung und Metadaten bis hin zu
                        rechtlichen Aspekten.</p>
      </projectDesc>
    </encodingDesc>
    <profileDesc>
      <langUsage>
        <language ident="de">Deutsch</language>
      </langUsage>
    </profileDesc>
  </teiHeader>
  <text xml:lang="de">
    <body>
      <div>
        <head>Named Entity Recognition (NER)</head>
        <div>
          <head>Eder, Elisabeth; elisabeth.eder@aau.at </head>
          <p>
            <hi rend="italic">Named Entity Recognition</hi> (NER) bezeichnet die Erkennung von Eigennamen (<hi rend="italic">named entities</hi>) in Texten sowie auch deren Klassifizierung in verschiedene Entitätstypen. In den meisten Fällen wird <hi rend="italic">Named Entity Recognition</hi> als <hi rend="italic">Sequence Tagging-</hi> oder <hi rend="italic">Sequence Labeling</hi>-Aufgabe aufgefasst, bei der jedem Token einer Sequenz eine bestimmte Kategorie bzw. ein bestimmter Entitätstyp zugewiesen wird (siehe auch <hi rend="italic">
              <ref target="/o:konde.156" type="internal">Part-of-Speech-Tagging</ref>
            </hi>). Standardmäßig zählen Personen, Orte und Organisationen zu diesen Entitätstypen. Je nach Anwendungsfall werden aber auch andere Kategorien, wie zum Beispiel kommerzielle Produktnamen, Werktitel oder Fahrzeuge, berücksichtigt. <bibl>(Jurafsky/Martin 2009, S. 761–768)</bibl> Im Deutschen können auch Derivative (z  B. ‘österreichisch’) und partielle Entitäten, die nur einen Teil eines Token betreffen (z. B. KONDE-Beitrag), eine Rolle spielen und dementsprechende Unterkategorien bilden. <bibl>(Benikova et al. 2014)</bibl>
            <hi rend="italic">Named Entity Recognition</hi> ist in vielen <hi rend="italic">Libraries</hi> für NLP implementiert, z. B. <hi rend="italic">
              <ref target="/o:konde.170" type="internal">spaCy</ref>
            </hi> oder <hi rend="italic">Natural Language Toolkit</hi> (nltk), und auch <hi rend="italic">
              <ref target="/o:konde.212" type="internal">WebLicht</ref>
            </hi> bietet Tools dafür an.</p>
          <div type="literature">
            <listBibl>
              <biblStruct corresp="http://zotero.org/groups/1332658/items/QF8Q6MZT" type="conferencePaper" xml:id="Akbik2018">
                <analytic>
                  <title level="a">Contextual String Embeddings for Sequence Labeling</title>
                  <author>
                    <forename>Alan</forename>
                    <surname>Akbik</surname>
                  </author>
                  <author>
                    <forename>Duncan</forename>
                    <surname>Blythe</surname>
                  </author>
                  <author>
                    <forename>Roland</forename>
                    <surname>Vollgraf</surname>
                  </author>
                </analytic>
                <monogr>
                  <title level="m">Proceedings of the 27th International Conference on Computational Linguistics</title>
                  <title type="conferenceName">COLING</title>
                  <imprint>
                    <pubPlace>Santa Fe, New Mexico, USA</pubPlace>
                    <biblScope unit="page">1638–1649</biblScope>
                    <publisher>Association for Computational Linguistics</publisher>
                    <date>2018</date>
                    <note type="url">https://www.aclweb.org/anthology/C18-1139</note>
                  </imprint>
                </monogr>
              </biblStruct>
              <biblStruct corresp="http://zotero.org/groups/1332658/items/9AC4K3X3" type="conferencePaper" xml:id="Benikova2014">
                <analytic>
                  <title level="a">NoSta-D Named Entity Annotation for German: Guidelines and Dataset</title>
                  <author>
                    <forename>Darina</forename>
                    <surname>Benikova</surname>
                  </author>
                  <author>
                    <forename>Chris</forename>
                    <surname>Biemann</surname>
                  </author>
                  <author>
                    <forename>Marc</forename>
                    <surname>Reznicek</surname>
                  </author>
                </analytic>
                <monogr>
                  <title level="m">Proceedings of 9th International Conference on Language Resources and Evaluation (LREC &apos;14)</title>
                  <title type="conferenceName">LREC</title>
                  <imprint>
                    <pubPlace>Reykjavik, Iceland</pubPlace>
                    <biblScope unit="page">2524–2531</biblScope>
                    <publisher>European Language Resources Association (ELRA)</publisher>
                    <date>2014</date>
                    <note type="url">http://www.lrec-conf.org/proceedings/lrec2014/pdf/276_Paper.pdf</note>
                  </imprint>
                </monogr>
              </biblStruct>
              <biblStruct corresp="http://zotero.org/groups/1332658/items/9XEIZKFX" type="conferencePaper" xml:id="Benikova2015">
                <analytic>
                  <title level="a">GermaNER: Free Open German Named Entity Recognition Tool</title>
                  <author>
                    <forename>Darina</forename>
                    <surname>Benikova</surname>
                  </author>
                  <author>
                    <forename>Seid Muhie</forename>
                    <surname>Yimam</surname>
                  </author>
                  <author>
                    <forename>Prabhakaran</forename>
                    <surname>Santhanam</surname>
                  </author>
                  <author>
                    <forename>Chris</forename>
                    <surname>Biemann</surname>
                  </author>
                </analytic>
                <monogr>
                  <title level="m">Proceedings of the International Conference of the German Society for Computational Linguistics and Language Technology</title>
                  <title type="conferenceName">GSCL</title>
                  <imprint>
                    <date>2015</date>
                    <note type="url">https://pdfs.semanticscholar.org/b250/3144ed2152830f6c64a9f797ab3c5a34fee5.pdf</note>
                  </imprint>
                </monogr>
              </biblStruct>
              <biblStruct corresp="http://zotero.org/groups/1332658/items/85NVFE59" type="conferencePaper" xml:id="Dernoncourt2017">
                <analytic>
                  <title level="a">NeuroNER: an easy-to-use program for named-entity recognition based on neural networks</title>
                  <idno type="DOI">10.18653/v1/D17-2017</idno>
                  <author>
                    <forename>Franck</forename>
                    <surname>Dernoncourt</surname>
                  </author>
                  <author>
                    <forename>Ji Young</forename>
                    <surname>Lee</surname>
                  </author>
                  <author>
                    <forename>Peter</forename>
                    <surname>Szolovits</surname>
                  </author>
                </analytic>
                <monogr>
                  <title level="m">Proceedings of the 2017 Conference on Empirical Methods in Natural Language Processing: System Demonstrations</title>
                  <title type="conferenceName">EMNLP</title>
                  <imprint>
                    <pubPlace>Copenhagen, Denmark</pubPlace>
                    <biblScope unit="page">97–102</biblScope>
                    <publisher>Association for Computational Linguistics</publisher>
                    <date>2017</date>
                    <note type="url">https://www.aclweb.org/anthology/D17-2017</note>
                  </imprint>
                </monogr>
              </biblStruct>
              <biblStruct corresp="http://zotero.org/groups/1332658/items/88XA6ZPZ" type="book" xml:id="Jurafsky2009">
                <monogr>
                  <title level="m">Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition</title>
                  <idno type="ISBN">978-0-13-187321-6</idno>
                  <author>
                    <forename>Daniel</forename>
                    <surname>Jurafsky</surname>
                  </author>
                  <author>
                    <forename>James H.</forename>
                    <surname>Martin</surname>
                  </author>
                  <edition>2</edition>
                  <imprint>
                    <pubPlace>Upper Saddle River, New Jersey, United States of America</pubPlace>
                    <publisher>Pearson Education</publisher>
                    <date>2009</date>
                  </imprint>
                </monogr>
              </biblStruct>
              <biblStruct corresp="http://zotero.org/groups/1332658/items/4KABC7KJ" type="conferencePaper" xml:id="Riedl2018">
                <analytic>
                  <title level="a">A Named Entity Recognition Shootout for German</title>
                  <idno type="DOI">10.18653/v1/P18-2020</idno>
                  <author>
                    <forename>Martin</forename>
                    <surname>Riedl</surname>
                  </author>
                  <author>
                    <forename>Sebastian</forename>
                    <surname>Padó</surname>
                  </author>
                </analytic>
                <monogr>
                  <title level="m">Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics (Volume 2: Short Papers)</title>
                  <title type="conferenceName">ACL</title>
                  <imprint>
                    <pubPlace>Melbourne, Australia</pubPlace>
                    <biblScope unit="page">120–125</biblScope>
                    <publisher>Association for Computational Linguistics</publisher>
                    <date>2018</date>
                    <note type="url">https://www.aclweb.org/anthology/P18-2020</note>
                  </imprint>
                </monogr>
              </biblStruct>
            </listBibl>
          </div>
          <div type="subsection" xml:id="software">
            <list>
              <item>
                <ref target="https://weblicht.sfs.uni-tuebingen.de/weblicht/" type="external">weblicht</ref>
              </item>
              <item>
                <ref target="https://www.nltk.org/" type="external">Natural Language Toolkit (nltk)</ref>
              </item>
              <item>
                <ref target="https://github.com/zalandoresearch/flair" type="external">flair</ref>
              </item>
              <item>
                <ref target="https://www.ims.uni-stuttgart.de/forschung/ressourcen/werkzeuge/german-ner/" type="external">German NER</ref>
              </item>
              <item>
                <ref target="https://github.com/tudarmstadt-lt/GermaNER" type="external">GermaNER</ref>
              </item>
              <item>
                <ref target="http://neuroner.com/" type="external">NeuroNER</ref>
              </item>
            </list>
          </div>
          <div type="subsection" xml:id="links">
            <list>
              <item>
                <ref target="/o:konde.170" type="internal">spaCy</ref>
              </item>
              <item>
                <ref target="/o:konde.212" type="internal">WebLicht</ref>
              </item>
              <item>
                <ref target="/o:konde.156" type="internal">Part-of-Speech-Tagging</ref>
              </item>
              <item>
                <ref target="/o:konde.145" type="internal">NLP</ref>
              </item>
              <item>
                <ref target="/o:konde.176" type="internal">Tagger</ref>
              </item>
            </list>
          </div>
          <div type="subsection" xml:id="projects">
            <list>
              <item>
                <ref target="https://www.nltk.org" type="external">Natural Language Toolkit</ref>
              </item>
            </list>
          </div>
          <div type="subsection" xml:id="topics">
            <list>
              <item>Annotation und Modellierung</item>
              <item>Natural Language Processing</item>
            </list>
          </div>
        </div>
      </div>
    </body>
  </text>
</TEI>
