Das Suchergebnis hat sich seit Ihrer Suchanfrage verändert. Eventuell werden Dokumente in anderer Reihenfolge angezeigt.
  • Treffer 58 von 2569
Zurück zur Trefferliste

A keyquery-based classification system for CORE

  • We apply keyquery-based taxonomy composition to compute a classification system for the CORE dataset, a shared crawl of about 850,000 scientific papers. Keyquery-based taxonomy composition can be understood as a two-phase hierarchical document clustering technique that utilizes search queries as cluster labels: In a first phase, the document collection is indexed by a reference search engine, andWe apply keyquery-based taxonomy composition to compute a classification system for the CORE dataset, a shared crawl of about 850,000 scientific papers. Keyquery-based taxonomy composition can be understood as a two-phase hierarchical document clustering technique that utilizes search queries as cluster labels: In a first phase, the document collection is indexed by a reference search engine, and the documents are tagged with the search queries they are relevant—for their so-called keyqueries. In a second phase, a hierarchical clustering is formed from the keyqueries within an iterative process. We use the explicit topic model ESA as document retrieval model in order to index the CORE dataset in the reference search engine. Under the ESA retrieval model, documents are represented as vectors of similarities to Wikipedia articles; a methodology proven to be advantageous for text categorization tasks. Our paper presents the generated taxonomy and reports on quantitative properties such as document coverage and processing requirements.zeige mehrzeige weniger

Volltext Dateien herunterladen

  • Volltexteng
    (435KB)

    Manuskriptfassung, Zweitveröffentlichung

Metadaten exportieren

Weitere Dienste

Teilen auf Twitter Suche bei Google Scholar
Metadaten
Dokumentart:Artikel (Wissenschaftlicher)
Verfasserangaben: Michael Völske, Tim GollubORCiDGND, Matthias HagenGND, Benno SteinORCiDGND
DOI (Zitierlink):https://doi.org/10.1045/november14-voelskeZitierlink
URN (Zitierlink):https://nbn-resolving.org/urn:nbn:de:gbv:wim2-20170426-31662Zitierlink
Titel des übergeordneten Werkes (Englisch):D-Lib Magazine
Sprache:Englisch
Datum der Veröffentlichung (online):26.04.2017
Jahr der Erstveröffentlichung:2014
Datum der Freischaltung:26.04.2017
Veröffentlichende Institution:Bauhaus-Universität Weimar
Institute und Partnereinrichtugen:Bauhaus-Universität Weimar / In Zusammenarbeit mit der Bauhaus-Universität Weimar
Freies Schlagwort / Tag:Dynamic Taxonomy Composition, Keyquery, Classification Systems, Reverted Index, Big Data Problem
GND-Schlagwort:Massendaten; Taxonomie
DDC-Klassifikation:000 Informatik, Informationswissenschaft, allgemeine Werke / 000 Informatik, Wissen, Systeme
BKL-Klassifikation:54 Informatik / 54.82 Textverarbeitung
Lizenz (Deutsch):License Logo Zweitveröffentlichung