xCrawl: a high-recall crawling method for Web mining

Web mining systems exploit the redundancy of data published on the Web to automatically extract information from existing Web documents. The first step in the Information Extraction process is thus to locate as many Web pages as possible that contain relevant information within a limited period of t...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Knowledge and information systems Jg. 25; H. 2; S. 303 - 326
Hauptverfasser: Shchekotykhin, Kostyantyn, Jannach, Dietmar, Friedrich, Gerhard
Format: Journal Article
Sprache:Englisch
Veröffentlicht: London Springer-Verlag 01.11.2010
Springer
Springer Nature B.V
Schlagworte:
ISSN:0219-1377, 0219-3116
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!