Web-Select
Web-Select verwendet einen konsequent praxisorientierten Ansatz und
zählt damit zur Klasse der visual wrapper generators. Die Anforderung
definiert klar, welche Informationen von welchen Web-Seiten zu extrahieren
und in welche Ausgabestruktur zu transformieren sind. Dazu werden die
Navigationsschritte, die zu extrahierenden Daten sowie die Zuordnung zur
XML-basierten Ausgabestruktur in eine Extraktionsknowledgebase zusammengefasst,
in einem Projektfile gespeichert und bei der Durchführung des Projekts
interpretiert und ausgeführt. Um die Robustheit gegenüber Änderungen
in der DOM-Struktur der Web-Seite zu erhöhen, wird das Projekt mit einer
integrierten Filterregeltechnologie angepasst. Dies unterscheidet Web-Select
von Wrapper Generatoren, die fertige Programme – in vorwiegend speziell für
diese Aufgabe konzipierten Sprachen - oder JAVA-Klassen generieren.
Zielsetzung von Web-Select ist die automatisierte Extraktion von Informationen aus
dem Internet, die Transformation dieser Daten in ein strukturiertes Format
(z.B. csv, xml, html) sowie die Integration dieser Daten in eigene Geschäftsprozesse.
Web-Select kann branchenunabhängig zur Entwicklung von Lösungen zur Extraktion
und Integration von Daten aus dem Web genutzt werden.
|