Verfahren
Die Lösung durch Web-Select gliedert sich in einen Visual Design Prozess und einen
Extraktions- und Transformationsprozess. Der Web-Select Anwender (Human Wrapper
Designer) definiert mittels grafischer Benutzeroberfläche (User Interface Modul)
ein Projekt (Wrapper Programm) durch folgende Arbeitsschritte:
| o |
Eingabe des Namens des zu generierenden Projekts (Wrapper-Programm) |
| o |
Eingabe des Navigationspfades zu den relevanten Web-Seiten |
| o |
Markierung der zu selektierenden Daten |
| o |
Festlegung der Filterregeln für die Daten-Selektion |
| o |
Test der Filterregeln |
| o |
Definition der Struktur des Ausgabe-Dokuments |
| o |
Zuordnung der zu selektierenden Daten zu den Elementen der Ausgabestruktur |
| o |
Selektion der Daten |
| o |
Speicherung des generierten Projekts (Wrapper-Programm) im Projektfile |
Nach Eingabe des Projektnames und der Start-URL werden die auszuführenden Links (Suchabfragen,
Log-In-Vorgänge, etc.), um zu den gewünschten Informationen zu gelangen sowie
der Selektionsvorgang aufgezeichnet und als Projekt gespeichert.
Diese Tätigkeit erfolgt über eine grafische Benutzeroberfläche, in der diese einzelnen
Schritte im Browser einmalig ausgeführt werden müssen.
Alle diese für die spätere automatisierte Durchführung erforderlichen Arbeitsschritte
werden in einer Extraktions-Knowledgebase zusammengefasst und in einem Projektfile
gespeichert. Das fertige Projekt kann dann jederzeit auf Knopfdruck neu gestartet und
durchgeführt werden, um automatisiert eine aktuelle Ausgabe zu generieren.
Bei jeder Durchführung werden die im Projektfile gespeicherten
Arbeitsschritte vom Wrapper Evaluator eingelesen, interpretiert und
ausgeführt. Im Falle einer Navigation wird die Seite angefordert, im
Falle einer Extraktion werden die Daten mit Hilfe von Extraktionsregeln
und auf Basis des definierten XML-Schemas selektiert und den Ausgabeelementen
zugeordnet. Zusätzlich werden automatisch Stylesheets für die spätere
Transformation der extrahierten Daten in CSV- oder HTML-Format generiert
(siehe Abbildung 3).
Das jeweilige Projekt kann bei Bedarf auch zeitgesteuert im Rahmen der Web-Select
Batchverarbeitung beliebig oft wiederholt werden, um immer wieder aktuelle Daten
zu generieren. Diese können dann per e-mail oder SMS an einen oder mehrere Mitarbeiter
verteilt (z.B. täglich aktuelle Einkaufspreise, Kurse, Zinsen, Mitbewerbsdaten,...)
oder zur Weiterverarbeitung in andere Applikationen integriert werden
(z.B. MS-Excel, -Access, -SQL und Web-Portale).

Abbildung 3
Weiterführende Informationen zur Funktionsweise von Web-Select finden Sie im
Technical White Paper auf unserer
Download-Seite.
|