Web-Select.com
      Über uns   |   News & Presse   |   Kontakt   |   AGB  
Web-Select
 Wrapper Technologie
 Verfahren

Verfahren

Die Lösung durch Web-Select gliedert sich in einen Visual Design Prozess und einen Extraktions- und Transformationsprozess. Der Web-Select Anwender (Human Wrapper Designer) definiert mittels grafischer Benutzeroberfläche (User Interface Modul) ein Projekt (Wrapper Programm) durch folgende Arbeitsschritte:

o Eingabe des Namens des zu generierenden Projekts (Wrapper-Programm)
o Eingabe des Navigationspfades zu den relevanten Web-Seiten
o Markierung der zu selektierenden Daten
o Festlegung der Filterregeln für die Daten-Selektion
o Test der Filterregeln
o Definition der Struktur des Ausgabe-Dokuments
o Zuordnung der zu selektierenden Daten zu den Elementen der Ausgabestruktur
o Selektion der Daten
o Speicherung des generierten Projekts (Wrapper-Programm) im Projektfile

Nach Eingabe des Projektnames und der Start-URL werden die auszuführenden Links (Suchabfragen, Log-In-Vorgänge, etc.), um zu den gewünschten Informationen zu gelangen sowie der Selektionsvorgang aufgezeichnet und als Projekt gespeichert. Diese Tätigkeit erfolgt über eine grafische Benutzeroberfläche, in der diese einzelnen Schritte im Browser einmalig ausgeführt werden müssen. Alle diese für die spätere automatisierte Durchführung erforderlichen Arbeitsschritte werden in einer Extraktions-Knowledgebase zusammengefasst und in einem Projektfile gespeichert. Das fertige Projekt kann dann jederzeit auf Knopfdruck neu gestartet und durchgeführt werden, um automatisiert eine aktuelle Ausgabe zu generieren.

Bei jeder Durchführung werden die im Projektfile gespeicherten Arbeitsschritte vom Wrapper Evaluator eingelesen, interpretiert und ausgeführt. Im Falle einer Navigation wird die Seite angefordert, im Falle einer Extraktion werden die Daten mit Hilfe von Extraktionsregeln und auf Basis des definierten XML-Schemas selektiert und den Ausgabeelementen zugeordnet. Zusätzlich werden automatisch Stylesheets für die spätere Transformation der extrahierten Daten in CSV- oder HTML-Format generiert (siehe Abbildung 3).

Das jeweilige Projekt kann bei Bedarf auch zeitgesteuert im Rahmen der Web-Select Batchverarbeitung beliebig oft wiederholt werden, um immer wieder aktuelle Daten zu generieren. Diese können dann per e-mail oder SMS an einen oder mehrere Mitarbeiter verteilt (z.B. täglich aktuelle Einkaufspreise, Kurse, Zinsen, Mitbewerbsdaten,...) oder zur Weiterverarbeitung in andere Applikationen integriert werden (z.B. MS-Excel, -Access, -SQL und Web-Portale).



Abbildung 3

Weiterführende Informationen zur Funktionsweise von Web-Select finden Sie im Technical White Paper auf unserer Download-Seite.



Seitenanfang