Abstract: Mit C<Web::Scraper> hat Tatsuhiko Miyagawa ein Modul
zum Auslesen von Daten aus Webseiten geschrieben. Die API
ist inspiriert von Ruby's "Scrapi" Modul.
Mit C<Web::Scraper> lassen sich die Elemente innerhalb einer HTML-Seite
auf verschiedene Weisen beschreiben - als XPath Ausdruck oder als
CSS Selektor. Anhand von Beispielen zeige ich die Verwendung von
C<Web::Scraper> zum Erzeugen eines RSS Feeds für Webseiten
und
Features, wie die transparente Verwendung von Browsercookies und
die eingebaute Shell.
Der Vortrag ist auf 20 Minuten ausgelegt, läßt sich aber
gegebenenfalls
ausdehnen.