Web Scraping mit intelligenter Datenanalyse

post-image

Zwar beinhaltet das Internet sehr hilfreiche und vielfältige frei zugängliche Informationen, doch liegen diese häufig verteilt und in einem für die aktuelle Fragestellung ungeeigneten Format vor.

Die dwh GmbH hat hier nicht nur automatisierte Auslesemethoden für Tausende Webunterseiten und Analysetools für xml-Files entwickelt, sondern nutzt auch neueste Erkenntnisse aus dem Natural Language Processing, um textliche Informationen gezielt auszulesen.

Auf diese Art erfolgte etwa eine Redezeitanalyse österreichischer Politiker im Parlament, aber auch Fragestellungen wie “In welchem österreichischen Bezirk haben pro Einwohner die meisten Allgemeinärzte ihre Ordination am Freitagnachmittag geöffnet?” können beantwortet werden.