tekom - Tagungen

Die Referent:innen

Entdecken Sie Gesichter und Geschichten

Dr. Hans Weber

  • Portamis Software GmbH
  • Nürnberg

Vita

Hans Weber, Linguist und Informatiker, wurde 1963 geboren in Frankfurt am Main, promovierte in Hamburg und lebt heute in Nürnberg. Neben Deutsch, Englisch, Portugiesisch und Französisch sind seine Sprachen Java, XSLT und Python. Die Anwendungen sind immer XML, Text-Content und Dokumente. Hans Weber hat Führungserfahrung in kleinen bis mittleren Entwicklerteams und hat erfolgreich Software für Großindustrie-Anwendungen entwickelt.

Dr. rer.nat Hans Weber hat bis 2001 in der universitären Forschung im Bereich Sprach-KI gearbeitet. Als Linguist und Informatiker war er finanziert durch Projekte des DFKI (Verbmobil u.a.). In dieser Zeit hat er über maschinelles Sprachverstehen in Speech-To-Speech Systemen promoviert am Labor für KI der Informatik der Uni Hamburg bei Prof. Walther von Hahn. Schwerpunkt der letzten Jahre waren Sprachmodelle, Textklassifikation und Grammar Learning. Anwendungen waren dabei u.a. E-Mail -Klassifikation, intelligente Rechtschreibekorrekturen, Grammatiklernen.

Seit 2003 beschäftigte sich Hans Weber mit XML und Document Engineering. Innerhalb der 2003 gegründeten Firma portamis Software GmbH wurden eine Layout-Engine entwickelt (XML to PDF), die bei Roche, Siemens, Philips und anderen Firmen bis heute eingesetzt wird, um autonom Massendokumente aus Text-Content zu erzeugen. Der Anteil der intelligenten Content-Manipulation bis hin zu automatischem Tagging gerät dabei in der jüngeren Zeit immer mehr in den Vordergrund

In den letzte Jahren entwickelte Hans Weber mit seinem Team mehrere Lösungen für schwierige Dokumentenanalyse (z.B. Rechnungen zu XML Content) mit der Kombination von XML Technologie, Parsing und Klassifikationsverfahren aus der Sprach-KI werden z.B. fehlerhafte Daten in Contents gefunden. Aktuelle Entwicklungen betreffen Dokumenten-Clustering mit inkrementell lernenden Text-Classifiern für die automatische Content-Übernahme aus Altdokumenten und ähnliche Sprach-KI Anwendungen, bei denen nur spärliche Trainingsdaten vorliegen.