Technologie trifft Wissenschaft

curryAPI bietet zahlreiche Dienste zur Verarbeitung natürlicher Sprache in Texten (Natural Language Processing). Anders als die meisten anderen Anbieter, die sich auf statistische Verfahren konzentrieren, vereint curryAPI.com statistische Verfahren mit der Nutzung der umfangreichen TopicZoom Ontologie. Während statistische Verfahren lediglich Begriffe extrahieren, die wörtlich im Text vorkommen, ermöglicht TopicZoom auch eine direkte thematische Indexierung sowie eine thematische Ähnlichkeitssuche. Die Ontologie, im Prinzip ein umfangreiches Themennetz, stellt dabei die Grundlage in Form eines "expliziten Weltwissens" bereit.

Die Kombination beider Verfahren ermöglicht deutlich bessere Ergebnisse und bildet die optimale Grundlage für semantische Suchsysteme, semantische Empfehlungssysteme und zahlreiche weitere Anwendungen.

Neben der automatischen Verschlagwortung und thematischen Zuordnung bietet curryAPI.com zahlreiche weitere Services zur Erstellung, Optimierung und Auslieferung von Content.

 

Statistisch, mathematische Verfahren PLUS umfangreiche, hierarchische Ontologie

curryAPI bietet zahlreiche Dienste zur Verarbeitung natürlicher Sprache in Texten (Natural Language Processing) sowie zahlreiche weitere API-basierte Services für die Digitaliseriung und Automatisierung von Unternehmens- und Content-Prozessen. Anders als andere Anbieter, die sich auf statistische Verfahren konzentrieren, bietet curryAPI.com als einziger Webservice-Anbieter die Möglichkeit, mathematisch-statistische Verfahren mit einer umfangreichen, hierarchischen Ontologie zu kombinieren.

 

Wissenschaftlicher Hintergrund

Die genutzte Hintergrund-Ontologie stellt die Grundlage für sehr detaillierte Textanalysen dar. Entwickelt, gepflegt und bereitgestellt wird die Ontologie durch unseren Technologiepartner TopicZoom GmbH. Die durch TopicZoom entwickelten Verfahren beruhen auf langjähriger Forschung am Centrum für Informations- und Sprachverarbeitung der Ludwig-Maximilians-Universität München und Ihrer Forschungspartner im In- und Ausland.

 

Vorteile gegenüber rein statistischen Verfahren

Während statistische Verfahren lediglich Begriffe extrahieren, die wörtlich im Text vorkommen, ermöglicht die Ontologie auch eine direkte thematische Indexierung sowie eine thematische Ähnlichkeitssuche.

Ein wichtiger Vorteil in diesem Zusammenhang ist die Verwendung standardisierter Themenbezeichner. Für zehntausende Themen, Personen, Orte, Organisationen, Werke und vieles mehr sind sogenannte Vorzugsbezeichner festgelegt, die als extrahierte Begriffe verwendet werden. Zudem sind für fast alle Themen zahlreiche Varianten und Synonyme hinterlegt, die eine noch exaktere Erkennung ermöglichen.
Im Gegensatz zu statistischen Verfahren bietet dies den Vorteil, dass nicht nur im Text vorkommende Wörter extrahiert werden, sondern auch Zusammenhänge, Ähnlichkeiten und Gemeinsamkeiten zwischen Themen erkannt werden können. Zudem bietet die Ontologie eine zeitliche und geographische Einordnung mit der sich Texte - über generelle Themen hinaus - auch Perioden oder Regionen zuordnen lassen. So lässt sich zum Beispiel die Ähnlichkeit von Texten auch bei unterschiedlichsten Vokabular erkennen und auch im Text nicht genannte Oberkategorien lassen sich extrahieren. Die Vielzahl an verfübarer Kennzahlen ermöglicht es, für verschiedenste Anwendungsfälle das beste Ergebnis zu generieren - egal ob eher allgemeine Oberkategorien oder granularste Themengebiete gefiltert werden sollen.

Über sogenannte Typenbezeichner lassen sich Texte zudem wichtigen Entitäten wie Regionen, Orten, Personen, Organisationen uvm. zuordnen. Dies erlaubt sowohl die Extrahierung entsprechender Begriffe (z.B. München, Angela Merkel, ....) wie auch das Filtern nach Texten, die die gleichen Entitäten betreffen.

Die Kombination von TopicZoom mit statistischen Verfahren ergibt somit deutlich bessere Ergebnisse als rein statistische Berechnungen und ist eine ideale Grundlage für semantische Suchsysteme, semantische Empfehlungssysteme und zahlreiche weitere Anwendungen.

Interessiert, welchen Beitrag wir für Ihre digitale Transformation leisten können?

Rufen Sie uns unverbindlich an! +49 (0)89-54844-487