Mehrwortbegriffe
Wie KI den Unterschied macht
Bei der sprachübergreifenden Datenabfrage stellt die Vielfalt der Sprachen in Bezug auf Wortschatz, Grammatik oder Syntax eine große Herausforderung dar. Wie können Begriffe aus verschiedenen Sprachen sinnvoll miteinander in Beziehung gesetzt werden, ohne den Inhalt übersetzen zu müssen? Herkömmliche Suchlösungen verwenden dazu Thesauri oder Synonymlisten, die teilweise aufwändig gepflegt werden müssen, um z.B. Fachbegriffe oder Synonyme zu verknüpfen. Diese manuelle Bearbeitung ist nicht nur zeit- und arbeitsaufwändig, sondern hinkt gerade bei großen, ständig wachsenden Datenbanken immer hinterher. Neue Synonyme kommen hinzu. Begriffe ändern sich.
Wenn man sprachübergreifend in Daten suchen will, kommt die Hürde der unterschiedlichen Sprachsyntax hinzu. Während in der einen Sprache Begriffe eine Kombination aus mehreren Wortstämmen sind, ist in einer anderen Sprache nur aus dem Kontext ersichtlich, dass es sich bei der Wortgruppe um einen Oberbegriff handelt. Im Deutschen setzt sich der Begriff "Zylinderkopfdichtung" aus den Einzelwörtern "Zylinder", "Kopf" und "Dichtung" zusammen, die jeweils für sich genommen eine eigenständige Bedeutung haben. Erst in der Kombination wird deutlich, dass es sich um einen besonderen Begriff handelt. Im Englischen gibt es kaum solche Wortkombinationen und erst aus dem inhaltlichen Kontext wird dem Leser klar, dass die Begriffe "cylinder head gasket" (Zylinderkopfdichtung) unabhängig voneinander keinen Sinn ergeben. Für eine Recherchelösung sind diese syntaktischen Feinheiten eine große Herausforderung, die bei sprachübergreifenden Recherchen noch größer ist.
INTERGATOR Patent Search verwendet speziell trainierte KI-Modelle, die miteinander kompatibel sind. Ohne die Suchbegriffe übersetzen zu müssen, erkennt die künstliche Intelligenz die sprachübergreifende Ähnlichkeit und erkennt, dass das deutsche "Zylinderkopfdichtung" analog zum englischen "cylinder head gasket" ist und listet daher neben den deutschen auch die Patente in anderen Sprachen auf. Die KI verwendet keine gepflegten Listen und Thesauri. Stattdessen nutzt sie die Statistik der künstlichen Intelligenz und ist damit unabhängig von vorgelagerten Übersetzungen. Die Technologie ist auf verschiedene Sprachen anwendbar und INTERGATOR verwendet für jede Sprache ein speziell trainiertes Modell.