SCANALU: I'm sorry, Dave

Natürlich verstehen Computer die menschlichen Sprachen und können sich mühelos mit uns auf Englisch, Deutsch oder Missingsch unterhalten -- im Kino. In der Realität sieht es etwas anders aus.

In Pocket speichern vorlesen Druckansicht 93 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Detlef Borchers

Natürlich verstehen Computer die menschlichen Sprachen und können sich mühelos mit uns auf Englisch, Deutsch oder Missingsch unterhalten -- im Kino. In der Realität sieht es etwas anders aus. Computer sprechen nicht oder nur in eng definierten Sprechsituationen wie der einer Fahrplanauskunft.

Wissenschaftler, die dem Computer das Sprechen beibringen wollen, stehen ganz am Anfang ihrer Forschung. Für sie gilt der Satz aus Kubricks "Odyssee im Weltraum", mit dem der finale Kampf zwischen dem flüssig sprechenden HAL 9000 und Dave Baumann beginnt: "I'm sorry, Dave, I don't have enough information." Zwei Tage lang diskutierten Informatiker und Computerlinguistiker am European Media Laboratory in Heidelberg Forschungsprobleme im Rahmen des 1. Internationalen SCANALU-Workshops.

SCANALU steht für Scalable Natural Language Understanding und erinnert im Akronym an das sagenhafte Hypertext-Xanadu der Verquickung aller existierenden Texte. Rund 30 Wissenschaftler aus Europa und den USA kamen zusammen, um eine gemeinsame Basis zu finden, auf der die vielfach zersplitterten Ansätze der Forscher voneinander profitieren können. Am Ende steht die Hoffnung, "dass wir Menschen bald doch ganz intuitiv mit Computern und technischen Geräten umgehen können -- weil sie dann gelernt haben, uns zu verstehen," so die Pressemitteilung zur Veranstaltung.

"Unser Workshop zum Sprachverstehen hat das Ziel, eine Synthese der sehr unterschiedlichen Ansätze vorzubereiten", erklärte Michael Strube, einer der Organisatoren des Workshops, gegenüber heise online. "Wir suchen nach Wegen, das Verstehen von Sprache zu skalieren, nach Methoden, das Wissen über eine erforschte Situation auf große Datenmengen zu übertragen." Zwei Verfahrenswege haben das Lager der Wissenschaftler in zwei große Felder getrennt, die mit den Stichworten regelbasierte und statistische Analysen umschreiben kann. Beim regelbasierten Ansatz versucht man, dem Computer möglichst viele Regeln zu Sprechsituationen beizubringen, nicht unähnlich der Entwicklung von Schachprogrammen. Beim statistischen Ansatz geht es darum, dass der Computer Muster im Sprachverhalten erkennen lernt und ähnlich der Wettervorhersage mit Wahrscheinlichkeitsrechnungen die Sprache erschließt.

Eine Vermittlung beider Strömungen erscheint unumgänglich, da die wissenschaftlichen Ressourcen begrenzt sind. Dies mag das abgeschlossene Großforschungsprojekt Verbmobil verdeutlichen, das 900 Mitarbeiter beschäftigte und insgesamt 85,1 Millionen Euro gekostet hat. Die in Heidelberg versammelten Forscher äußerten die Hoffnung auf eine Evolution ihrer Wissenschaft hin zu einem "tiefen" Sprachverstehen der Computer. Freilich gab es auch pragmatische Stimmen, die das Verstehen durch den Computer in einfachen, begrenzten Situationen für ausreichend erklärten. "Hal wird uns niemals verstehen", erklärte der Computerlinguist Roger Schank bereits im Jahre 1997 zum Geburtstag des mythischen Computers, "wir werden keinen HAL bauen, sondern lokale Experten, etwa einen Computer mit dem man über Kunst reden kann, der aber von Geschichte keine Ahnung hat." (Detlef Borchers) / (jk)