Plant Google Sprache durchsuchbar zu machen?

Johannes Beus
Johannes Beus
Johannes Beus ist Gründer und Geschäftsführer von SISTRIX.

Google hat – recht unauffällig – eine ganz interessante Neuerung bei YouTube eingeführt: im Rahmen der US-Präsidentschaftswahlen werden die Reden der Kandidaten auf YouTube künftig nicht nur zu sehen, sonder auch durchsuchbar sein. Durch eine automatisierte Spracherkennung kann man jetzt nicht nur den Titel, sondern die kompletten „Inhalt“ der Reden durchsuchen und direkt zu dieser Stelle im Video springen.

Nachdem Google vor einiger Zeit mit „1-800-GOOG-411“ in den USA eine kostenlose Telefonauskunft gestartet hatte, als deren Ziel bereits das Sammeln einer großem Anzahl an „Sprachsamples“ vermutet wurde, scheint man die Technologie jetzt weiterentwickelt zu haben und nutzt einen kleinen, kontrollierten Bereich von YouTube zur Erprobung. Ich bin gespannt, wie lange es noch dauert, bis Google soweit ist, dass die Spracherkennung auf breiterer Basis zum Einsatz kommt und auch für den Webindex genutzt wird – Möglichkeiten wie Podcasts usw. gibt es ja genug.

Ähnliche Beiträge
Kommentare
Avatar hannes   
21. Juli 2008, 16:53

wow.. Das ist natürlich geil.
Wird aber sicher noch einige Zeit dauern, bis das (vor allem bei der teilweise wirklich schlechten Sprachqualität von Videos) was wird. Selbst bei der Bildersuche hat sich Google ja sehr lange schwer getan, bzw. tut sich noch sehr schwer. Trotzdem – erfinderisch sind die Jungs, das muss man lassen.

Avatar Chris   
21. Juli 2008, 17:52

Also nach meinen 4 Jahren in der Spracherkennungsbranche halte ich das primär für einen PR-Gag. Sprecherunabhängige Spracherkennung ist wesentlich schwieriger und rechenintensiver als das, was man von sprecherabhängiger Diktiersoftware wie Dragon oder ähnlichem kennt. Das ganze funktioniert am Telefon z.B. auch nur, wenn man dem Spracherkenner phonetisch transliterierte „Grammatiken“ (im Prinzip Wortfolge-Wahrscheinlichkeitsmodelle) vorlegt, und diese durch geschickte Gesprächsführung im Möglichkeitsraum sehr eng eingegrenzt sind.

Vermutlich haben die einfach sich mal die Mühe gemacht, so einen sprecherabhängigen Diktier-Erkenner mit Obama und McCain Schnipseln zu füttern. In umfassenden Einsatz wird es da auf absehbare Zeit nicht geben.

Avatar Plissee   
23. Juli 2008, 15:46

Das hat auf jeden Fall Zukunft. Denn es gibt genügen Videos, Podcast und vielleicht sogar Songtexte die durchsucht werden wollen.

Avatar Jörg Dennis Krüger   
23. Juli 2008, 14:23

Die Qualität ist mittemäßig – tatsächlich gibt es sowas aber schon länger. FAST Search & Transfer (gekauft von Microsoft) hat sowas standardmäßig im Portfolio (und ich glaube bei NBC implementiert?). Ich bin mir sicher, dass dies noch ein ganz großes Thema wird und sehr viel Potenzial hat!

Avatar Olaf   
28. Juli 2008, 11:07

Sehr hübsche Idee – also sind demnächst auch Podcasts inhaltlich nicht mehr vor Google sicher. 😉

Die Kommentarfunktion wird 30 Tage nach der Veröffentlichung des Beitrags deaktiviert.