Google ontwikkelt indrukwekkende speech AI

Peter Güldenpfennig
Een van de voornaamste bedrijven die praktische toepassingen ontwikkelen op het vlak van AI en deep learning is Google. Dat onderstrepen ze nogmaals met een indrukwekkend stuk technologie waarmee een stem herkend en geïsoleerd wordt vanuit meerdere stemmen.

Beeld: Google

Met het project ‘Looking to Listen at the Cocktail Party’ is het mogelijk om een persoon in een video te selecteren en de stem van deze persoon te isoleren.

Hoewel het niet heel spannend klinkt is de praktische kant van deze technologie wel degelijk indrukwekkend. Zo wordt het bijvoorbeeld mogelijk om specifiek geluid te verbeteren of om deze technologie in te zetten in unified communications-oplossingen.

 

Looking to Listen at the Cocktail Party

De ontwikkeling van deze technologie loopt parallel met reaserch die gedaan wordt aan UC Berkely en MIT. Momenteel onderzoekt Google hoe ze deze technologie in hun eigen producten kunnen integreren. Tevens moet het in de toekomst mogelijk worden dat de technologie gekoppeld wordt aan applicaties van derden, zoals de eerder genoemde UC-oplossingen. 

afbeelding van Peter Güldenpfennig

Peter Güldenpfennig | Redacteur

Peter Güldenpfennig is vaste redacteur voor WINMAG Pro. Hij schrijft nieuws, analyses en achtergrondverhalen over mobility, gadgets, internet en software. Zijn interesses liggen bij sociaal-culturele aspecten van ICT in het algemeen, en gaming in het bijzonder.

Bekijk alle artikelen van Peter