Twentse promovendus ontwikkelt robuuste spraakherkenning

Promovendus Marijn Huijbregts van de Universiteit Twente zegt resultaten te hebben geboekt met audio- en videobestanden die een spraakherkenner vooraf helemaal niet kent. SHoUT (Spraak Herkenningsonderzoek Universiteit Twente) weet onderscheid aan te brengen tussen spraak en andere geluiden. Achtergrondmuziek en spraak worden gescheiden.

De tweede stap is het identificeren van de verschillende sprekers. “Dat lukt aardig,” zegt Huijbregts tegen Webwereld. “Niet alleen kun je vrouwen- en mannenstemmen onderscheiden, maar ook mannen- en vrouwenstemmen onderling. Met name bij het automatisch notuleren van vergaderingen zou dat van pas kunnen komen, maar ook bij het uitwerken van tv-interviews.” Huijbregts promoveerde vorige week op zijn onderzoek (pdf).

Bron: Webwereld

  1. Paul Harts posted the following on 28 november 2008 at 10:39.

    Dit is zondermeer interessant voor ons. Je leest nu eenmaal sneller door een gesprek, dan dat je het beluistert. Voor ons zou dat kunnen betekenen dat je 2 out of 5 in de toekomst een andere invulling geeft; je leest 5 gesprekken en beoordeelt op basis daarvan welke twee je gaat beluisteren c.q. je een terugkoppeling over gaat geven.


Leave a reply