Promovendus Marijn Huijbregts van de Universiteit Twente zegt resultaten te hebben geboekt met audio- en videobestanden die een spraakherkenner vooraf helemaal niet kent. SHoUT (Spraak Herkenningsonderzoek Universiteit Twente) weet onderscheid aan te brengen tussen spraak en andere geluiden. Achtergrondmuziek en spraak worden gescheiden.
De tweede stap is het identificeren van de verschillende sprekers. “Dat lukt aardig,” zegt Huijbregts tegen Webwereld. “Niet alleen kun je vrouwen- en mannenstemmen onderscheiden, maar ook mannen- en vrouwenstemmen onderling. Met name bij het automatisch notuleren van vergaderingen zou dat van pas kunnen komen, maar ook bij het uitwerken van tv-interviews.” Huijbregts promoveerde vorige week op zijn onderzoek (pdf).
Bron: Webwereld

