Selle lehe abil saate lasta oma eestikeelset könet sisaldavaid helifaile automaatselt transkribeerida. Transkribeerimisel kasutatakse TTÜ Küberneetika Instituudi foneetika- ja kõnetehnoloogia laboris väljatöötatud tehnoloogiat ja mudeleid.

NB! Transkribeerimine on täisautomaatne: keegi neid salvestusi ei kuula ega transkriptsioone ei loe. Helifailide sisu võidakse aga siiski kasutada uurimisotstarbel, s.t. nende sisu võidakse pisteliselt kuulata, et analüüsida tuvastusvigade tekkimist.

Kuna automaatne transkribeerimine võtab kaua aega (natuke vähem kui helifaili kestus), siis ei saa me tuvastustulemust esitada kohe, vaid saadame selle e-mailile. Tuvastuse kestust võivad mõjutada ka muud tegurid, näiteks see, kui palju on tuvastamist ootavaid faile juba järjekorras.

Helifailis olev kõne peaks olema võimalikult hea kvaliteediga, s.t. lindistatud suu lähedal oleva mikrofoniga müravabas keskkonnas. Helifail peaks olema vähemalt 16-bit kodeeringus ja 16 KHz sagedusega, eelistatult WAV formaadis. Kuna maksimaalne üleslaetava faili suurus on 100 MB, siis võib pikemad WAV-failid kodeerida mp3 või ogg vormingusse, aga soovitav on siis kasutada vähemalt 128 kbit kodeeringut. Mahtu aitab kokku hoida ka stereovormingu muutmine monoks (tuvastuse käigus tehakse seda nagunii).

Lisatud 27.06.2013: Kõnetuvastussüsteemi on lähtekood koos kõigi vajalike mudelitega on saadaval siin. See võimaldab installeerida pikkade kõnesalvestuste tuvastussüsteemi oma serverisse. Vajalik Linuxi tundmine.

Lisatud 17.02.2017: Tuvastus on nüüd palju täpsem ja palju kiirem. Üleslaetud failid peaks saama töödeldud isegi natuke kiiremini, kui faili enda kestus. Samuti on märgatavalt paranenud diktofoniga tehtud salvestiste tuvastamise kvaliteet. Siiski soovitame ikkagi kasutada kõiki meetodeid võimalikult hea kõnesignaali saamiseks (s.h. intervjuueeritava külge kinnitatavad mikrofonid jms). Mürases keskkonnas (näit. kohvikus) laua peal oleva diktofoniga tehtud salvestuste tuvastamise kvaliteet on endiselt suhteliselt kehv.