Veebipõhine transkriptsioon

Selle lehe abil saate lasta oma eestikeelset könet sisaldavaid helifaile automaatselt transkribeerida. Transkribeerimisel kasutatakse TTÜ Küberneetika Instituudi foneetika- ja kõnetehnoloogia laboris väljatöötatud tehnoloogiat ja mudeleid.

NB! Transkribeerimine on täisautomaatne: keegi neid salvestusi ei kuula ega transkriptsioone ei loe. Helifailide sisu võidakse aga siiski kasutada uurimisotstarbel, s.t. nende sisu võidakse pisteliselt kuulata, et analüüsida tuvastusvigade tekkimist.

Kuna automaatne transkribeerimine võtab kaua aega (natuke vähem kui helifaili kestus), siis ei saa me tuvastustulemust esitada kohe, vaid saadame selle e-mailile. Tuvastuse kestust võivad mõjutada ka muud tegurid, näiteks see, kui palju on tuvastamist ootavaid faile juba järjekorras.

Helifailis olev kõne peaks olema võimalikult hea kvaliteediga, s.t. lindistatud suu lähedal oleva mikrofoniga müravabas keskkonnas. Helifail peaks olema vähemalt 16-bit kodeeringus ja 16 KHz sagedusega, eelistatult WAV formaadis. Kuna maksimaalne üleslaetava faili suurus on 500 MB, siis võib pikemad WAV-failid kodeerida mp3 või ogg vormingusse, aga soovitav on siis kasutada vähemalt 128 kbit kodeeringut. Mahtu aitab kokku hoida ka stereovormingu muutmine monoks (tuvastuse käigus tehakse seda nagunii).

NB! Süsteem ei tööta hästi kahest tunnist pikemate helifailidega. Selliste failidega võib tuvastus ebaõnnetuda ja tuvastustulemust siis kasutajale ei saadata. Soovitame pikad failid eelnevalt tükeldada.

NB (lisatud 29.01.2022)! Kuna tuvastusserveri ressurss on piiratud, siis palun mitte üles laadida rohkem kui 10 salvestust päevas. Vastasel juhul tekib süsteemis pikk järjekord kõikide kasutajate jaoks. Kui vajate väga paljude failide (näit. terve heliarhiivi) transkribeerimist, siis kontakteeruge meiega.

Lisatud 22.10.2018: Süsteem jookseb nüüd ETAISi poolt pakutavas serveris. Tuvastus peaks nüüd olema kiirem ja töökindlam.

Lisatud 27.06.2013: Kõnetuvastussüsteemi on lähtekood koos kõigi vajalike mudelitega on saadaval siin. See võimaldab installeerida pikkade kõnesalvestuste tuvastussüsteemi oma serverisse. Vajalik Linuxi tundmine.

Tähelepanu: kui kasutate seda süsteemi teadustööks, siis palun viidata oma publikatsioonides alltoodud artiklile (saadaval siin):

Aivo Olev, Tanel Alumäe. "Estonian Speech Recognition and Transcription Editing Service" Baltic HLT 2022.

Veebipõhine kõnetuvastus