Vikerraadio Raadio 2 Kuku Konverentsid Klassikaraadio

Sellest veebirakendusest

See veebirakendus võimaldab mugavalt sirvida automaatse kõnetuvastuse abil transkribeeritud kõnesalvestusi.

Selle rakenduse loomist finantseeris riiklik programm "Eesti keele keeletehnoloogiline tugi (2006-2010)". Rakendus loodi projekti Eestikeelse kõnetuvastuse meetodite uurimine ja arendamine raames. Rakenduse implementeerimisel osalesid TTÜ Küberneetika instituudi foneetika ja kõnetehnoloogia labor ja OÜ Codehoop.

Alates 2011. a on süsteemi aluseks olevat kõnetuvastustehnoloogiat arendatud riikliku programmi "Eesti keeletehnoloogia (2011-2017)" raames. Projektist on lähemalt juttu siin.

Veebirakenduse lähtekood on saadaval AGPL litsentsi alusel (versioon 3). AGPL litsents on sarnane GPL litsensile, kuid lisab klausli, mis nõuab tarkvara abil avaliku teenuse osutajalt lähtekoodi avaldamist ka teenuse saajatele. Veebirakenduse lähtekood on saadaval siin.

Salvestuste automaatset transkribeerimist ja regulaarset lisamist süsteemi teostav tarkvara ei ole selle veebirakenduse osa, ning ei ole hetkel ka vabalt saadaval. Tulevikus on plaanis siiski ka tuvastustehnoloogiat huvitatutele vabalt levitada. Tuvastustes on kasutatud mitmesugust tarkava, millest tähtsamad on:

  • Kaldi: kõnetuvastus
  • SRILM: statistilise keelemudeli loomine
  • LIUM_SpkDiarization: kõnesalvestuse jagamine kõnelõikudeks, lõikude grupeerimine kõneleja järgi
Enamus kasutatud tarkvarast on vaba lähtekoodiga.

Kõnetuvastuse akustiliste mudelite treenimiseks on kasutatud hetkel umbes 220 tundi käsitsi märgendatud kõnet.

Kõnetuvastuse toimimise ülevaatliku kirjeldusega saab tutvuda siin.