Carnegie Mellon (wikipedia) Universitete kuria automatinė šnekos atpažinimo sistemų grupę: kelios versijos atpažinimo ir akustinio modelio mokymo programinė įranga. Oficiali svetainė: CMU Sphinx
Pirmoji versija buvo kuriama apie 1989 [1]. Algoritmas rėmėsi: paslėptų Markovo akustinių modelių (HMMs) ir n-gram statistiniu kalbos modeliu.
programavimo kalba: C
Eksperimentiniams duomenimis buvo nustatyta klaidų: ~9%
Apie 2000 metus buvo tobulinama antroji versija [2]. Programinė realizacija buvo kuriama taip kad būtų galima atpažinti šneką realiu laiku. Pagrinde buvo realizuotos šnekos aptikimo, dalinės hipotezės teikimo, dinaminis kalbos modelio užkrovimo algoritmo dalys. Buvo naudojamas pusiau-tolydaus akustinis modelis.
programavimo kalba: C
Eksperimentiniams duomenimis buvo nustatyta klaidų: ~9%
2001 Trečioji versija turėjo leisti didesnį programinį lankstumą ir aukštą atpažinimo lygį [4]. Greitaveika nebuvo vienas iš tikslų. Su šia versija buvo pradėtas vystyti SphinxTrain paketas, kuris leidžia sulyginai lengviau apmokyti atpažinime naudojamus akustinius modelius. buvo naudojamas tolydus HMM
programavimo kalba: C
Eksperimentiniams duomenimis buvo nustatyta klaidų: ~10%
2004 programinės įrangos iškelti tikslai [5][6]): tinkinimo lankstumas, tinkinimas, draugiška vartotojo/programuotojo sąsaja. Realizuojamo algoritmo pagrindas buvo paimtas iš Sphinx v3 Pilnai perrašytas su Sun(Oracle) Java. Sukurta papildomų Vartotojo sąsajos įrankių palengvinančių darbą.
Programavimo Kalba: Sun(Oracle) Java
Eksperimentiniams duomenimis buvo nustatyta klaidų: ~8%
Sphinx algortimas buvo pakeistas tam, kad tikslingiau išnaudotų mobilių įrenginių techninę įrangą [7]: fiksuoto-kablelio aritmetika, Gausinių mišinių modelių skaičiavimas.
programavimo kalba: C
Eksperimentiniams duomenimis buvo nustatyta klaidų: ~10%
paslėptų Markovo akustinių modelių (HMMs) ir n-gram statistiniu kalbos modeliu.