Kifejlesztettük AI beszédfelismerő megoldásunkat a magyar nyelvre optimalizálva

2019. febr. 5.
A mesterséges intelligencia segítségével a beszédfelismerő megoldások számtalan, még kiaknázatlan lehetőséget nyitnak meg minden üzleti szektorban. Az angol nyelvet felismerő szoftverek robbanásszerűen terjednek, azonban a magyar nyelv eddig háttérbe szorult. Mostanáig. Ismerje meg saját fejlesztésű, deep learning alapú, magyar nyelvre optimalizált beszédfelismerő megoldásunkat!

Kérjen ingyenes elérést beszédfelismerő mesterséges intelligenciánkhoz!

INGYENES DEMO KÉRÉSE

 

 

AI beszédfelismerés

A mesterséges intelligencia által nyújtott lehetőségek közül kiemelkedő fontossággal bírnak a különböző beszédfelismerő és hangfelismerő rendszerek, mivel azok számos gyakorlati alkalmazási móddal rendelkeznek. A mély neurális hálók robbanásszerű elterjedésével a beszédfelismerésben terén komoly fejlődés következett be, és egyre szélesebb körben terjednek el az ismert hangvezérelt asszisztensek, mint a Google Home, az Amazon Alexa és további hangfelismeréssel működő eszközök.

Eddigi korlátok, nehézségek

Bár a beszédfelismerési megoldások már több tíz évvel ezelőtt megjelentek, a hangfelismerés eddig meglehetősen bonyolult feladatnak bizonyult, és a korábban használt algoritmusok meglehetősen rossz pontossággal dolgoztak. A deep learning elterjedése  komoly innovációt jelentett a beszédfelismerés területén, azonban továbbra is számos kihívást kell leküzdenie: a programnak ki kell szűrnie a háttérzajt és meg kell birkóznia az emberi nyelv komplexitásával. Ez magában foglalja a különböző beszédstílusokat,  hangmagasságot és a beszéd gyorsaságát is. A feladatot tovább nehezíti a magyar nyelv bonyolultsága. A ragok változatos használata, a többi nyelvtől eltérő szóalkotási módszerek és a szórend kötetlensége mind-mind olyan tényezők, amelyek nagy akadályt jelentenek egy magyar nyelven értő mesterséges intelligencia betanításakor. Mindemellett, a betanításra felhasználható adatmennyiség is jelentősen kisebb, mint például az angol nyelven értő AI-ok esetében.

Saját beszédfelismerő AI megoldásunk

A fentiekben részletezett nehézségeket leküzdve sikerült mély neurális hálók segítségével nagy pontosságú beszédfelismerő rendszert létrehoznunk, amely magyar és angol nyelvre került optimalizálásra.

A megoldásunk nagy előnye, hogy a rendszer az általános tanítás használatával azonnal bevezethető, valamint különböző szaknyelvekre tovább optimalizálható, ezáltal az adott terület speciális kifejezéseit egyszerűbben ismeri fel és írja le. Ennek köszönhetően a mesterséges intelligenciánk egyedi igények alapján még pontosabb működésre képes. Például, ha orvosi szaknyelvvel egészítjük ki a betanításra használt adatokat, az képessé válik a klinikai dokumentáció elvégzésére. De gondolhatunk akár informatikai, jogi vagy műszaki szövegek rögzítésére is - a lehetőségek végtelenek.

A régebbi technológiákat használó diktáló szoftvermegoldásokkal ellentétben nem szükséges lassabban beszélni a beszédfelismerő precíz működéséhez, az a normál beszédtempót követi. AI megoldásunk így tehát valós idejű diktálást tesz lehetővé, a létrehozott szövegek pedig kereshetővé és kielemezhetővé válnak.

Próbálja ki AI megoldásunkat működés közben!

 

 

 

 

A beszédfelismerő mesterséges intelligencia felhasználási lehetőségei

 

Keresés hang- és videófájlokban

AI megoldásunk hatékonyan alkalmazható a hang- és videófájlok feliratának elkészítésére. Segítségével akár egy hatalmas adatbázis hanganyagai is könnyen kereshetővé és kategorizálhatóvá válhatnak, így nem szükséges egyetlen kifejezésért órákon át keresgélnie különböző hang és videó anyagokban. Számoljon le a monoton feladatokkal!

 

Hangalapú vezérlés

Okos eszközeink hangalapú irányítása egyre fontosabb szerephez jut életünkben. A deep learning alapú beszédfelismerés segítséget nyújthat a hangvezérelt asszisztensek és más robotok magyar nyelvű kezelésében, vagy esetleg ilyen funkcióval még nem rendelkező eszközökhöz is kifejleszthető egyedi hangalapú irányítási rendszer.

 

Diktálás alapú leiratozás

A gépelés lassúságának leküzdésével nagy mértékben nőhet a produktivitás és a kreativitás. Egy jól elkészített diktálásra alkalmas mesterséges intelligencia használata így hatalmas előnyökhöz juttathatja azokat, akik napi szinten több órát töltenek gépeléssel. Megoldásunk nagy előnye, hogy a normál beszédtempót követve képes a folyamatos szövegalkotásra, tehát a beszéddel egyidejűleg létre is jön a kívánt szöveg.

Beszéd elemzése (ügyfélszolgálatoknál)

A mesterséges intelligencia beszédfelismerő és szövegelemző funkcióinak összekapcsolásával kielemezhető az emberi beszéd. Ez felhasználható akár az ügyfelek elégedettségének, vagy a munkatársak hatékonyságának mérésére is. Ügyfélszolgálatok esetében meghatározhatók a legnagyobb vagy éppen legkisebb elégedettséget kiváltó kifejezések és mondatok, így maximalizálható a szolgáltatás teljesítménye.

 

Objektum felismerő (képfelismerő) AI megoldásunk - bemutató videó