Hogyan Működik A Mesterséges Intelligencia: Beszédfelismerés - Alternatív Nézet

Tartalomjegyzék:

Hogyan Működik A Mesterséges Intelligencia: Beszédfelismerés - Alternatív Nézet
Hogyan Működik A Mesterséges Intelligencia: Beszédfelismerés - Alternatív Nézet

Videó: Hogyan Működik A Mesterséges Intelligencia: Beszédfelismerés - Alternatív Nézet

Videó: Hogyan Működik A Mesterséges Intelligencia: Beszédfelismerés - Alternatív Nézet
Videó: Bevezetés a mesterséges intelligencia világába 2024, Szeptember
Anonim

Mindannyian olyan rejtélyes jelenséggel nézünk szembe, mint a mesterséges intelligencia a mindennapi életben - ő az, aki lehetővé teszi a hangsegédöknek és a keresőmotoroknak az emberi beszéd felismerését és a felhasználók vágyainak kitalálását. Ma arról fogunk beszélni, hogy pontosan hogyan épül fel ez a technológia, és milyen kilátások várják a fejlesztési területet a közeljövőben.

A mesterséges intelligencia egy nagyon tág fogalom, amelyen belül már létezik és még fejlesztés alatt áll számos algoritmus, amelyeket a gyakorlati feladatok széles skálájának végrehajtására terveztek. De mire képesek a modern mesterséges intelligencia programok, és milyen elveket vezérelnek munkájuk során? Ma beszélünk a gépi gondolkodás egyik legfontosabb jellemzőiről, amelyekkel mindannyian rendszeresen találkozunk a mindennapi életben - a hangsegédök azon képességével, hogy felismerjék az emberi beszédet.

Hangfelismerés

A hang mérésére a program számos hangparamétert használ: a hanghullám frekvenciáját és hosszát egy adott időpontban. Például, amikor beszélget a népszerű Alexa hangsegéddel, a szoftver 25 milliszekundum diákra osztja a hangját, majd az egyes szegmenseket digitális aláírássá alakítja. Ezután az aláíró blokkokat összehasonlítják a program hangjainak belső katalógusával, amíg az egyezések száma elég magas ahhoz, hogy az AI "lefordítsa" a számokat egy értelemben vett ábécé lekérdezésbe.

Image
Image

Nézze meg telefon képernyőjét, miközben használja a Siri-t vagy a Google Assistant-t, és látni fogja, hogy a szókincs megváltozik, amikor a szavakat beszéli. Ennek oka az a tény, hogy a következő „lépésekkel” a szoftver összehasonlítja a kapott eredményt a belső adatbázissal, és szavakat épít az egyezések függvényében. Rohit Prasad, az Amazon Alexa osztályának tudósa szerint "a nyelvi modell sok milliárd szót tanul meg szöveg formájában". A szórend is fontos szerepet játszik: ezt észre lehet venni a szokásos Google keresőmotor segítségével is, amely időnként eltérő adatokat szolgáltat az azonos lekérdezésekhez, amelyekben csak néhány szó került átrendezésre.

Promóciós videó:

A beszédfelismerés perspektívái

Alan Black, a Carnegie Nyelvi Technológiai Intézet szerint azzal érvel, hogy a nagyvállalatok minden szakembere számára a legérdekesebb dolog megtalálni a saját rendszerük határait. „Amikor a program azt mondja:„ Nem tudom ezt megtenni”, akkor a helyzet igazán érdekes lesz. Valójában ez a helyzet: a kiszámíthatatlan felhasználói kérésekre való reagálás még az egyik fő feladata, amelyet az Alexa-díjért versenytárs hallgatói körök - és ez 2,5 millió dollárba kerülnek - vizsgálnak. Feladatuk egy chatbot létrehozása, amelynek célja az emberekkel való kommunikáció, akik következetes és értelmes kérdéseket tesznek fel. Az információkat ebben az esetben 20 percenként frissítik. Nagyon könnyű feladatnak tűnik még egy átlagos programozó számára is,de a gyakorlatban a program valós emberekkel való kommunikációját mindig a párbeszéd témájától való eltérések, a spontán mondatok és egyéb jogsértések társítják. Egy olyan program, amely megtanulja velük együtt dolgozni, mint egy valós ember, óriási áttörést jelent az egész madárinfluenza-ipar számára.

Vaszilij Makarov