A Skype fordító működése
Tartalomjegyzék:
- A technológia, amely lehetővé teszi
- Az egyik beszélt nyelvről a másikra néhány másodperc alatt
- A tesztprogram mint kiindulópont
A tudományos-fantasztikus irodalom tele van utalásokkal olyan technológiailag fejlett eszközökre, amelyek működése – a mitikus kifejezést átfogalmazva – megkülönböztethetetlen a varázslattól. A szerzők kreatív elméjéből fakadóan nehéz elképzelni, hogy mikor kerülhetnek ilyen találmányok a kezünkbe, és végül elfogadjuk, hogy létezésük nem lesz életciklusunk része. De időnként egy-egy idő előtt besurran az életünkbe. Ez a valós idejű fordítás esete, amelyet a Microsoft és a Skype hamarosan lehetővé tesz
"A feladat minden, csak nem egyszerű.Ez magában foglalja a Skype videokonferenciák lebonyolítására való képességét, a Microsoft Azure hatalmas felhőszerver-hálózatát, a Microsoft Research technológiai újításait, valamint számos területen, például a statisztikák és a gépi tanulás terén elért legújabb fejlesztéseket. Mindezt azért tesszük az Ön szolgálatába, hogy amint kiejt egy mondatot az Ön nyelvén, a rendszer felismeri, amit mond, lefordítja és egy másik nyelven továbbítja a kapcsolattartójának. Hogyan lehetséges?"
A technológia, amely lehetővé teszi
Skype Translator, a név, amelyen az új funkcionalitás ismert, nem villámcsapás, még egy év múlva sem . A Skype Translator a beszédfelismerés, a gépi fordítás és a gépi tanulási technikák terén végzett több évtizedes kutatás eredménye. Mindezeken a területeken egy olyan rendszer működése áll, amely a legújabb fejlesztések nélkül nem jöhetett volna létre.
A Skype Translator a beszédfelismerés, a gépi fordítás és a gépi tanulási technikák terén végzett több évtizedes kutatás eredménye.Beszédfelismeréssel kezdődően hibák és a meglévő rendszerek túlzott érzékenysége. Egy másodpercnyi kétség, az akcentus kis eltérései vagy egy minimális zaj elég volt ahhoz, hogy megzavarja a számítógépet, és megértse, mit akar. Így volt ez egészen addig, amíg be nem robbant a „deep learning” technikák fejlesztése és a mesterséges neurális hálózatok létrehozása, amelyekről a Microsoft Research tud valamit. Nekik köszönhetően sikerült jelentősen csökkenteni a hibaarányt, és javítani a beszédfelismerés megbízhatóságát és robusztusságát, ami a Skype fordító működéséhez szükséges első lépés.
gépi fordítás a másik nyilvánvaló pillér, amelyen a Skype fordító nyugszik. Itt a Microsoft ismét házon belüli technológiát alkalmaz, és a Bing fordítómotort használja a szövegek egyik nyelvről a másikra történő fordítására.Rendszere szintaktikai felismerési technikák és statisztikai modellek kombinációját használja az eredmény finomításához. Ezen túlmenően ebből az alkalomból a motort speciálisan arra képezték ki, hogy felismerje a beszélt beszélgetésekben előforduló nyelvtípust, távol az írásban általában feltételezett helyességtől és tisztaságtól. Így a Skype Translator rendszer egyesíti a Bing Translator hatalmas nyelvi tudásbázisát a köznyelvben általánosan használt szavak és kifejezések széles rétegével.
De a beszéd és a nyelvek bonyolult terep. Folyamatosan változnak, többféle ízben és változatban kaphatók, minden embernek megvan a saját stílusa stb. A Skype Translatornak mindezzel lépést kell tartania, folyamatos képzést és optimalizálást igényel mind a beszédfelismerés, mind a gépi fordítás terén. Ennek érdekében a rendszer egy robusztus „gépi tanulási” platformra épült, a mesterséges intelligencia azon ágára, amelynek célja olyan technikák kifejlesztése, amelyek lehetővé teszik a gépek és algoritmusok tanulását. mintaadatokkal való betanítással.Ezeknek a statisztika területén elterjedt technikáknak a használata lehetővé teszi a szolgáltatás fejlesztését a használat során, kihasználva a használat során keletkező adatokat a beszédfelismerés és az automatikus fordítás további finomítására.
A tesztadatok egy része automatikusan generálódik a legkülönfélébb forrásokból, beleértve a közösségi hálózatokat, például a Facebookot, a lefordított weboldalakat, a feliratos videókat, vagy akár az erre a célra létrehozott és manuálisan átírt és lefordított beszélgetéseket. . De az adatok másik része a szolgáltatáson keresztül folytatott tényleges beszélgetésekből származik. Ez azért fontos, mert mivel a Microsoft minden hívásnál értesíti Önt, tudnia kell, hogy a Skype Translator képes rögzíteni a beszélgetéseket, névtelenül megőrizni azokat, így azokat később az algoritmusai elemezhetik és bevezették statisztikai modelljeik képzési folyamatába.
A Skype Translator csak akkor tud megfelelően működni, ha a valós emberi beszélgetésekben való felhasználásán alapuló folyamaton keresztül képes tanulni
"A rendszer nem működhetne e tanulási folyamat nélkül. Miközben az emberek beszélnek, szünetet tartunk és megismételünk dolgokat, hibázunk, és menet közben megváltoztatjuk a gondolkodásunkat. Bemutatjuk: ahs, ehms, uhms>csak a tényleges használat megismerése javíthatja azt "
Az egyik beszélt nyelvről a másikra néhány másodperc alatt
Ezen fejlesztések által támogatott A kulcs az, hogy a Skype Translator a teljes felismerési és fordítási folyamatot gyorsan és átláthatóan tudja végrehajtani a felhasználó számára Minden alkalommal, amikor beszélünk, a rendszernek fel kell ismernie, amit mondunk, le kell fordítania a címzett nyelvére, és úgy kell közölnie vele, hogy hű maradjon ahhoz, amit eredetileg közölni próbáltunk.Minél kevésbé vesszük észre a közbenső lépéseket, annál jobb.
Amint a rendszer észleli, hogy beszélünk, elkezdi rögzíteni, amit mondunk, és elindítja a beszédfelismerési folyamatot Ez nem arról, hogy ne csak minden egyes kiejtendő szót felismerjünk, hanem minden fölöslegest is megszüntessünk, az értelmetlen kifejezéseket és zajokat töröljük, a szöveg mondatokra bontását írásjelek és nagybetűk beillesztésével érzékeljük, és kontextust biztosítunk. ami segít az értelmezésedben. Ha egy kicsit belegondolsz, rájössz, milyen nehéz mindezt a beszélt nyelvből meghatározni.
A Skype Translatornak szüksége van arra, hogy a beszédfelismerés a lehető legpontosabb legyen, mert az alábbiakban az összegyűjtött információ előkészítése, hogy összehasonlítsa azokat a javuló statisztikai modellekkel „gépi tanulási” rendszerén keresztül.Itt a folyamat abból áll, hogy hasonlóságokat keresünk a rendszer által elmondottak és a modellekben szereplő szavak és összefüggések között, hogy ezt követően alkalmazzuk a korábban tanult transzformációkat, amelyek a hangot szöveggé alakítják és lefordítják idegen nyelvre.
Az utolsó lépésben a Skype készített egy botpárt, női és férfi hangokkal, amelyek tolmácsként működnek a hívásban Miután a felhasználó kiválasztott egyet, ő lesz a felelős azért, hogy a lefordított üzenetünket eljuttassa a címzetthez, hogy ne csak az írott átiratok és fordítások jelenjenek meg a képernyőn, hanem hangosan is hallhassa őket, mintha egy harmadik ember lenne. közvetít közöttünk.. Ezek a botok képesek gyorsan kommunikálni az üzenetet, így aki a képernyő másik oldalán hallgatja, néhány másodperccel a kiejtés után megkapja az üzenetet.
A tesztprogram mint kiindulópont
Pontosan a botok jelenléte külső felekként a beszélgetésben az egyik olyan részlet, amelyet még csiszolni kell. A Microsoft elismeri, hogy a tolmácson keresztül beszélni szokott emberek könnyen alkalmazkodnak hozzájuk, mások számára azonban tanulási időszakra van szükség. És az is lehet, hogy a Microsoft és a Skype eltökélt szándéka, hogy a létező legjobb valós idejű fordítási élményt hozza létre, de ehhez szükségük van arra, hogy megtanuljuk magunkat és a gépeket isA Skype Translator előnézete csak egy újabb lépés a folyamatban.
A tesztprogram december közepén indult, és bevezette a szóbeli fordítást két nyelv: angol és spanyol között, valamint írásbeli fordítást több mint 40 nyelvre Eléréséhez meghívó szükséges, melyet a program honlapján történő regisztrációval tudunk igényelni. Ha megvagyunk vele, kipróbálhatjuk a Skype fordítót a Skype Windows 8 alkalmazásokból.1 vagy Windows 10 műszaki előnézet. Ellenkező esetben meg kell várnunk a szolgáltatás kiterjesztését és hivatalos nyilvánosságra hozatalát.
"Egyébként a Skype Translator éppen akkor indult, amikor búcsút veszünk 2014-től. Mielőtt befejezné, álljon meg itt egy pillanatra, és gondoljon az imént olvasott évre: kétezer tizennégy>"
Via | Skype blogok I, II