Bing

A Microsoft Research olyan rendszert hoz létre, amely képes automatikusan "intelligens" feliratokat generálni

Tartalomjegyzék:

Anonim

Bizonyára találkozott már olyan felirattal, amely zavaró, helytelen vagy keveset mond arról a képről, amelyre vonatkozik; és még az is lehetséges, hogy ha saját cikkei közzétételére szánja magát, akkor unalmasnak találja ezt a részt kitölteni. Nos, a redmondiak létrehoztak egy eszközt, amely megkönnyíti az Ön dolgát.

A Microsoft Research által közzétett munka, amely „feliratgeneráló rendszerként” írja le magát, amely képes utánozni az emberi nyelv narratív jellemzőit, vagyis olyan technológiát, amely képes leírni a képernyőképeket, mintha valamelyikünkről szólna, megfelelő kontextusával.Valami, amin olyan cégek, mint a Facebook, a Microsoft és a Google már régóta dolgoznak, de ezúttal felülmúlja a várakozásokat.

Miből áll

Nagyon jól érezte magát

Ily módon a rendszer képes akár egy teljes történetet is elmondani több képből, leírva és elmesélve, mintha könyv volt. Egy segédprogram, amely a szakértők szerint egy olyan funkcióvá válhat, amely emberibb érintést biztosít bizonyos alkalmazásokhoz, hangfelismerő alkalmazásokhoz, automatikusan leírásokat generál más területeken és még sok más.

És a tény az, hogy a eszköz nem korlátozódik arra, hogy röviden elmondja, mit „lát”, hanem szélesebb körű A képen tükröződő szituáció kontextusa, „narratív kontextus és egyedi narrációs stílus” – magyarázta Frank Ferraro, a mű egyik szerzője.Ahhoz, hogy helyzetbe hozzuk magunkat, világos példa

Édesanyja büszke volt rá

Így a következő esetet javasoljuk: „Képzeljük el, hogy van egy fényképalbumunk néhány barátról, akik születésnapjukat ünnepelték Kocsma. Az első képek némelyike ​​azt mutatja, hogy az emberek sört rendelnek és isznak, míg az utolsókon valaki aludt a kanapén” – kommentálja.

Egy hagyományos rendszer „egyszerűen olyasmire mutathat, mintha egy ember hever a kanapén, míg a mi rendszerünkben szerepelhet, hogy valószínűleg azért van ilyen helyzetben, mert részeg néhány ital elfogyasztása után”. Egy kiegészítés, amely értést és egy bizonyos érzelmi töltetet biztosít, amely a cikkben szereplő képeken és képaláírásokon is tükröződik.

Via | MIT Technology Review

A Xataka Windowsban | A Microsoft elindít egy alkalmazást, amely meghatározza kutyája fajtáját

Bing

Választható editor

Back to top button