Van élet a Siri-n túl is?

2015. október 30. 13:30
Angelica Lim
IEEE.org
A Georgia Tech tudósai új alapokra szeretnék helyezni az ember és gép kommunikációját, a cél, hogy a spontán és csapongó kávéházi beszélgetésekhez hasonlóan a mesterséges intelligencia is egyenrangú partnere legyen emberi társának.

„Dr. Crystal Chao és Andrea Thomaz (Georgia Tech) radikálisan szeretnék megújítani és új alapokra helyezni az ember és gép közötti kommunikációt. Ha egy kicsit figyelmesebben tanulmányozzuk, hogy hogyan kommunikál egy robot és egy ember, akkor rögvest szemünkbe tűnik, hogy a gép mindig alávetett státuszban szerepel a „beszélgetések" során, tulajdonképpen egy gyerek szerepét tölti be, úgy tűnik, mintha egy felnőtt beszélgetne egy kissé értelmileg fogyatékossal. A mesterséges intelligencia gyakorlatilag megismétli a kérdező emberi lény verbális aktusait: ha az AI beszél, az ember is beszél stb. Mintha egy walkie-talkie csevejt hallgatnák az idők végtelenségéig. Az egész túl steril, sőt megkockáztathatjuk „embertelen".

A homo sapiens kommunikációs aktusa nem éppen így működik a való világban. Figyeljük meg hogyan beszélget valaki egy kávéházban vagy hipszterként egy romkocsmában. Mitől is élő egy emberi kommunikáció tulajdonképpen? Félszavakból megértik egymást, közbeszólnak a másik beszéde közben, nevetnek, kommentálják a beszélgetőtárs gondolatait és gesztikulálnak. Chao és Thomaz ezért gondolják, hogy ha már egy robotot és egy mesterséges intelligenciát a magunk képére teremtünk, mint az istenek, akkor legalább a kommunikációs aktusuk is legyen hasonló az emberi beszélgetésekhez, azok minden apró jellemzőjével egyetemben. 

Szóval vissza kell térni a valódi beszélgetésekhez és valahogy ezeket lemásolni az AI és az ember közti kommunikációban. A feladat nem egyszerű, mert másolni a szabad asszociációkon alapuló és csapongó emberi beszédet (ami nemcsak hangok, hanem gesztusok és testbeszéd egymásra reflektáló sorozata) elég nagy kihívás. Maga az emberi kommunikáció (hétköznapi beszélgetésről és csetelésről van szó, nem prezentációról és egyetemi előadásokról vagyis egyirányú kommunikációról) többször is témát vált, soha nem lineáris, mint az eddigi gép-ember közti dialógusok.

Hogyan dolgozik a Siri mögötti intelligencia (vagy a Cortana és Google Now)? Szavakra keresnek, az emberi kifejezéseket és mondatokat ismétlik és keresnek hozzájuk megfeleltetéseket egy adatbázisból (ezt az adatbázist fejlesztik a „gazdáikkal" való beszélgetések közben). Az emberi beszélgetés dinamikáját kell tehát belecsempészni a gépi "intellektusba" valahogy. Ezen sokat segít, ha van egy olyan adatbázis, amibe töltelék szavakat teszünk (hogy az AI-nak legyen miből válogatnia, ha elakad), ha van miből az üresjáratokat kitöltenie a gépnek, ha megtanul időzíteni, mint egy ember. Ez pedig már a gépi tanulás birodalma. Vagyis tudjon a gép csendben "figyelni", ha akar közbe is szóljon, ha úgy véli az ember túl sokat és ugyanazt a gondolatkört ismétli folyamatosan (loop), kommentáljon, használjon testbeszédet, váltson témát stb. A kihívás nagy, de ha Chao és Thomaz és leendő kutató társaik sikerrel járnak, végre a digitális személyi asszisztenseink is „emberré" válhatnak valamennyire. Ez a lépés pedig teljesen átalakíthatja az ember és gép kapcsolatát majd a jövőben."

 
Az eredeti, teljes írást itt olvashatja el.
Hozzászóláshoz és a további kommentek megtekintéséhez lépjen be, vagy regisztráljon!

Bejelentkezés