Hogyan adott egy hangot az Intel Stephen Hawkingnak

Stephen Hawking, Chicago, 1986.

AP

Hawking túl beteg volt ahhoz, hogy részt vehessen saját születésnapi partiján, ezért néhány héttel később a Cambridge-i Egyetem alkalmazott matematika és elméleti fizika tanszékén található irodájában találkozott az Intel szakértőivel. Az ötfős csapatba Horst Haussecker, az Experience Technology Lab igazgatója, Lama Nachman, az Anticipatory Computing Lab igazgatója és a projekt vezetője, valamint Pete Denman interakciótervező került be. “Stephen mindig is inspiráló volt számomra” – mondja Denman, aki kerekesszéket is használ. “Miután eltört a nyakam és megbénultam, anyám átadta nekem az Idő rövid története című példányt, amely éppen megjelent. Azt mondta nekem, hogy a kerekesszékes emberek még mindig képesek elképesztő dolgokat csinálni. Visszatekintve rájövök, hogy ez mennyire prófétikus volt. “

Miután az Intel csapata bemutatkozott, Haussecker átvette a vezetést, és elmagyarázta, miért vannak ott és mik a terveik. Haussecker 20 percig folytatta a beszédet, amikor hirtelen Hawking megszólalt.

“Üdvözölt minket, és kifejezte, mennyire boldog, hogy ott vagyunk “- mondja Denman. “Tudomásunk nélkül, egész idő alatt gépelt. 20 percbe telt, mire 30 szóból álló köszöntőt írt. Mindannyiunkat megállított a nyomunkban. Megrendítő volt. Most rájöttünk, hogy ez sok lesz nagyobb probléma, mint gondoltuk. “

Abban az időben a Hawking számítógépes felülete az EZ Keys nevű program volt, a korábbi szoftverek frissítése, amelyet a Words Plus is tervezett. Billentyűzetet biztosított számára a képernyő és az alapvető szó-előrejelző algoritmus. A kurzor soronként vagy oszloponként automatikusan beolvasott a billentyűzeten, és az arcát mozgatva kiválaszthatta a karaktert a kurzor leállításához. Az EZ Keys lehetővé tette Hawking számára, hogy vezérelje az egeret a Windows rendszerben és működjön más alkalmazásokat a számítógépén. A Firefox segítségével szörfözött az interneten, és a Notepad segítségével írta előadásait. Volt egy webkamerája is, amelyet a Skype-tal használt.

Az Intel csapata Hawking archaikus rendszerének felborulását tervezte, ami új hardver bevezetésével járna. “Justin arra gondolt, hogy használhatnánk olyan technológiát, mint az arc-gesztusfelismerés, a tekintetkövetés és az agy-számítógép interfészek” – mondja Nachman. “Kezdetben rengeteg ilyen vad ötlettel etettük meg, és rengeteg polc nélküli technológiát kipróbáltunk. Ezek a kísérletek, gyakran, nem sikerültek. A tekintetkövetés nem tudott Hawking tekintetét megakasztani a szemhéja megereszkedése miatt. Az Intel projekt előtt Hawking kipróbálta az EEG-sapkákat, amelyek képesek leolvasni az agyhullámait, és potenciálisan továbbítani a parancsokat a számítógépére. Valahogy nem tudnak “elég erős agyi jelet kapni.” Betűket villogtatnánk a képernyőn, és az csak az agy válaszának regisztrálásával próbálná meg kiválasztani a megfelelő betűt “- mondja Wood. “Ez jól működött velem, aztán Stephen megpróbálta, és nem működött jól. Nem képesek elég erős jel-zaj kialakítására. “

” A minél jobban megfigyeltük és meghallgattuk aggodalmait, annál inkább rájöttünk, hogy amit igazán kérdez, azon túl, hogy javítja a kommunikáció gyorsaságát, olyan új funkciókat keres, amelyek lehetővé teszik számára, hogy jobban működjön együtt a számítógépével “- mondja Nachman . Visszatérés után az Intel Labs-ba és több hónapos kutatás után Denman készített egy 10 perces videót, amelyet elküldhetett Hawkingnak, meghatározva, hogy mely új felhasználói felület prototípusokat kívánja megvalósítani, és kikérte visszajelzését. “Olyan változtatásokkal álltunk elő, amelyek úgy éreztük, hogy nem változtatnák meg drasztikusan a rendszer használatát, de mégis nagy hatással lennének” – mondja Denman. A változtatások olyan kiegészítéseket tartalmaztak, mint egy “vissza gomb”, amelyet Hawking nemcsak karakterek törlésére, hanem a felhasználói felületén egy lépéssel hátralépéshez is felhasználhatott; prediktív szó algoritmus; és a következő szavakkal történő navigáció, amely lehetővé tette számára, hogy szavakat válogasson egymás után, ahelyett, hogy gépelné őket.

A fő változás Denman véleménye szerint egy prototípus volt, amely megoldotta Hawking legnagyobb problémáját felhasználói felület: elmulasztott kulcsütések. “Stephen gyakran rossz kulcsot ütött meg azzal, hogy elütötte a kívánt betű szomszédos betűjét” – mondja Denman. “Hiányozni fog a levél, visszamegy, újra elmulasztja a levelet, visszamegy. Ez elviselhetetlenül lassú volt, és csalódni fog. “Ezt a problémát Hawking tökéletessége fokozta. “Nagyon fontos számára, hogy a gondolatait pontosan a megfelelő módon fogalmazzák meg, és hogy az írásjelek teljesen helyesek legyenek” – mondja Nachman. “Megtanult elég türelmesnek lenni ahhoz, hogy mégis képes legyen perfekcionista lenni. Nem olyan valaki, aki csak át akarja adni az üzenet lényegét. Ő olyan, aki igazán azt akarja, hogy tökéletes legyen.”

A kihagyott kulcsütések kezelésére az Intel csapata hozzáadott egy prototípust, amely értelmezni fogja Hawkingot “szándékai, nem pedig a tényleges bevitele, a szövegszerkesztéshez és a mobiltelefonokhoz hasonló algoritmus használata. “Ez egy kemény interakció, amelybe beleteszed a hitedet” – magyarázta a videó. “Amikor az iPhone először belépett a piacra, az emberek panaszkodtak a prediktív szövegre, de a bizalmatlanság gyorsan örömére vált. A probléma az, hogy egy kis időbe telik, amíg megszokja, és el kell engednie az irányítást, hogy a rendszer elvégezze a munkát. ennek a funkciónak a segítségével növelheti a sebességet, és koncentrálhat a tartalomra. “

A videó következtetése:” Mi az izgalom vagy félelem szintje? “Az év júniusában Hawking felkereste az Intel Labs-ot, ahol Denman és csapata bemutatta neki az új rendszert, amelyet eredetileg ASTER-nek hívtak (az ASsistive Text EditoR számára). “A jelenlegi szoftvered egy kicsit datálva van” – mondta neki Denman. “Nos, ez nagyon dátumozott, de te nagyon szokta használni, ezért megváltoztattuk azt a módszert, amellyel a következő szavakra vonatkozó jóslat működik, és nagyjából minden egyes alkalommal fel tudja venni a helyes szót, még akkor is, ha “már nincsenek benne betűk”.

“Ez nagy előrelépés az előző verzióhoz képest” – válaszolta Hawking. “Nagyon tetszik.”

Megvalósították az új felhasználói felületet Hawking számítógépén. Denman azt gondolta, hogy jó úton járnak. Szeptemberre kezdtek visszajelzéseket kapni: Hawking nem alkalmazkodott az új rendszerhez. Túl bonyolult volt. Az olyan prototípusok, mint a Vissza gomb, és a “kihagyott kulcsütések” címzetesek, zavarosnak bizonyultak, és azokat fel kellett dobni. “Ő az egyik legfényesebb srác a világon, de nem felejthetjük el, hogy még nem volt kitéve a modern technológiának” – mondja Denman. “Soha nem volt lehetősége iPhone-t használni. Megpróbáltuk megtanítani a világ leghíresebb és legokosabb 72 éves nagyapját, hogy megtanulja a technológiával való interakció új módját.”

Számítógépes és beszédszintetizátor ház, amelyet Stephen Hawking, 1999.

Tudományos Múzeum Fotóstúdió / Getty Images

Denman és a csapat többi tagja rájött, hogy másképp kell gondolkodniuk a problémán. “Úgy gondoltuk, hogy a hagyományos értelemben vett szoftvert tervezzük, ahol hatalmas hálót dob ki és próbálj meg minél több halat kifogni “- mondja Denman.” Nem tudtuk, mennyire függ a terv Stephen-től. Lézert kellett mutatnunk, hogy egy egyedet tanulmányozzunk. “

2012 végén az Intel csapata felállított egy rendszert, amely rögzítette Hawking interakcióját a számítógépével. Több tízórányi videofelvételt készítettek, amely számos különböző helyzetet felölelt: Stephen gépelés, Stephen gépelés fáradt állapotban, Stephen az egér használata, Stephen éppen megfelelő méretű ablak megszerzése. “Újra és újra megnéztem a felvételeket” – mondja Denman.

“Néha futnék négyszeres sebességgel, és még mindig talál valami újat. “

2013 szeptemberére, most Jonathan Wood, Hawking diplomás asszisztense segítségével, a Hawking felhasználói felületének újabb iterációját hajtották végre. számítógép. “Azt hittem, hogy megvan, azt hittem, készen vagyunk” – mondja Denman. A következő hónapra azonban kiderült, hogy Hawkingnak megint csak gondjai vannak az alkalmazkodással. “Az egyik asszisztense” ASTER “kínzásnak nevezte” – emlékeztet Denman. “Amikor azt mondták, Stephen elvigyorodott.”

Még sok hónap telt el, mire az Intel csapata előállt egy olyan verzióval, amely tetszett Hawkingnak. Például Hawking most egy adaptív szóprediktort használ a londoni SwiftKey indításból, amely lehetővé teszi, hogy egy betűt beírva kiválasszon egy szót, míg Hawking korábbi rendszere megkövetelte, hogy navigáljon a felhasználói felület aljára, és válasszon ki egy szót a listából. “” A szó-előrejelző rendszere nagyon régi volt “- mondja Nachman.” Az új rendszer sokkal gyorsabb és hatékonyabb, de ki kellett képeznünk Stephent a használatára. Kezdetben panaszkodott emiatt, és csak később jöttem rá, miért: Már tudta, hogy korábbi rendszerei mely szavakat jósolják meg. Megszokta jósolni a saját szavait. “Az Intel a SwiftKey-vel dolgozott, sok Hawking-dokumentumot beépített a rendszerbe, így bizonyos esetekben már nem kell karaktert írnia, mielőtt a prediktor kitalálná a szót kontextus. “A” fekete lyuk “kifejezés nem igényel gépelést” – mondja Nachman. “A” kiválasztása “automatikusan megjósolja a” fekete “szót. A “fekete” kiválasztása automatikusan megjósolja a “lyukat”.”

A Hawking felhasználói felületének új verziója (most ACAT néven jelenik meg, az asszisztens kontextus szerint) Toolkit) olyan kontextuális menüket tartalmaz, amelyek Hawking számára különféle parancsikonokat biztosítanak a beszédhez, a kereséshez vagy az e-mailhez; és egy új előadás-menedzser, amely kontrollt ad neki a tárgyalások során tartott előadásának időzítése felett. Van egy némítógombja is, amely egy furcsa funkció, amely lehetővé teszi Hawking számára, hogy kikapcsolja beszédszintetizátorát. “Mivel a kapcsolót az arcával működteti, ha eszik vagy utazik, véletlenszerű kimenetet hoz létre” – mondja Wood. “De vannak olyan esetek, amikor szeret véletlenszerű beszédet előállítani. Folyamatosan csinálja, és néha teljesen helytelen. Emlékszem, egyszer véletlenszerűen beírta az “xxxx” szót, amely beszédszintetizátorán keresztül úgy hangzott, mint a “sex sex sex sex”. “

Wood” irodája Hawking mellett van. Inkább műhely, mint tanulmány. Az egyik falat elektronikus hardverek és kísérleti prototípusok halmozzák fel. Az íróasztalra egy kamera tartozik, az Intelrel egy folyamatban lévő projekt része. “Az ötlet az, hogy a kamera Stephenre mutasson”. hogy ne csak az arcát, hanem más arcmozgásait is felvegye “- mondja Wood. “Oldalra, fel-le mozgathatja állkapcsát, egérrel vezethet, és még a kerekesszékét is vezetheti. Remek ötletek ezek, de hamarosan nem fognak befejezni.”

Egy másik kísérleti projekt, amelyet a Hawking kerekesszék gyártói javasoltak az év elején, egy joystick, amely a Hawking állához és lehetővé teszi számára, hogy önállóan mozogjon a kerekesszékében. “Ez valami, amit Stephen nagyon szeret” – mondja Wood. “A kérdés Stephen álla és a joystick közötti érintkezés volt. Mivel a nyaka nem mozog, nehéz a joystickot be- és kikapcsolni. Wood bemutatja a WIRED videót a rendszer nemrégiben végrehajtott tesztpróbájáról. Ebben láthatja, hogy Hawking kerekesszékével egy üres szobán halad, rohamokban és indulásokban. “Mint látható, sikerült vezetnie” – mondja Wood. “Nos, amolyan.”

Wood a WIRED-nek egy kis szürke dobozt mutatott, amely a Hawking beszédszintetizátorának egyetlen példányát tartalmazta. Ez a CallText 5010 volt, egy modell, amelyet Hawking kapott 1988-ban, amikor meglátogatta. az azt gyártó cég, a Speech Plus. A szintetizátor belsejében lévő kártya tartalmaz egy processzort, amely a szöveget beszéddé alakítja. Ezt az eszközt az 1980-as években automatizált telefonos üzenetrögzítő rendszerekhez is használták.

“Megpróbálom Stephen szoftveres verzióját elkészíteni” hangot, hogy ne kelljen támaszkodnunk ezekre a régi hardverkártyákra “- mondja Wood. Ehhez fel kellett találnia az eredeti Speech Plus csapatot. 1990-ben a Speech Plus-t eladták a Centigram Communications-nek. A Centigram-ot a A Lernout és a Hauspie Speech Products, amelyeket 2001-ben a ScanSoft vásárolt meg. A ScanSoftot a Nuance Communications, egy 35 irodával és 1200 alkalmazottal rendelkező multinacionális vállalat vásárolta meg. Wood felvette vele a kapcsolatot. “1986-tól Stephen hangjával rendelkeztek szoftverekkel” – mondja Wood. “Úgy tűnik, hogy a Nuance egyik biztonsági kazettáján találtuk meg.”

Hawking is nagyon ragaszkodott a hangjához: 1988-ban, amikor a Speech Plus megadta neki az új szintetizátort, a hang más volt, ezért arra kérte őket, hogy cseréljék le az eredetire. Hangját a 80-as évek elején hozta létre Dennis Klatt, az MIT mérnöke, a szöveg-beszéd algoritmusok úttörője. Ő találta ki a DECtalk-ot, amely az egyik első eszköz a szöveg beszédre fordítására. Kezdetben három hangot adott ki felvételekből. A nő hangját “Gyönyörű Betty” -nek, a gyermek “Kit the Kid” -nek, a férfi hangját pedig a “Perfect Paul” -ra alapozták. Hawking hangja.

Ez a történet először a WIRED UK 01.15

kiadásában jelent meg

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük