Jak Intel dal Stephenovi Hawkingovi hlas

Stephen Hawking v Chicagu, 1986.

AP

Hawking byl příliš nemocný, než aby se zúčastnil své vlastní narozeninové oslavy, takže o několik týdnů později se setkal s odborníky společnosti Intel ve své kanceláři na katedře aplikované matematiky a teoretické fyziky na univerzitě v Cambridge. Tým pěti členů zahrnoval Horsta Hausseckera, ředitele Experience Technology Lab, Lama Nachmana, ředitele Anticipatory Computing Lab a vedoucího projektu, a Pete Denmana, návrháře interakcí. „Stephen byl pro mě vždy inspirativní,“ říká Denman, který také používá invalidní vozík. „Poté, co jsem si zlomil krk a ochrnul, moje matka mi dala kopii Stručné historie času, která právě vyšla. Řekla mi, že lidé na invalidních vozících mohou dělat úžasné věci. Při pohledu zpět si uvědomuji, jak prorocké to bylo bylo. “

Poté, co se představil tým Intel, se Haussecker ujal vedení a vysvětlil, proč tam byli a jaké byly jejich plány. Haussecker pokračoval v mluvení po dobu 20 minut, když najednou Hawking promluvil.

„Uvítal nás a vyjádřil, jak byl šťastný, že jsme tam byli, “říká Denman. „Nevěděl nám, že celou dobu psal. Trvalo mu 20 minut, než napsal pozdrav asi 30 slov. Zastavilo nás to všechny v našich stopách. Bylo to uštěpačné. Nyní jsme si uvědomili, že to bude hodně větší problém, než jsme si mysleli. “

V té době byl Hawkingovým počítačovým rozhraním program s názvem EZ Keys, upgrade z předchozího softwaru, který také navrhl Words Plus. Poskytoval mu klávesnici na obrazovka a základní algoritmus predikce slov. Kurzor automaticky skenoval po klávesnici po řádcích nebo sloupcích a mohl vybrat znak pohybem tváře, aby kurzor zastavil. EZ Keys také umožnil Hawkingovi ovládat myš ve Windows a pracovat další aplikace v počítači. Procházel web pomocí Firefoxu a přednášky psal pomocí programu Poznámkový blok. Měl také webovou kameru, kterou používal se Skype.

Tým Intel předpokládal převrat archaického systému Hawkinga, což by zahrnovalo zavedení nového hardwaru. „Justin si myslel, že bychom mohli použít technologii, jako je rozpoznávání gest obličeje, sledování pohledu a rozhraní mozek-počítač,“ říká Nachman. „Zpočátku jsme mu dali spoustu těchto divokých nápadů a vyzkoušeli jsme spoustu běžných technologií.“ Tyto pokusy častěji selhaly. Sledování pohledu se nemohlo zafixovat na Hawkingův pohled, protože mu klesla víčka. Před projektem Intel Hawking testoval čepice EEG, které dokázaly číst jeho mozkové vlny a potenciálně přenášet příkazy do jeho počítače. Nějak se jim „nepodařilo získat dostatečně silný mozkový signál.“ Na obrazovce bychom blikali písmena a pokusilo by se vybrat správné písmeno pouhou registrací mozkové odpovědi, “říká Wood. „Se mnou to fungovalo dobře, pak to zkusil Stephen a nefungovalo to dobře. Nedokázali získat dostatečně silný signál od šumu. „

“ The čím více jsme ho pozorovali a naslouchali jeho obavám, tím více nám došlo, že to, co se opravdu ptá, kromě zlepšení rychlosti komunikace, je nové funkce, které mu umožní lepší interakci s počítačem, “říká Nachman . Po návratu do laboratoří Intel a po měsících výzkumu připravil Denman 10minutové video, které poslal Hawkingovi, a popsal, jaké nové prototypy uživatelského rozhraní chtějí implementovat, a žádal o jeho zpětnou vazbu. „Přišli jsme se změnami, o kterých jsme se domnívali, že drasticky nezmění způsob, jakým používá svůj systém, ale budou mít stále velký dopad,“ říká Denman. Změny zahrnovaly doplňky jako „tlačítko Zpět“, které Hawking mohl použít nejen k mazání znaků, ale také k navigaci o krok zpět ve svém uživatelském rozhraní; algoritmus prediktivního slova; a navigace v dalším slově, která mu umožňovala volit slova jeden po druhém, spíše než je psát.

Hlavní změnou, podle Denmana, byl prototyp, který řešil největší problém, který měl Hawking se svými uživatelské rozhraní: zmeškané stisknutí klávesy. „Stephen často zasáhl špatnou klávesu tím, že udeřil na písmeno vedle toho, co chtěl,“ říká Denman. „Zmeškal by písmeno, vrátil se, znovu minul písmeno, vrátil se. Bylo to neúnosně pomalé a byl by frustrovaný. “K tomuto konkrétnímu problému se přidal Hawkingův perfekcionismus. „Je opravdu důležité, aby měl své myšlenky formulované přesně správným způsobem a aby interpunkce byla naprosto správná,“ říká Nachman. „Naučil se být dost trpělivý, aby mohl být stále perfekcionistou. Není to někdo, kdo chce jen dostat podstatu zprávy. Je to někdo, kdo opravdu chce, aby byla dokonalá.“

Za účelem řešení zmeškaných zásahů klíčů přidal tým Intel prototyp, který by interpretoval Hawkinga „spíše než jeho skutečné zadání, použití algoritmu podobného algoritmu použitému při zpracování textu a mobilních telefonech.“ „Je to těžká interakce, do které můžete dát svou víru,“ vysvětlovalo video. „Když iPhone poprvé vstoupil na trh, lidé si stěžovali na prediktivní text, ale rychlá nedůvěra se změnila v potěšení. Problém je v tom, že zvykání trvá trochu času a musíte uvolnit kontrolu, aby systém mohl pracovat. Tato funkce by mohla zvýšit vaši rychlost a umožnit vám soustředit se na obsah. “

Video uzavřelo:„ Jaká je vaše úroveň nadšení nebo obav? “V červnu téhož roku navštívil Hawking laboratoře Intel Labs, kde Denman a jeho tým ho představil novému systému, původně nazvanému ASTER (pro ASsistive Text EditoR). „Váš současný software je trochu datovaný,“ řekl mu Denman. „No, je to velmi datované, ale vy jste velmi zvykli jsme jej používat, takže jsme „změnili způsob, jakým vaše predikce dalšího slova funguje, a dokáže do značné míry pokaždé zachytit správné slovo, i když od něj„ odejdete “.

„Oproti předchozí verzi se jedná o velké zlepšení,“ odpověděl Hawking. „Moc se mi to líbí.“

Nové uživatelské rozhraní implementovali do počítače Hawking. Denman si myslel, že jsou na správné cestě. V září začali dostávat zpětnou vazbu: Hawking se nepřizpůsobil novému systému. Bylo to příliš komplikované. Prototypy, jako je tlačítko Zpět a ten, který se zabýval „zmeškanými zásahy kláves“, se ukázaly být matoucí a musely být vyřazeny. „Je to jeden z nejbystřejších kluků na světě, ale nemůžeme zapomenout, že nebyl vystaven moderní technologii,“ říká Denman. „Nikdy neměl příležitost používat iPhone. Snažili jsme se naučit světově nejslavnějšího a nejchytřejšího 72letého dědečka naučit se tento nový způsob interakce s technologií.“

Pouzdro počítače a syntetizátoru řeči používané Stephenem Hawkingem, 1999.

Science Museum Photo Studio / Getty Images

Denman a zbytek týmu si uvědomili, že o problému musí začít uvažovat jinak. „Mysleli jsme si, že navrhujeme software v tradičním smyslu, kde vyhodíte obrovskou síť a pokuste se ulovit co nejvíce ryb, „říká Denman.„ Neuvědomili jsme si, jak moc bude design záviset na Stephena. Museli jsme namířit laser, abychom studovali jednoho jedince. „

Na na konci roku 2012 tým Intel nastavil systém, který zaznamenal, jak Hawking interagoval s jeho počítačem. Zaznamenali desítky hodin videa, které zahrnovalo celou řadu různých situací: Stephen psal, Stephen psal, když byl unavený, Stephen používal myš, Stephen se snažil získat okno ve správné velikosti. „Sledoval jsem záběry znovu a znovu,“ říká Denman.

„Někdy bych běžel to čtyřnásobnou rychlostí a stále najít něco nového. “

V září 2013, nyní s pomocí Jonathana Wooda, asistenta absolventa Hawkinga, implementovali další iteraci uživatelského rozhraní v Hawkingově počítač. „Myslel jsem, že to máme, myslel jsem, že jsme hotovi,“ říká Denman. Následující měsíc však bylo jasné, že Hawking má znovu potíže s přizpůsobením. „Jeden z jeho asistentů to nazval„ mučením ASTER “,“ vzpomíná Denman. „Když to řekli, Stephen by se usmál.“

Trvalo ještě mnoho měsíců, než tým Intel přišel s verzí, která Hawkinga potěšila. Například Hawking nyní používá adaptivní prediktor slov od londýnského startupu SwiftKey, který mu umožňuje vybrat slovo po napsání písmene, zatímco předchozí systém Hawkinga od něj vyžadoval navigaci do spodní části svého uživatelského rozhraní a výběr slova ze seznamu „Jeho systém pro predikci slov byl velmi starý,“ říká Nachman. „Nový systém je mnohem rychlejší a efektivnější, ale museli jsme Stephena naučit, aby jej používal.“ Na začátku si na to stěžoval a až později jsem si uvědomil proč: Už věděl, která slova jeho předchozí systémy předpovídají. Byl zvyklý předpovídat svůj vlastní slovní prediktor. “Intel pracoval se společností SwiftKey a začlenil do systému mnoho dokumentů Hawkinga, takže v některých případech již nemusí psát znak, než prediktor uhodne slovo na základě kontext. „Fráze„ černá díra “nevyžaduje žádné psaní,“ říká Nachman. „Výběr„ „automaticky předpovídá“ černou „. Výběr „černé“ automaticky předpovídá „díru“.“

Nová verze uživatelského rozhraní Hawkingova rozhraní (nyní se nazývá ACAT, po asistenci kontextového vědomí) Toolkit) obsahuje kontextová menu, která Hawkingovi poskytují různé zkratky pro mluvení, vyhledávání nebo e-mail; a nový vedoucí přednášek, který mu dává kontrolu nad načasováním jeho doručení během rozhovorů. Má také tlačítko ztlumení, zvláštní funkce, která umožňuje Hawkingovi vypnout syntetizátor řeči. „Protože svůj spínač ovládá tváří, když je na jídle nebo cestuje, vytváří náhodný výstup,“ říká Wood. „Jsou však chvíle, kdy rád přijde s náhodnou řečí. Dělá to pořád a někdy je to úplně nevhodné. Pamatuji si, jak jednou náhodně zadal „xxxx“, což pomocí jeho syntetizátoru řeči znělo jako „sex sex sex sex“. “

Wood“ kancelář je vedle Hawkinga. Je to spíše workshop než studie. Jedna zeď je pokryta elektronickým hardwarem a experimentálními prototypy. Na stole je umístěna kamera, součást probíhajícího projektu s Intelem. „Myšlenkou je mít kameru namířenou na Stephena.“ s tváří zachytit nejen jeho pohyby po tvářích, ale i další pohyby obličeje, “říká Wood. „Mohl by pohybovat čelistí do strany, nahoru a dolů, řídit myš a dokonce potenciálně řídit svůj invalidní vozík. To jsou skvělé nápady, ale brzy se nedokončí.“

Další experimentální projekt, který navrhli výrobci invalidního vozíku Hawking na začátku tohoto roku, je joystick, který se připojuje k bradě Hawkinga a umožňuje mu samostatně se pohybovat na invalidním vozíku. „Je to něco, co má Stephen velmi rád,“ říká Wood. „Problém byl v kontaktu mezi Stephenovou bradou a joystickem. Protože nemá pohyb krku, je obtížné joystick zapnout a vypnout. “ Wood ukazuje WIRED video z nedávné testovací zkoušky tohoto systému. V něm můžete vidět Hawkinga, jak jede na invalidním vozíku přes prázdnou místnost, v záchvatech a začíná. „Jak vidíte, podařilo se mu ho řídit,“ říká Wood. „No, tak nějak.“

Wood ukázal WIREDovi malou šedou krabičku, která obsahovala jedinou kopii Hawkingova syntetizátoru řeči. Je to CallText 5010, model, který dostal Hawking v roce 1988, když navštívil společnost, která jej vyrobila, Speech Plus. Karta uvnitř syntetizátoru obsahuje procesor, který přeměňuje text na řeč, zařízení, které se v 80. letech používalo také pro automatizované telefonní záznamníky.

„Snažím se vytvořit softwarovou verzi Stephena hlas, abychom se nemuseli spoléhat na tyto staré hardwarové karty, „říká Wood. K tomu musel vystopovat původní tým Speech Plus. V roce 1990 byl Speech Plus prodán společnosti Centigram Communications. Centigram získal Produkty Lernout a Hauspie Speech Products, které získala společnost ScanSoft v roce 2001. ScanSoft koupila společnost Nuance Communications, nadnárodní společnost s 35 kancelářemi a 1200 zaměstnanci. Wood ji kontaktoval. „Měli software s hlasem Stephena od roku 1986,“ říká Wood. „Vypadá to, že jsme to mohli najít na záložní pásku v Nuance.“

Hawking je velmi připoutaný k jeho hlasu: v roce 1988, kdy mu společnost Speech Plus dala nový syntetizátor, byl hlas odlišný, a tak je požádal, aby jej nahradili původním. Jeho hlas vytvořil počátkem 80. let inženýr MIT Dennis Klatt, průkopník algoritmů převodu textu na řeč. Vynalezl DECtalk, jedno z prvních zařízení k překladu textu do řeči. Zpočátku vytvořil tři hlasy ze záznamů jeho manželky, dcery a jeho samého. Ženský hlas se jmenoval „Krásná Betty“, dětský „Kit the Kid“ a mužský hlas, založený na jeho vlastním, „Perfektní Paul“. „Perfektní Paul“ je Hawkingův hlas.

Tento příběh byl poprvé publikován ve vydání WIRED UK 01.15

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *