Como a Intel deu voz a Stephen Hawking

Stephen Hawking em Chicago, 1986.

AP

Hawking estava doente demais para comparecer à sua festa de aniversário, então ele conheceu os especialistas da Intel algumas semanas depois, em seu escritório no departamento de matemática aplicada e física teórica da Universidade de Cambridge. A equipe de cinco incluía Horst Haussecker, o diretor do Laboratório de Tecnologia de Experiência, Lama Nachman, o diretor do Laboratório de Computação Antecipatória e chefe do projeto, e Pete Denman, um designer de interação. “Stephen sempre foi uma inspiração para mim”, diz Denman, que também usa uma cadeira de rodas. “Depois que quebrei meu pescoço e fiquei paralisado, minha mãe me deu um exemplar de Uma breve história do tempo, que acabara de ser publicado. Ela me disse que pessoas em cadeiras de rodas ainda podem fazer coisas incríveis. Olhando para trás, percebo o quão profético isso foi. “

Depois que a equipe da Intel se apresentou, Haussecker assumiu a liderança, explicando por que eles estavam lá e quais eram seus planos. Haussecker continuou falando por 20 minutos, quando, de repente, Hawking falou.

“Ele nos deu as boas-vindas e expressou como estava feliz por estarmos lá “, diz Denman. “Sem que nós soubéssemos, ele estava digitando todo esse tempo. Demorou 20 minutos para escrever uma saudação de cerca de 30 palavras. Isso nos parou no meio do caminho. Foi comovente. Agora percebemos que seria muito problema maior do que pensávamos. “

Na época, a interface do computador de Hawking era um programa chamado EZ Keys, uma atualização dos softwares anteriores e também desenvolvido pela Words Plus. Fornecia a ele um teclado no a tela e um algoritmo básico de previsão de palavras. Um cursor varrido automaticamente no teclado por linha ou coluna e ele podia selecionar um caractere movendo a bochecha para parar o cursor. As teclas EZ também permitiam que Hawking controlasse o mouse no Windows e operasse outros aplicativos em seu computador. Ele navegou na web com o Firefox e escreveu suas palestras usando o bloco de notas. Ele também tinha uma webcam que usava com o Skype.

A equipe da Intel imaginou uma reviravolta no sistema arcaico de Hawking, que envolveria a introdução de novo hardware. “Justin estava pensando que poderíamos usar tecnologias como reconhecimento de gestos faciais, rastreamento de olhar e interfaces cérebro-computador”, diz Nachman. “Inicialmente, nós o alimentamos com muitas dessas ideias selvagens e tentamos várias tecnologias disponíveis no mercado.” Essas tentativas, na maioria das vezes, falharam. O rastreamento do olhar não pode travar no olhar de Hawking, por causa da queda de suas pálpebras. Antes do projeto da Intel, Hawking testou capacitores de EEG que podiam ler suas ondas cerebrais e potencialmente transmitir comandos para seu computador. De alguma forma, eles não conseguiam “um sinal cerebral forte o suficiente”. Nós mostrávamos letras na tela e ele tentava selecionar a letra certa apenas registrando a resposta do cérebro “, diz Wood. “Funcionou bem comigo, então Stephen tentou e não funcionou bem. Eles não foram capazes de obter uma relação sinal-ruído forte o suficiente. “

” O quanto mais o observamos e ouvimos suas preocupações, mais nos ocorreu que o que ele realmente estava pedindo, além de melhorar a rapidez com que ele conseguia se comunicar, era por novos recursos que o permitissem interagir melhor com seu computador “, diz Nachman . Depois de retornar ao Intel Labs e depois de meses de pesquisa, Denman preparou um vídeo de 10 minutos para enviar a Hawking, delineando quais novos protótipos de interface do usuário eles queriam implementar e solicitando seu feedback. “Nós criamos mudanças que sentimos que não mudariam drasticamente a forma como ele usava seu sistema, mas ainda teriam um grande impacto”, diz Denman. As mudanças incluíram acréscimos como um “botão voltar”, que Hawking poderia usar não apenas para excluir caracteres, mas para navegar um passo para trás em sua interface de usuário; um algoritmo de palavra preditiva; e a navegação para a palavra seguinte, que o deixava escolher as palavras uma após a outra em vez de digitá-las.

A principal mudança, na visão de Denman, era um protótipo que resolvia o maior problema que Hawking tinha com o seu interface do usuário: teclas perdidas. “Stephen costumava apertar a tecla errada ao acertar a letra adjacente à que ele queria”, diz Denman. “Ele perderia a carta, voltaria, perderia a carta novamente, voltaria. Era insuportavelmente lento e ele ficava frustrado. “Esse problema em particular foi agravado pelo perfeccionismo de Hawking. “É muito importante para ele ter seus pensamentos articulados exatamente da maneira certa e que a pontuação esteja absolutamente certa”, diz Nachman. “Ele aprendeu a ser paciente o suficiente para ainda ser perfeccionista. Ele não é alguém que quer apenas transmitir a essência da mensagem. Ele é alguém que realmente deseja que seja perfeito.”

Para resolver os key-hits perdidos, a equipe da Intel adicionou um protótipo que interpretaria Hawking “s intenções, em vez de sua entrada real, usando um algoritmo semelhante ao usado em processadores de texto e telefones celulares. “Esta é uma interação difícil de se depositar”, explica o vídeo. “Quando o iPhone entrou no mercado, as pessoas reclamaram do texto preditivo, mas rapidamente a desconfiança se transformou em deleite. O problema é que leva um pouco de tempo para se acostumar e você tem que liberar o controle para deixar o sistema fazer o trabalho. desse recurso pode aumentar sua velocidade e permitir que você se concentre no conteúdo. “

O vídeo concluiu:” Qual é o seu nível de entusiasmo ou apreensão? “Em junho daquele ano, Hawking visitou o Intel Labs, onde Denman e sua equipe o apresentou ao novo sistema, inicialmente denominado ASTER (para ASsistive Text EditoR). “Seu software atual está um pouco desatualizado”, Denman disse a ele. “Bem, está muito desatualizado, mas você está muito costumava usá-lo, então mudamos o método pelo qual a sua previsão da próxima palavra funciona e ele pode muito bem pegar a palavra correta todas as vezes, mesmo que você esteja “sem letras”.

“Esta é uma grande melhoria em relação à versão anterior”, respondeu Hawking. “Eu realmente gostei.”

Eles implementaram a nova interface do usuário no computador de Hawking. Denman achou que eles estavam no caminho certo. Em setembro, eles começaram a receber feedback: Hawking não estava se adaptando ao novo sistema. Era muito complicado. Protótipos como o botão Voltar e o que endereça “teclas perdidas” se mostraram confusos e tiveram que ser descartados. “Ele é um dos caras mais brilhantes do mundo, mas não podemos esquecer que ele não foi exposto à tecnologia moderna”, diz Denman. “Ele nunca teve a oportunidade de usar um iPhone. Estávamos tentando ensinar ao avô de 72 anos mais famoso e inteligente do mundo a aprender essa nova maneira de interagir com a tecnologia.”

Caixa de computador e sintetizador de voz usada por Stephen Hawking, 1999.

Science Museum Photo Studio / Getty Images

Denman e o resto da equipe perceberam que precisavam começar a pensar de maneira diferente sobre o problema. “Achamos que estávamos projetando software no sentido tradicional, em que você lança uma grande rede e tentar pegar o máximo de peixes que puder “, diz Denman.” Não percebemos o quanto o projeto dependeria de Stephen. Tivemos que apontar um laser para estudar um indivíduo. “

Em No final de 2012, a equipe da Intel montou um sistema que registrava como Hawking interagia com seu computador. Eles gravaram dezenas de horas de vídeo que abrangeram uma série de situações diferentes: Stephen digitando, Stephen digitando quando cansado, Stephen usando o mouse, Stephen tentando obter uma janela do tamanho certo. “Assisti à filmagem várias vezes”, diz Denman.

“Às vezes, eu corria em quatro vezes a velocidade e ainda encontrar algo novo. “

Em setembro de 2013, agora com a ajuda de Jonathan Wood, assistente graduado da Hawking, eles implementaram outra iteração da interface do usuário no Hawking” s computador. “Achei que tivéssemos, achei que tínhamos acabado”, diz Denman. No entanto, no mês seguinte, ficou claro que, novamente, Hawking estava tendo problemas para se adaptar. “Um de seus assistentes chamou de tortura ASTER”, lembra Denman. “Quando eles diziam isso, Stephen sorria.”

Passaram-se muitos meses antes que a equipe da Intel surgisse com uma versão que agradasse Hawking. Por exemplo, Hawking agora usa um preditor de palavras adaptável da inicialização SwiftKey de Londres, que permite selecionar uma palavra depois de digitar uma letra, enquanto o sistema anterior de Hawking exigia que ele navegasse até a parte inferior de sua interface de usuário e selecionasse uma palavra de uma lista . “Seu sistema de previsão de palavras era muito antigo”, diz Nachman. “O novo sistema é muito mais rápido e eficiente, mas tivemos que treinar Stephen para usá-lo. No começo ele estava reclamando disso, e só depois eu percebi o porquê: ele já sabia quais palavras seus sistemas anteriores iriam prever. Ele estava acostumado a prever seu próprio preditor de palavras. “A Intel trabalhou com o SwiftKey, incorporando muitos dos documentos de Hawking ao sistema, de modo que, em alguns casos, ele não precisa mais digitar um caractere antes que o preditor adivinhe a palavra com base em contexto. “A frase” o buraco negro “não requer nenhuma digitação”, diz Nachman. “Selecionar” o “prediz automaticamente” negro “. Selecionar “preto” prevê automaticamente “buraco”.”

A nova versão da interface do usuário do Hawking (agora chamada ACAT, após Assistive Contextually Aware Toolkit) inclui menus contextuais que fornecem ao Hawking vários atalhos para falar, pesquisar ou enviar e-mail; e um novo gerenciador de palestras, que lhe dá controle sobre o tempo de sua apresentação durante as palestras. Ele também tem um botão mudo, um recurso curioso que permite que Hawking desligue seu sintetizador de voz. “Como ele opera seu interruptor com a bochecha, se está comendo ou viajando, ele cria uma saída aleatória”, diz Wood. “Mas há momentos em que ele gosta de inventar uma fala aleatória. Ele faz isso o tempo todo e às vezes é totalmente inapropriado. Lembro-me de uma vez que ele digitou “xxxx” aleatoriamente, que, por meio de seu sintetizador de fala, soava como “sexo, sexo, sexo, sexo”. “

Madeira” O escritório fica próximo ao de Hawking. É mais um workshop do que um estudo. Uma parede está repleta de hardware eletrônico e protótipos experimentais. Montada na mesa está uma câmera, parte de um projeto em andamento com a Intel. “A ideia é ter uma câmera apontada para Stephen” s rosto para captar não apenas os movimentos da bochecha, mas outros movimentos faciais “, diz Wood. “Ele poderia mover a mandíbula para os lados, para cima e para baixo, dirigir um mouse e até potencialmente dirigir sua cadeira de rodas. Essas são ideias interessantes, mas não serão concluídas tão cedo.”

Outro projeto experimental, sugerido pelos fabricantes da cadeira de rodas de Hawking no início deste ano, é um joystick que se conecta ao queixo de Hawking e permite que ele navegue em sua cadeira de rodas independentemente. “É algo que Stephen gosta muito”, diz Wood. “O problema era o contato entre o queixo de Stephen e o joystick. Como ele não tem movimento de pescoço, é difícil engatar e desengatar o joystick. Wood mostra à WIRED um vídeo de um teste recente desse sistema. Nele, você pode ver Hawking dirigindo sua cadeira de rodas por uma sala vazia, aos trancos e barrancos. “Como você pode ver, ele conseguiu dirigir”, diz Wood. “Bem, mais ou menos.”

Wood mostrou a WIRED uma pequena caixa cinza, que continha a única cópia do sintetizador de voz de Hawking. É um CallText 5010, um modelo dado a Hawking em 1988 quando ele visitou a empresa que o fabricou, a Speech Plus. O cartão dentro do sintetizador contém um processador que transforma texto em fala, um dispositivo que também foi usado para sistemas de atendimento telefônico automatizado na década de 1980.

“Estou tentando fazer uma versão de software do Stephen” s voz para que “não tenhamos que confiar nessas placas de hardware antigas”, diz Wood. Para fazer isso, ele teve que rastrear a equipe Speech Plus original. Em 1990, Speech Plus foi vendido para a Centigram Communications. A Centigram foi adquirida pela Lernout and Hauspie Speech Products, que foi adquirida pela ScanSoft em 2001. A ScanSoft foi comprada pela Nuance Communications, uma multinacional com 35 escritórios e 1.200 funcionários. Wood a contatou. “Eles tinham um software com a voz de Stephen de 1986”, diz Wood. “Parece que o encontramos em uma fita de backup na Nuance.”

Hawking é muito apegado à sua voz: em 1988, quando a Speech Plus lhe deu o novo sintetizador, a voz era diferente e ele pediu que a substituíssem pelo original. Sua voz foi criada no início dos anos 80 pelo engenheiro do MIT Dennis Klatt, um pioneiro dos algoritmos de conversão de texto em fala. Ele inventou o DECtalk, um dos primeiros dispositivos a traduzir texto em fala. Ele inicialmente fez três vozes, a partir de gravações de sua esposa, filha e dele mesmo. A voz feminina era chamada de “Bela Betty”, a da criança “Kit the Kid”, e a voz masculina, baseada na sua própria, “Paul Perfeito”. “Paul Perfeito” é A voz de Hawking.

Esta história foi publicada pela primeira vez na WIRED UK, edição 01.15

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *