Cómo Intel le dio a Stephen Hawking una voz

Stephen Hawking en Chicago, 1986.

AP

Hawking había estado demasiado enfermo para asistir a su propia fiesta de cumpleaños, así que se reunió con los expertos de Intel algunas semanas después en su oficina del departamento de matemáticas aplicadas y física teórica de la Universidad de Cambridge. El equipo de cinco incluía a Horst Haussecker, director del Experience Technology Lab, Lama Nachman, director del Anticipatory Computing Lab y jefe del proyecto, y Pete Denman, un diseñador de interacción. «Stephen siempre me ha inspirado», dice Denman, quien también usa una silla de ruedas. «Después de que me rompí el cuello y me quedé paralizado, mi madre me dio una copia de Una breve historia del tiempo, que acababa de salir. Me dijo que las personas en sillas de ruedas todavía pueden hacer cosas increíbles. Mirando hacia atrás, me doy cuenta de lo profético que es eso fue «.

Después de que el equipo de Intel se presentó, Haussecker tomó la iniciativa y explicó por qué estaban allí y cuáles eran sus planes. Haussecker continuó hablando durante 20 minutos, cuando, de repente, Hawking habló.

«Nos dio la bienvenida y expresó lo feliz que estaba de que estuviéramos allí «, dice Denman. «Sin que lo supiéramos, había estado escribiendo todo ese tiempo. Le tomó 20 minutos escribir un saludo de unas 30 palabras. Nos detuvo a todos en seco. Fue conmovedor. Ahora nos dimos cuenta de que esto iba a ser mucho problema más grande de lo que pensábamos «.

En ese momento, la interfaz de la computadora de Hawking era un programa llamado EZ Keys, una actualización de los softwares anteriores y también diseñado por Words Plus. Le proporcionó un teclado en la pantalla y un algoritmo básico de predicción de palabras. Un cursor escaneaba automáticamente el teclado por fila o por columna y podía seleccionar un carácter moviendo la mejilla para detener el cursor. Las teclas EZ también permitían a Hawking controlar el mouse en Windows y operar otras aplicaciones en su computadora. Navegaba por la web con Firefox y escribía sus conferencias usando el Bloc de notas. También tenía una cámara web que usaba con Skype.

El equipo de Intel previó una alteración del arcaico sistema de Hawking, lo que implicaría la introducción de nuevo hardware. «Justin pensaba que podíamos usar tecnología como el reconocimiento de gestos faciales, el seguimiento de la mirada y las interfaces cerebro-computadora», dice Nachman. «Inicialmente le dimos a conocer muchas de estas ideas locas y probamos muchas tecnologías listas para usar». Esos intentos, la mayoría de las veces, fracasaron. El seguimiento de la mirada no pudo fijarse en la mirada de Hawking, debido a los párpados caídos. Antes del proyecto de Intel, Hawking había probado casquillos EEG que podían leer sus ondas cerebrales y potencialmente transmitir comandos a su computadora. De alguna manera, no podían «obtener una señal cerebral lo suficientemente fuerte». Destellamos letras en la pantalla e intentamos seleccionar la letra correcta simplemente registrando la respuesta del cerebro «, dice Wood. «Me funcionó bien, luego Stephen lo intentó y no funcionó bien. No pudieron obtener una relación señal-ruido lo suficientemente fuerte «.

» El Cuanto más lo observábamos y escuchamos sus inquietudes, más nos dimos cuenta de que lo que realmente estaba pidiendo, además de mejorar la rapidez con que podía comunicarse, eran nuevas funciones que le permitieran interactuar mejor con su computadora «, dice Nachman. . Después de regresar a Intel Labs y después de meses de investigación, Denman preparó un video de 10 minutos para enviar a Hawking, delineando qué nuevos prototipos de interfaz de usuario querían implementar y solicitando sus comentarios. «Se nos ocurrieron cambios que sentimos que no cambiarían drásticamente la forma en que usaba su sistema, pero aún así tendrían un gran impacto», dice Denman. Los cambios incluyeron adiciones como un «botón de retroceso», que Hawking podía usar no solo para eliminar personajes sino para navegar un paso atrás en su interfaz de usuario; un algoritmo de palabras predictivas; y navegación de la siguiente palabra, que le permitía elegir palabras una tras otra en lugar de escribirlas.

El cambio principal, en la opinión de Denman, fue un prototipo que abordó el mayor problema que tenía Hawking con su interfaz de usuario: pulsaciones de tecla perdidas. «Stephen a menudo pulsaba la tecla incorrecta pulsando la letra adyacente a la que quería», dice Denman. «Perdería la letra, volvería atrás, volvería a perder la letra, volvería atrás. Era insoportablemente lento y se frustraba «. Ese problema en particular se vio agravado por el perfeccionismo de Hawking. «Es realmente importante para él tener sus pensamientos expresados exactamente de la manera correcta y que la puntuación sea absolutamente correcta», dice Nachman. «Aprendió a ser lo suficientemente paciente como para poder seguir siendo un perfeccionista. No es alguien que solo quiere transmitir la esencia del mensaje. Es alguien que realmente quiere que sea perfecto.»

Para abordar las pulsaciones de teclas perdidas, el equipo de Intel agregó un prototipo que interpretaría a Hawking sus intenciones, en lugar de su entrada real, utilizando un algoritmo similar al utilizado en el procesamiento de textos y los teléfonos móviles. «Esta es una interacción difícil en la que poner su fe», explica el video. «Cuando el iPhone entró por primera vez en el mercado, la gente se quejó del texto predictivo, pero rápidamente la desconfianza se convirtió en deleite. El problema es que se necesita un poco de tiempo para acostumbrarse y hay que soltar el control para que el sistema haga el trabajo. de esta función podría aumentar su velocidad y permitirle concentrarse en el contenido «.

El video concluía:» ¿Cuál es su nivel de emoción o aprensión? «En junio de ese año, Hawking visitó Intel Labs, donde Denman y su equipo le presentó el nuevo sistema, inicialmente llamado ASTER (para ASsistive Text EditoR). «Su software actual está un poco anticuado», le dijo Denman. «Bueno, está muy anticuado, pero usted» es muy acostumbrado a usarlo, así que hemos cambiado el método por el cual funciona la predicción de la siguiente palabra y prácticamente puede captar la palabra correcta cada vez, incluso si no tiene letras en ella.

«Es una gran mejora con respecto a la versión anterior», respondió Hawking. «Realmente me gusta».

Implementaron la nueva interfaz de usuario en la computadora de Hawking. Denman pensó que estaban en el camino correcto. En septiembre, comenzaron a recibir comentarios: Hawking no se estaba adaptando al nuevo sistema. Era demasiado complicado. Los prototipos como el botón de retroceso y el que abordaba «pulsaciones de tecla perdidas» resultaron confusos y tuvieron que descartarse. «Es uno de los tipos más brillantes del mundo, pero no podemos olvidar que no ha estado expuesto a la tecnología moderna», dice Denman. «Nunca tuvo la oportunidad de usar un iPhone. Estábamos tratando de enseñarle al abuelo de 72 años más famoso e inteligente del mundo a aprender esta nueva forma de interactuar con la tecnología».

Carcasa de computadora y sintetizador de voz utilizada por Stephen Hawking, 1999.

Science Museum Photo Studio / Getty Images

Denman y el resto del equipo se dieron cuenta de que tenían que empezar a pensar de manera diferente sobre el problema. «Pensamos que estábamos diseñando software en el sentido tradicional, donde arrojas una red enorme y trata de atrapar tantos peces como puedas «, dice Denman.» No nos dimos cuenta de cuánto dependería el diseño de Stephen. Tuvimos que apuntar con un láser para estudiar a un individuo «.

En A finales de 2012, el equipo de Intel instaló un sistema que registraba cómo interactuaba Hawking con su computadora. Grabaron decenas de horas de video que abarcaron una variedad de situaciones diferentes: Stephen escribiendo, Stephen escribiendo cuando está cansado, Stephen usando el mouse, Stephen tratando de obtener una ventana del tamaño justo. «Vi las imágenes una y otra vez», dice Denman.

«A veces, corría a cuatro veces la velocidad y aún así encontrar algo nuevo «.

En septiembre de 2013, ahora con la ayuda de Jonathan Wood, asistente graduado de Hawking, implementaron otra iteración de la interfaz de usuario en Hawking ordenador. «Pensé que lo teníamos, pensé que habíamos terminado», dice Denman. Sin embargo, al mes siguiente, quedó claro que, nuevamente, Hawking estaba teniendo problemas para adaptarse. «Uno de sus asistentes lo llamó» tortura ASTER «, recuerda Denman. «Cuando lo decían, Stephen sonreía».

Pasaron muchos meses más antes de que el equipo de Intel presentara una versión que complaciera a Hawking. Por ejemplo, Hawking ahora usa un predictor de palabras adaptable de la startup londinense SwiftKey que le permite seleccionar una palabra después de escribir una letra, mientras que el sistema anterior de Hawking requería que navegara hasta la parte inferior de su interfaz de usuario y seleccionara una palabra de una lista. . «Su sistema de predicción de palabras era muy antiguo», dice Nachman. «El nuevo sistema es mucho más rápido y eficiente, pero tuvimos que entrenar a Stephen para usarlo. Al principio se quejaba de ello, y solo después me di cuenta de por qué: ya sabía qué palabras predecirían sus sistemas anteriores. Estaba acostumbrado a predecir su propio predictor de palabras «. Intel trabajó con SwiftKey, incorporando muchos de los documentos de Hawking en el sistema, de modo que, en algunos casos, ya no necesita escribir un carácter antes de que el predictor adivine la palabra basándose en contexto. «La frase» el agujero negro «no» no requiere escritura «, dice Nachman.» Seleccionar «el» automáticamente predice «negro». Seleccionar «negro» predice automáticamente «agujero».»

La nueva versión de la interfaz de usuario de Hawking (ahora llamada ACAT, después de Assistive Contextually Aware Toolkit) incluye menús contextuales que le proporcionan a Hawking varios atajos para hablar, buscar o enviar un correo electrónico; y un nuevo administrador de conferencias, que le da control sobre el momento de su entrega durante las charlas. También tiene un botón de silencio, una característica curiosa que le permite a Hawking apagar su sintetizador de voz. «Debido a que opera su interruptor con la mejilla, si está comiendo o viajando, crea una salida aleatoria», dice Wood. «Pero hay momentos en los que le gusta hablar al azar. Lo hace todo el tiempo y, a veces, es totalmente inapropiado. Recuerdo que una vez escribió «xxxx» al azar, que, a través de su sintetizador de voz, sonaba como «sexo, sexo, sexo, sexo».

Wood «. La oficina está al lado de la de Hawking. Es más un taller que un estudio. Una pared está repleta de hardware electrónico y prototipos experimentales. Sobre el escritorio hay una cámara, parte de un proyecto en curso con Intel. «La idea es tener una cámara apuntando a Stephen» Su rostro para captar no solo los movimientos de sus mejillas, sino otros movimientos faciales «, dice Wood. «Podría mover la mandíbula hacia los lados, hacia arriba y hacia abajo, y conducir un mouse e incluso potencialmente conducir su silla de ruedas. Estas son ideas geniales, pero no se completarán pronto».

Otro proyecto experimental, sugerido por los fabricantes de la silla de ruedas de Hawking a principios de este año, es un joystick que se coloca en el mentón de Hawking y le permite desplazarse en su silla de ruedas de forma independiente. «Es algo en lo que Stephen está muy interesado», dice Wood. «El problema era el contacto entre la barbilla de Stephen y el joystick. Como no tiene movimiento de cuello, es difícil activar y desactivar el joystick. Wood muestra WIRED un video de una prueba de prueba reciente de este sistema. En él, puedes ver a Hawking conduciendo su silla de ruedas a través de una habitación vacía, a trompicones. «Como puede ver, logró conducirlo», dice Wood. «Bueno, más o menos».

Wood mostró WIRED una pequeña caja gris, que contenía la única copia del sintetizador de voz de Hawking. Es un CallText 5010, un modelo que se le dio a Hawking en 1988 cuando visitó la empresa que lo fabricó, Speech Plus. La tarjeta dentro del sintetizador contiene un procesador que convierte texto en voz, un dispositivo que también se usó para los sistemas automáticos de contestador telefónico en la década de 1980.

«Estoy tratando de hacer una versión de software de Stephen» Voice para que «no tengamos que depender de estas viejas tarjetas de hardware», dice Wood. Para ello, tuvo que localizar al equipo original de Speech Plus. En 1990, Speech Plus se vendió a Centigram Communications. Centigram fue adquirida por Lernout y Hauspie Speech Products, que fue adquirida por ScanSoft en 2001. ScanSoft fue comprada por Nuance Communications, una multinacional con 35 oficinas y 1.200 empleados. Wood se puso en contacto con ella. «Tenían software con la voz de Stephen desde 1986», dice Wood. «Parece que lo hemos encontrado en una cinta de respaldo en Nuance».

Hawking es muy apegado a su voz: en 1988, cuando Speech Plus le regaló el nuevo sintetizador, la voz era diferente por lo que les pidió que lo reemplazaran por el original. Su voz fue creada a principios de los 80 por el ingeniero del MIT Dennis Klatt, un pionero de los algoritmos de conversión de texto a voz. Inventó el DECtalk, uno de los primeros dispositivos para traducir texto a voz. Inicialmente hizo tres voces, a partir de grabaciones de su esposa, su hija y de él mismo. La voz femenina se llamaba «Beautiful Betty», la del niño «Kit the Kid», y la voz masculina, basada en la suya, «Perfect Paul». «Perfect Paul» es La voz de Hawking.

Esta historia se publicó por primera vez en el número 01.15 de WIRED UK

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *