인텔이 Stephen Hawking에게 목소리를 낸 방법

1986 년 시카고의 스티븐 호킹

AP

호킹은 너무 아파서 자신의 생일 파티에 참석할 수 없었습니다. 그는 몇 주 후에 캠브리지 대학의 응용 수학 및 이론 물리학과의 사무실에서 인텔 전문가를 만났습니다. 5 명으로 구성된 팀에는 Experience Technology Lab의 책임자 인 Horst Haussecker, Anticipatory Computing Lab의 책임자이자 프로젝트 책임자 인 Lama Nachman, 인터랙션 디자이너 인 Pete Denman이 포함되었습니다. 휠체어를 사용하는 Denman은 “Stephen은 항상 저에게 영감을주었습니다.”라고 말합니다. “내가 목이 부러지고 마비 된 후, 어머니는 방금 나왔던 A Brief History of Time의 사본을 제게 주셨습니다. 그녀는 휠체어를 탄 사람들이 여전히 놀라운 일을 할 수 있다고 말씀하셨습니다. 되돌아 보면 나는 그것이 얼마나 예언 적인지 깨달았습니다. “

인텔 팀이 자신을 소개 한 후 Haussecker가 주도권을 잡고 그들이 그곳에 있었던 이유와 계획이 무엇인지 설명했습니다. Haussecker는 20 분 동안 계속해서 말했습니다. 갑자기 Hawking이 말했습니다.

“그는 우리를 환영했고 우리가 그곳에있어 얼마나 행복했는지 표현했습니다. “라고 Denman은 말합니다. “우리도 모르는 사이에 그는 항상 타이핑을하고있었습니다. 그는 약 30 개의 단어로 인사말을 쓰는 데 20 분이 걸렸습니다. 그것은 우리의 트랙에서 우리 모두를 멈췄습니다. 그것은 가슴이 벅찼습니다. 이제 우리는 이것이 많이 될 것임을 깨달았습니다. 우리가 생각했던 것보다 더 큰 문제입니다. “

당시 Hawking의 컴퓨터 인터페이스는 이전 소프트웨어에서 업그레이드 된 EZ Keys라는 프로그램이었으며 Words Plus에서 설계했습니다. 화면과 기본적인 단어 예측 알고리즘. 커서는 행 또는 열 단위로 키보드를 자동으로 스캔하고 커서를 멈추기 위해 볼을 움직여 문자를 선택할 수 있습니다. 또한 EZ 키를 사용하면 Hawking이 Windows에서 마우스를 제어하고 조작 할 수 있습니다. 컴퓨터에있는 다른 응용 프로그램입니다. 그는 Firefox로 웹을 서핑하고 메모장을 사용하여 강의를 썼습니다. 또한 Skype에서 사용한 웹캠도 가지고있었습니다.

Intel 팀은 Hawking의 구식 시스템의 격변을 예상했습니다. 새로운 하드웨어를 도입해야합니다. “저스틴은 얼굴 제스처 인식, 시선 추적 및 뇌-컴퓨터 인터페이스와 같은 기술을 사용할 수 있다고 생각했습니다.”라고 Nachman은 말합니다. “처음에 우리는 그에게 많은 야생 아이디어를 제공하고 많은 기성 기술을 시도했습니다.” 이러한 시도는 종종 실패했습니다. 시선 추적은 그의 눈꺼풀 처짐 때문에 호킹의 시선을 “고정 할 수 없었습니다.” Intel 프로젝트 이전에 Hawking은 뇌파를 읽고 잠재적으로 컴퓨터에 명령을 전송할 수있는 EEG 캡을 테스트했습니다. 어쨌든 그들은 “충분히 강한 뇌 신호를 얻을 수 없었습니다. 우리는 화면에 글자를 번쩍이고 뇌의 반응을 등록하는 것만으로 올바른 글자를 선택하려고합니다”라고 Wood는 말합니다. “나와 잘 어울 렸고, Stephen은 그것을 시도했지만 잘 작동하지 않았습니다.” “충분히 강력한 신호 대 잡음비를 얻을 수 없었습니다.”

” 우리가 그를 더 많이 관찰하고 그의 우려에 귀를 기울일수록 그가 진정으로 요구하고있는 것은 그가 의사 소통 할 수있는 속도를 향상시키는 것 외에도 컴퓨터와 더 잘 상호 작용할 수있는 새로운 기능에 대한 것이라는 사실이 우리에게 더 많이 떠 올랐습니다. “라고 Nachman은 말합니다. . Intel Labs로 돌아와 몇 달 간의 연구 끝에 Denman은 Hawking에 보낼 10 분짜리 비디오를 준비하여 구현하려는 새로운 사용자 인터페이스 프로토 타입을 설명하고 피드백을 요청했습니다. “우리는 그가 그의 시스템을 사용하는 방식을 크게 바꾸지는 않지만 여전히 큰 영향을 미칠 것이라고 생각하는 변화를 생각해 냈습니다.”라고 Denman은 말합니다. 변경 사항에는 “뒤로 버튼”과 같은 추가 기능이 포함되었습니다.이 버튼은 호킹이 문자를 삭제할뿐만 아니라 사용자 인터페이스에서 한 단계 뒤로 이동하는 데 사용할 수 있습니다. 예측 단어 알고리즘; 단어를 입력하는 대신 차례로 선택할 수있는 다음 단어 탐색 기능이 있습니다.

Denman의 관점에서 주요 변경 사항은 Hawking이 자신의 문제에 대해 겪었던 가장 큰 문제를 해결 한 프로토 타입이었습니다. 사용자 인터페이스 : 누락 된 키 입력 “Stephen은 종종 원하는 문자 옆에있는 문자를 쳐서 잘못된 키를 눌렀습니다.”Denman은 “그는 편지를 놓치고 돌아가서 편지를 다시 놓치고 돌아갈 것입니다. 참을 수 없을 정도로 느 렸고 그는 좌절 할 것입니다. “그 특별한 문제는 호킹의 완벽주의에 의해 더욱 복잡해졌습니다. Nachman은 “그는 자신의 생각을 정확하게 올바른 방식으로 표현하고 구두점이 절대적으로 옳다는 것이 정말 중요합니다. 그는 여전히 완벽 주의자가 될 수있을만큼 충분히 인내하는 법을 배웠습니다. 그는 메시지의 요점을 전달하고자하는 사람이 아닙니다. 그는 정말 완벽하기를 원하는 사람입니다.”

누락 된 키 적중 문제를 해결하기 위해 Intel 팀은 Hawking을 해석하는 프로토 타입을 추가했습니다. “의 의도는 실제 입력이 아니라 워드 프로세싱 및 휴대폰에 사용되는 것과 유사한 알고리즘을 사용합니다. “이것은 당신의 믿음을두기에는 힘든 상호 작용입니다.”라고 비디오는 설명했습니다. “아이폰이 처음 시장에 출시되었을 때 사람들은 예측 텍스트에 대해 불평했지만 곧 불신이 기뻐했습니다. 문제는 익숙해지는 데 약간의 시간이 걸리고 시스템이 작동하도록 제어를 해제해야한다는 것입니다. 이 기능을 사용하면 속도가 빨라지고 콘텐츠에 집중할 수 있습니다. “

동영상은 다음과 같이 결론을 내 렸습니다.”흥분 또는 염려 수준은 어떻습니까? “그해 6 월, Hawking은 Denman이있는 Intel Labs를 방문했습니다. 그의 팀은 ASTER (ASsistive Text EditoR의 경우)라고하는 새로운 시스템을 소개했습니다. “현재 소프트웨어는 약간 오래되었습니다.”라고 Denman은 말했습니다. “글쎄요. 예전에 사용했기 때문에 “다음 단어 예측이 작동하는 방법을 변경했으며”문자와 거리가 멀더라도 “매번 정확한 단어를 선택할 수 있습니다.

“이전 버전에 비해 크게 개선 된 기능입니다. 정말 마음에 듭니다.”라고 답했습니다.

그들은 Hawking의 컴퓨터에 새로운 사용자 인터페이스를 구현했습니다. Denman은 그들이 올바른 길을 가고 있다고 생각했습니다. 9 월이되자 그들은 피드백을 받기 시작했습니다. Hawking은 새로운 시스템에 적응하지 못했습니다. 너무 복잡했습니다. 뒤로 버튼과 같은 프로토 타입과 “누락 된 키 히트”를 해결하는 프로토 타입은 혼란 스러웠고 폐기해야했습니다. “그는 세상에서 가장 영리한 사람 중 한 명이지만 그가 현대 기술에 노출되지 않았다는 사실을 잊을 수 없습니다.”라고 Denman은 말합니다. “그는 iPhone을 사용할 기회가 없었습니다. 우리는 세계에서 가장 유명하고 똑똑한 72 세 할아버지에게 기술과 상호 작용하는 새로운 방법을 배우도록 가르치려고했습니다.”

1999 년 Stephen Hawking이 사용한 컴퓨터 및 음성 합성기 하우징.

Science Museum Photo Studio / Getty Images

Denman과 나머지 팀원은 문제에 대해 다르게 생각해야한다는 것을 깨달았습니다. “우리는 기존의 의미에서 소프트웨어를 설계하고 있다고 생각했습니다. Denman은 “디자인이 Stephen에게 얼마나 많은 영향을 미칠지 몰랐습니다. 한 사람을 연구하기 위해 레이저를 겨냥해야했습니다.”라고 Denman은 말합니다.

At 2012 년 말 인텔 팀은 Hawking이 컴퓨터와 상호 작용하는 방식을 기록한 시스템을 설정했습니다. 그들은 스티븐 타이핑, 피곤할 때 스티븐 타이핑, 마우스를 사용하는 스티븐, 딱 맞는 크기의 창을 얻으려는 스티븐 등 다양한 상황을 포괄하는 수십 시간 분량의 비디오를 녹화했습니다. Denman은 “동영상을 계속해서 봤어요.”라고 말합니다.

“때로는 4 배의 속도로도 여전히 새로운 것을 찾을 수 있습니다. “

2013 년 9 월, 이제 Hawking의 대학원 조교 인 Jonathan Wood의 도움을 받아 Hawking의 사용자 인터페이스에 대한 또 다른 반복을 구현했습니다. 컴퓨터. “나는 우리가 해냈다 고 생각했고, 우리가 끝났다고 생각했습니다.”라고 Denman은 말합니다. 그러나 다음 달에 호킹이 적응하는 데 어려움을 겪고 있다는 것이 다시 밝혀졌습니다. “그의 조수 중 한 명이”ASTER “고문이라고 불렀습니다.”라고 Denman은 회상합니다. “그들이 말했을 때 스티븐은 웃을 것입니다.”

Intel 팀이 Hawking을 기쁘게하는 버전을 내놓기까지 몇 달이 더 걸렸습니다. 예를 들어, Hawking은 이제 런던 스타트 업 SwiftKey의 적응 형 단어 예측기를 사용하여 문자를 입력 한 후 단어를 선택할 수있는 반면, Hawking의 이전 시스템에서는 사용자 인터페이스 하단으로 이동하여 목록에서 단어를 선택해야했습니다. Nachman은 “그의 단어 예측 시스템은 매우 오래되었습니다. 새 시스템은 훨씬 빠르고 효율적이지만이를 사용하려면 Stephen을 교육해야했습니다. 처음에 그는 그것에 대해 불평했고 나중에 야 그 이유를 깨달았습니다. 그는 이미 이전 시스템이 어떤 단어를 예측할지 알고있었습니다. 그는 자신의 단어 예측자를 예측하는 데 익숙했습니다. “인텔은 SwiftKey와 협력하여 Hawking의 많은 문서를 시스템에 통합했습니다. 따라서 어떤 경우에는 예측자가 다음을 기반으로 단어를 추측하기 전에 더 이상 문자를 입력 할 필요가 없습니다. 문맥. Nachman은 “”블랙홀 “이라는 문구는 타이핑을 필요로하지 않으며”the “를 선택하면 자동으로”블랙 “을 예측합니다. “검정색”을 선택하면 “구멍”이 자동으로 예측됩니다.”

Hawking”사용자 인터페이스의 새 버전 (현재는 상황 별 보조 인식 후 ACAT이라고 함) Toolkit)에는 Hawking에 말하기, 검색 또는 이메일에 대한 다양한 단축키를 제공하는 상황 별 메뉴가 포함됩니다. 그리고 새로운 강의 관리자는 그에게 강의 중 강의 시간을 제어 할 수 있습니다. 또한 호킹이 자신의 음성 합성기를 끌 수있는 흥미로운 기능인 음소거 버튼도 있습니다. 우드는 “볼로 스위치를 조작하기 때문에 먹거나 여행 할 때 임의의 출력을 생성합니다.하지만 임의의 연설을하고 싶을 때가 있습니다. 그는 항상 그렇게하고 때로는 완전히 부적절합니다. 그가 임의적으로 “xxxx”를 입력 한 적이 있는데, 음성 합성기를 통해 “sex sex sex sex”처럼 들렸습니다. “

Wood” 사무실은 Hawking “s 옆에 있습니다. 연구 라기보다는 워크숍에 가깝습니다. 벽 하나에는 전자 하드웨어와 실험용 프로토 타입이 쌓여 있습니다. 책상 위에는 인텔과 진행중인 프로젝트의 일부인 카메라가 있습니다. “아이디어는 스티븐을 향한 카메라를 갖는 것입니다.” 뺨의 움직임뿐만 아니라 다른 얼굴의 움직임도 포착합니다. “라고 Wood는 말합니다. “그는 턱을 옆으로, 위아래로 움직일 수 있고, 마우스를 운전하고 심지어 휠체어를 운전할 수도 있습니다. 멋진 아이디어이지만”곧 완성되지 않을 것입니다. “

올해 초 Hawking의 휠체어 제조업체가 제안한 또 다른 실험 프로젝트는 Hawking의 턱에 부착되는 조이스틱입니다. 우드는 “이는 스티븐이 매우 열망하는 것”이라고 말합니다. “문제는 Stephen”의 턱과 조이스틱 사이의 접촉이었습니다. 그는 “목 움직임이 없기 때문에 조이스틱을 연결하고 분리하는 것이 어렵습니다.” Wood는 WIRED에이 시스템의 최근 테스트 시험 동영상을 보여줍니다. 그 안에서 호킹이 휠체어를 타고 빈 방을 가로 질러 몸에 걸치고 시작하는 모습을 볼 수 있습니다. “보시다시피 그는 운전할 수있었습니다.”라고 Wood는 말합니다. “음, 일종의.”

Wood는 WIRED에게 Hawking의 음성 합성기의 유일한 사본이 들어있는 작은 회색 상자를 보여주었습니다. 그것은 그가 방문했을 때 1988 년에 Hawking에게 주어진 모델 인 CallText 5010입니다. 그것을 제조 한 회사 인 Speech Plus. 신디사이저 내부의 카드에는 텍스트를 음성으로 바꾸는 프로세서가 포함되어 있습니다.이 장치는 1980 년대에 자동 전화 응답 시스템에도 사용되었던 장치입니다.

“나는 Stephen”s의 소프트웨어 버전을 만들려고합니다. Wood는 “오래된 하드웨어 카드에 의존 할 필요가 없습니다.”라고 말합니다.이를 위해 원래 Speech Plus 팀을 추적해야했습니다. 1990 년 Speech Plus는 Centigram Communications에 매각되었습니다. Centigram은 Lernout과 Hauspie Speech Products는 2001 년 ScanSoft에 인수되었습니다. ScanSoft는 35 개의 사무실과 1,200 명의 직원을 보유한 다국적 기업인 Nuance Communications가 인수했습니다. Wood는이 회사에 연락했습니다. Wood는 “그들은 1986 년부터 Stephen의 목소리로 소프트웨어를 가지고있었습니다.”라고 말합니다. “Nuance의 백업 테이프에서 찾은 것 같습니다.”

호킹은 그의 목소리에 매우 애착 : 1988 년 Speech Plus가 그에게 새로운 신디사이저를 주었을 때, 목소리가 달랐기 때문에 그는 원본으로 교체해달라고 요청했습니다. 그의 음성은 “80 년대 초에 텍스트 음성 변환 알고리즘의 선구자 인 MIT 엔지니어 Dennis Klatt에 의해 만들어졌습니다. 그는 텍스트를 음성으로 번역하는 최초의 장치 중 하나 인 DECtalk를 발명했습니다. 그는 처음에 녹음에서 3 개의 음성을 만들었습니다. 여성의 목소리는 “아름다운 베티”, 아이의 “키드 더 키드”, 남성의 목소리는 “퍼펙트 폴”입니다. “퍼펙트 폴”은 Hawking의 목소리.

이 이야기는 WIRED UK 01.15 호에 처음 게시되었습니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다