Intelがスティーブンホーキングに声をかけた方法

1986年、シカゴのスティーブンホーキング。

AP

ホーキングは病気で、自分の誕生日パーティーに参加できませんでした。彼は数週間後、ケンブリッジ大学の応用数学および理論物理学科の彼のオフィスでインテルの専門家に会いました。 5人のチームには、Experience TechnologyLabのディレクターであるHorstHaussecker、Anticipatory ComputingLabのディレクターでプロジェクトヘッドのLamaNachman、インタラクションデザイナーのPeteDenmanが含まれていました。 「スティーブンはいつも私にインスピレーションを与えてくれました」と車椅子も使っているデンマンは言います。 「首を骨折して麻痺した後、母は出てきたばかりの「時間の簡単な歴史」のコピーをくれました。車椅子の人はまだ素晴らしいことができると言っていました。振り返ってみると、それがどれほど予言的であるかがわかります。

Intelチームが自己紹介した後、Hausseckerが主導権を握り、彼らがそこにいた理由と計画について説明しました。ハウセッカーは20分間話し続け、突然ホーキングが話しました。

「彼は私たちを歓迎し、私たちがそこにいたことを彼がどれほど嬉しかったかを表現しました」とデンマンは言います。 「私たちの知らないうちに、彼はずっとタイプしていました。約30語のあいさつ文を書くのに20分かかりました。それは私たち全員を私たちのトラックに止めました。それは心に訴えました。私たちは今、これが非常に多くなることに気づきました思っていたよりも大きな問題でした。」

当時、ホーキングのコンピュータインターフェースは、以前のソフトウェアからのアップグレードであり、Words Plusによって設計された、EZKeysと呼ばれるプログラムでした。画面と基本的な単語予測アルゴリズム。カーソルがキーボード全体を行または列ごとに自動的にスキャンし、頬を動かしてカーソルを停止することで文字を選択できました。EZキーを使用すると、ホーキングはWindowsでマウスを制御して操作することもできます。彼はコンピューター内の他のアプリケーションです。彼はFirefoxでWebを閲覧し、メモ帳を使用して講義を書きました。また、Skypeで使用するWebサイトも持っていました。

Intelチームは、ホーキングの古風なシステムの激変を想定していました。これには、新しいハードウェアの導入が含まれます。 「ジャスティンは、顔のジェスチャー認識、視線追跡、ブレイン・コンピューター・インターフェースなどのテクノロジーを使用できると考えていました」とナフマン氏は言います。 「当初、私たちは彼にこれらのワイルドなアイデアをたくさん与え、多くの既製のテクノロジーを試しました。」多くの場合、これらの試みは失敗しました。彼のまぶたが垂れ下がっていたため、視線追跡はホーキングの視線に固定できませんでした。 Intelプロジェクトの前に、ホーキングは彼の脳波を読み取り、潜在的に彼のコンピューターにコマンドを送信することができるEEGキャップをテストしていました。どういうわけか、彼らは十分に強い脳信号を得ることができませんでした。「私たちは画面上で文字を点滅させ、脳の反応を登録するだけで正しい文字を選択しようとしました」とウッドは言います。 「それは私と一緒にうまくいきました、そしてスティーブンはそれを試しました、そしてそれはうまくいきませんでした」。彼らは「十分に強い信号対雑音比を得ることができませんでした。」

“私たちが彼を観察し、彼の懸念に耳を傾けるほど、彼が本当に求めていたのは、通信速度の向上に加えて、彼のコンピューターとの対話を改善する新機能であることに気づきました」とNachman氏は言います。 。インテルラボに戻って数か月の調査を行った後、デンマンはホーキングに送信する10分間のビデオを準備し、実装したい新しいユーザーインターフェイスのプロトタイプを示し、フィードバックを求めました。 「私たちは、彼のシステムの使用方法を大幅に変えることはないと感じたが、それでも大きな影響を与えると感じた変更を思いついた」とデンマンは言う。変更には、ホーキングが文字を削除するだけでなく、ユーザーインターフェイスのステップをナビゲートするために使用できる「戻るボタン」などの追加が含まれていました。予測語アルゴリズム。単語を入力するのではなく、次々と単語を選択できる次の単語のナビゲーション。

デンマンの見解では、主な変更点は、ホーキングが抱えていた最大の問題に取り組むプロトタイプでした。デンマン氏は、「スティーブンは、必要なキーに隣接する文字を押すことで、間違ったキーを押すことがよくありました。彼は、文字を見逃し、戻って、もう一度文字を見逃し、戻ってきました。それは耐え難いほど遅く、彼は欲求不満になるでしょう。」その特定の問題はホーキングの完璧主義によって悪化しました。 「彼にとって、自分の考えを正確に正しい方法で表現し、句読点を完全に正しくすることが非常に重要です。彼は、完璧主義者になるのに十分な忍耐力を身に付けました。彼はメッセージの要点を伝えたいだけの人ではありません。彼は本当にメッセージを完璧にしたいと思っている人です。”

キーヒットの失敗に対処するために、Intelチームはホーキングを解釈するプロトタイプを追加しましたワープロや携帯電話で使用されているものと同様のアルゴリズムを使用した、実際の入力ではなく、意図。 「これはあなたの信仰を置くのが難しい相互作用です」とビデオは説明しました。 「iPhoneが最初に市場に参入したとき、人々は予測テキストについて不平を言ったが、すぐに不信感が喜びに変わった。問題は、慣れるのに少し時間がかかり、システムに仕事をさせるために制御を解放しなければならないことだ。この機能を使用すると、速度が向上し、コンテンツに集中できるようになります。」

ビデオの結論:「興奮や不安のレベルは?」その年の6月、ホーキングはデンマンがいるIntelLabsを訪問しました。彼のチームは、当初ASTER(ASsistive Text EditoRの略)と呼ばれる新しいシステムを彼に紹介しました。「現在のソフトウェアは少し古くなっています」とデンマン氏は彼に語った。「まあ、それは非常に古くなっていますが、あなたはとても以前は使用していたので、次の単語の予測が機能する方法を変更しました。「文字が離れていても」、毎回正しい単語を取得できます。

「これは以前のバージョンからの大幅な改善です」とホーキングは答えました。「私はそれが本当に好きです。」

彼らは、ホーキングのコンピューターに新しいユーザーインターフェイスを実装しました。デンマンは彼らが正しい道を進んでいると思った。 9月までに、彼らはフィードバックを受け取り始めました。ホーキングは新しいシステムに適応していませんでした。複雑すぎました。戻るボタンなどのプロトタイプや「キーヒットの失敗」に対処するプロトタイプは混乱を招き、廃棄する必要がありました。 「彼は世界で最も優秀な人物の1人ですが、彼が現代のテクノロジーに触れていないことを忘れることはできません」とデンマンは言います。 「彼にはiPhoneを使用する機会がありませんでした。私たちは、世界で最も有名で賢い72歳の祖父に、テクノロジーと対話するこの新しい方法を学ぶように教えようとしていました。」

スティーブンホーキングが使用したコンピューターと音声合成装置のハウジング、1999年。

科学博物館フォトスタジオ/ゲッティイメージズ

デンマンとチームの他のメンバーは、問題について別の考え方をしなければならないことに気づきました。「私たちは、巨大なネットを捨てるという従来の意味でソフトウェアを設計していると思っていました。できるだけ多くの魚を捕まえるように努めてください」とデンマン氏は言います。 2012年の終わりに、Intelチームは、ホーキングが自分のコンピューターとどのようにやり取りしたかを記録するシステムをセットアップしました。彼らは、スティーブンタイピング、疲れたときのスティーブンタイピング、マウスを使用したスティーブン、ちょうどいいサイズのウィンドウを取得しようとしているスティーブンなど、さまざまな状況を網羅した数十時間のビデオを録画しました。 「私は何度も映像を見ました」とデンマンは言います。

「時々走りますそれは4倍の速度であり、それでも何か新しいものを見つけます。」

2013年9月までに、ホーキングの大学院アシスタントであるジョナサンウッドの助けを借りて、ホーキングのユーザーインターフェイスの別の反復を実装しました。コンピューター。 「私たちはそれを持っていると思いました、私は私たちが終わったと思いました」とデンマンは言います。しかし、翌月までに、ホーキングが適応に苦労していることが再び明らかになりました。 「彼の助手の一人はそれを「ASTER」拷問と呼んだ」とデンマンは回想する。 「彼らがそれを言ったとき、スティーブンはニヤリと笑うでしょう。」

インテルチームがホーキングを喜ばせるバージョンを思い付くまでには、さらに何ヶ月もかかりました。たとえば、HawkingはロンドンのスタートアップSwiftKeyの適応単語予測子を使用して、文字を入力した後に単語を選択できるようになりましたが、Hawkingの以前のシステムでは、ユーザーインターフェースの下部に移動して、リストから単語を選択する必要がありました。 「彼の単語予測システムは非常に古いものでした。新しいシステムははるかに高速で効率的ですが、それを使用するためにスティーブンを訓練する必要がありました。当初、彼はそれについて不平を言っていましたが、後で私はその理由に気づきました。彼は以前のシステムがどの単語を予測するかをすでに知っていました。彼は自分の単語予測子を予測することに慣れていました。」IntelはSwiftKeyと連携し、Hawkingのドキュメントの多くをシステムに組み込んだため、場合によっては、予測子がに基づいて単語を推測する前に文字を入力する必要がなくなりました。環境。 「「ブラックホール」というフレーズは「入力する必要はありません」とNachman氏は言います。「「the」を選択すると自動的に「black」が予測されます。 「黒」を選択すると、「穴」が自動的に予測されます。”

Hawkingの新しいバージョンのユーザーインターフェイス(Assistive Contextually Awareの後、現在はACATと呼ばれていますToolkit)には、Hawkingに話したり、検索したり、電子メールを送信したりするためのさまざまなショートカットを提供するコンテキストメニューが含まれています。また、新しい講義マネージャーは、講演中の配信のタイミングを制御できるようにします。また、ミュートボタンもあります。これは、ホーキングが音声合成装置をオフにできるようにする興味深い機能です。 「彼は頬でスイッチを操作するので、食事や旅行の場合、ランダムな出力を作成します」とウッド氏は言います。「しかし、ランダムなスピーチを思いつくことを好む場合があります。彼はいつもそれをしていて、時にはそれはまったく不適切です。彼がランダムに「xxxx」と入力したとき、それは彼の音声合成装置を介して「セックスセックスセックスセックス」のように聞こえたのを覚えています。

ウッド」のオフィスはホーキングの隣にあります。 「研究というよりはワークショップのようなものです。1つの壁には電子ハードウェアと実験的なプロトタイプが山積みされています。机に取り付けられているのは、Intelとの進行中のプロジェクトの一部であるカメラです。「カメラをスティーブンに向けるというアイデアです」頬の動きだけでなく、他の顔の動きも拾うための顔です」とウッドは言います。 「彼は顎を横に上下に動かし、マウスを運転し、車椅子を運転する可能性さえありました。これらはクールなアイデアですが、「すぐには完成しません。」

今年初めにホーキングの車椅子のメーカーによって提案された別の実験プロジェクトは、ホーキングのあごとに取り付けられるジョイスティックです。彼は車椅子を独立してナビゲートすることができます。「それはスティーブンが非常に熱心なことです」とウッドは言います。 「問題はスティーブンのあごとジョイスティックの接触でした。彼は「首の動きがないので、ジョイスティックを出し入れするのは難しい」。 Woodは、このシステムの最近のテストトライアルのビデオをWIREDに示しています。その中で、ホーキングが空の部屋を横切って車椅子を運転しているのを見ることができます。 「ご覧のとおり、彼はなんとかそれを運転することができました」とウッドは言います。 「まあ、ある種。」

ウッドは、ホーキングの音声合成装置の唯一のコピーを含む小さな灰色のボックスをWIREDに示しました。これは、1988年にホーキングが訪れたときに与えられたモデルであるCallText5010です。それを製造した会社、SpeechPlus。シンセサイザー内のカードには、テキストを音声に変換するプロセッサが含まれています。これは、1980年代に自動電話応答システムにも使用されていたデバイスです。

「私はスティーブンのソフトウェアバージョンを作成しようとしています」 「これらの古いハードウェアカードに頼る必要がないように」とWood氏は言います。そのためには、元のSpeechPlusチームを追跡する必要がありました。1990年にSpeechPlusはCentigramCommunicationsに売却されました。CentigramはLernout and Hauspie Speech Productsは、2001年にScanSoftに買収されました。ScanSoftは、35のオフィスと1,200人の従業員を擁する多国籍企業であるNuance Communicationsに買収されました。ウッドはそれに連絡しました。「彼らは、1986年からスティーブンの声でソフトウェアを持っていました」とウッドは言います。 「Nuanceのバックアップテープで見つかったようです。」

ホーキングは彼の声に非常に執着していました。1988年にSpeechPlusが彼に新しいシンセサイザーを与えたとき、声が異なっていたので、彼は彼らにそれをオリジナルと交換するように頼みました。彼の声は、80年代初頭に、テキスト読み上げアルゴリズムのパイオニアであるMITエンジニアのデニスクラットによって作成されました。彼は、テキストを音声に変換する最初のデバイスの1つであるDECtalkを発明しました。彼は最初に録音から3つの声を出しました。女性の声は「BeautifulBetty」、子供の声は「Kit the Kid」、男性の声は彼自身の「PerfectPaul」に基づいています。「PerfectPaul」はホーキングの声。

このストーリーは、WIREDUKの01.15号に最初に掲載されました。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です