Microsoft Ignite 2016 Innovation Keynoteでは、主にAIやCognitive Services、BOT Framework、Hololensなどについてのお話でした。以下では、そのキーノートの概要を日本語でご紹介します。

イントロダクション

これからはまるで魔法のような技術について、お話します。

そして、どのように我々は人工知能(AI)を一般的にしようとしているかについて話します。

 

AIにおける目標は、我々のミッションである、「地球上のすべての人類と組織が、より多くのことを達成できるようにする」から始まっています。

 

AIは人々を上回るために推進しているわけではありません。より多くのことを達成できるようにするためにしているのです。

 

より深い話をする前に、我々が今までに話してきた内容をおさらいしましょう。

今朝のスコット氏のお話ではクラウドファースト、モバイルファーストについて語っていました。どのようにお客様はデジタル変革を成し遂げているかについて話してました。

 

これら3つの目標をつなげ合せているのが、人工知能です。

 

AIによって、大量のデータをインテリジェンス(知的財産)へと変換してくれるのです。

そのインテリジェンスは、Windows 10であれば、手書き認識で利用されています。または、Windows Hello機能での顔認証でも適用されています。他にもホログラフィックコンピュータなどでも実在しないオブジェクトを再現したりすることができます。

他にも、Office 365、コルタナ、Dynamics 365等のアプリケーションともインテリジェンスを融合しています。そして、これらを積み木のように皆様へ提供できている方法が、Azureによって提供されている開発ツール群です。それが我々のアプローチです。

 

もっと原点に遡ってみましょう。

情報へのアクセスを一般化させた一番最初の機械は、1450年代に登場した、聖書を印刷するための、印刷プレス機です。

 

それまでに発行された本の数は30000冊でしたが、印刷プレス機が登場した50年後には、1200万冊もの本が世に出回りました。この発明により、人類の情報作成の方法と、情報を得る方法が変わりました。

 

そして次に大きな影響を与えたのが、1989年に誕生した、World Wide Web(インターネット)です。

これによって大量のデータを生成するようになりました。

 

IDCの報告によると、2015年度では、10ゼタバイトものデータを我々は生成したのです。

 

そしてもっとびっくりしたのが、2025年では、180ゼタバイトものデータを生成すると予測されています。

もはや、ギガ、テラ、ペタ、エクサ、ゼタ・・・と次はなんと命名すれば良いのか分からないぐらいのデータが爆発的に生成されるようになってきているのです。

 

今必要なのは、これら大量のデータを理解するための「時間」が必要なのです。

 

我々は情報の生成、配信、アクセス方法において、技術を素晴らしく活用し、構築に成功しました。そして今、我々は考え直す時に差し掛かろうとしています。データをインテリジェンスへと変換するところが必要なのです。

 

マイクロソフトでは、それをAIで実現しようとしています。

実現するために、主に4つの軸が存在すると我々は考えています。

その4つとは、「エージェント」、「アプリケーション」、「サービス」と「インフラストラクチャー」です。

エージェント

我々が言う、「エージェント」とは、コルタナのことを意味しますが、私はコルタナを3つ目のランタイムだと考えています。デスクトップやモバイルのオペレーティングシステム(OS)レイヤーがあり、そしてインターネットのレイヤーがあり、コルタナはその上に、人を必要とする情報やアプリケーションへと導くためのコンピュータインタラクションとの中間役であると考えます。

 

新しいカテゴリーのランタイム、インタラクションであると考え、テキスト入力、音声入力に対応し、貴方のことを深く理解し、仕事や家族を把握し、世界も理解しています。デバイスが中心なのではなく、あなたなのです。どこへ行っても利用可能です。Android、iOS、Windowsなのかは関係ないのです。人生で使う、すべてのアプリケーションと利用できるのです。

 

コルタナではだいぶ進んできたと思います。毎月1億3300万ユーザーに利用頂き、116カ国で160億もの質問に答えてきました。そして、SDKを提供することでいろんなアプリで日々コルタナが利用可能になっているのです。

 

コルタナを担当しているシニア製品マーケティングマネージャーのLaura氏による登壇

コルタナは私について、私の組織、私の周りの世界についても学習することで、私の日々の暮らしを支援してくれます。

 

コルタナとのインタラクションは、ロックされたPCの前で声をかけるだけで始まります。

「コルタナさん、次の私の会議はなに?」

 

コルタナ:「次のミーティングは、『Show Off My Skillz』です」

 

コルタナはOffice 365とも連携し、次の会議情報を教えてくれ、会議が重複している場合なども教えてくれます。

 

もし会議の参加者の詳細が知りたければ、クリックするだけで、コルタナは自動的にLinkedInの情報を参照し、表示してくれたり、彼との次のミーティングを教えてくれます。

 

新しい機能としてリリース予定なのは、コルタナが機械学習と連携し、メールで送信した約束事をリマインドとしてタスクに追加してくれます。これによって未然にタスクの期日超過を防いでくれます。

 

コルタナは、私が気になっていることも最新の状態で表示してくれます。

 

新たに健康機能として、「ヘルスインサイト」では、会議などの情報と健康状態の情報を組み合わせて、例えば「移動中はファーストフードを食べ過ぎている」や、「今週のジムの予定は出張で参加できない」等がわかります。ただ分かるだけではなく、どの時間にリスケジュールできるかも教えてくれます。

 

他のデバイスと連携し、スマートフォンで受信したテキストSMSも確認し、そのまま返信もできます。

 

Wunderlistともコルタナを連携することができるので、簡単にタスクを追加することができます。

 

Power BIと連携することで、ターゲットやマイルストーンへ到達したときに、通知することもできるようになります。

 

手書きした付箋から直接電話をかけたり、リマインドを追加したりすることもできます。

フライト情報なども最新のものを表示してくれます。

アプリケーション

それでは次に、アプリケーションについてお話しましょう。

コルタナのデジタルアシスタントのようなことを、全てのアプリケーションでどのように実現するのかお話したいと思います。

 

SwiftKeyを例にしましょう。AndroidやiOSで人気の高い、サードパーティー製のキーボードアプリです。

彼らは3億人ものユーザー数を抱えています。

つい先日、キーボードの予測方法をニューラルネットワークへと切り替えました。

つまり、従来のように数文字予測するだけでなく、入力しようとしている意味そのものも予測しようとするのです。よって、キーボードはデバイスに紐付くのではなく、あなたに紐付くのです。

 

MileIQはロケーション検知アプリで、業務上必要とする走行距離において、IRSへの税金を還付申請するための計算をしてくれます。このアプリでは、ロケーション情報と運転情報の組み合わせにより、インテリジェントなアクションが取れるようになりました。

 

我々は、このようなアプローチを、Office 365でも取り入れたいと考えています。Office 365の移行はクラウド化するだけではありません。プライバシーを維持した状態でデータを活用することで、インテリジェントなアクションを取れる環境を提供することが真の移行であると考えます。

 

既に様々な方法で取り入れられています。その一例が「フォーカス受信トレイ」です。

メールに対するトリアージをしてくれます。それはPCでも、スマートフォンでもトリアージしてくれます。

個人単位でカスタムのニューラルネットワークモデルを持ち、受信トレイの内容を学習することで、時間の有効化を図っているのです。

 

そして、Skype Translatorです。ここでは、特徴検出、音声合成、機械翻訳の3種類の研究が組み合わさいます。この製品は、Skypeデータと深層強化学習、ニューラルネットワークの組み合わせの結果、実現したのです。既に8カ国語に対応し、学習方法として片方の言語を学ぶと自動的にもう片方も学習します。

 

更にWordやOutlookにも技術が組み込まれています。その1つが文章校正機能です。従来のシソーラスをベースとしたものではありません。

 

WordやOneNoteによって、ディスレクシア(学習障害)を持つ方の支援もしてくれます。

 

MyAnalyticsでは、時間の過ごし方、費やすべき時間の使い方を提案してくれます。

 

これらのような次のレイヤーのインテリジェンスをOffice 365に組み込んでいるのです。

 

でもそれだけでは終わりません。我々は、更にDynamics 365へも拡張しようとしています。

 

例えば営業についてお話しましょう。従来、営業では様々なものをモデルかし、リード、案件、営業担当や得意先など、すべてモデル化し、データを蓄積してきました。ですが、営業において、1つ大きな問題があります。それは、ほとんどの営業業務は、CRMシステムの外で発生します。

つまりインテリジェンスの目標は、CRMシステム内に蓄積されたデータを模索するだけでなく、外の世界へもつなげる必要があります。

 

我々はDynamics CRMの一部として、11月にリレーションシップアシスタント機能を追加し、従来のCRMシステムに革命を起こそうと考えています。CRMシステムにログインすると、アクションが取れるカード形式で、外部で発生している情報を取得し、お客様で発生している変化や、LinkedInで発表された担当顧客の部署変更に関しての情報を取り入れたりして、インタラクションがとれるようになります。

 

Microsoft Graphとの組み合わせで、従来メールからの問い合わせをコピペする必要があったのが、これからはCRMシステムへログインするだけで、検出されたメール内容のトリアージをするだけで良いのです。

例えば見積依頼や、案件の可能性のあるメールを自動的にアラートとして検出してくれるのです。

 

そしてCRMに蓄積されているデータ自身でも、アラートを受け取ったりすることができます。

 

顧客サービスでも同じようなことが言えます。従来であれば顧客サービス用のデータモデルを構築し、問い合わせケースの管理方法や、エスカレーション、ワークフロー等をモデリングしてきました。ですが、実際の顧客サービスは、お客様からの問い合わせから業務が始まります。

そこでマイクロソフトでは、本日より、米国ではバーチャルアシスタントをsupport.microsoft.comで開始しました。

 

問い合わせ内容は必要に応じて、人間にエスカレーションされます。

 

こちらが実際に表示される問い合わせ管理画面です。このように左側では会話が表示され、右側では会話を元に、解決方法が提案されるのです。

このように、カスタマーサービスはより効率よくなり、顧客満足度も上昇します。

 

我々はOffice 365やDynamics 365等のアプリケーションを、ビジネスを作り上げる基盤として、みなさまでも同じようなことが実現できるように支援していきます。

 

サービス

Cortana Intelligence Suiteでは、あらゆる業種に変革をもたらしています。

 

我々は、Cortana Intelligence Suiteの1つとして、新たにBOT Frameworkを追加しました。

ウェブサイトやモバイルアプリと同じように、どのようなシーンでもBOTのインターフェースを提供することを想定しています。

BOTを作るには、必要な基盤として、自然言語処理や、ダイアログ管理が必要ですが、それらをすべて組み込んだのが、このBOT Frameworkです。我々はこのフレームワークを汎用的にしたことで、1つのコミュニケーション方法に限定せずに提供できます。今年のBUILD2016で発表した後、45000人もの開発者によってBOTフレームワークが利用されました。

 

今回我々はNFLともパートナーシップをとります。

NFLでは大量のデータを持っており、それを活用するアプリの1つがファンタシーフットボールです。次期ではこのファンタシーフットボールとBOT Frameworkを組み合わせて、新しい遊び方を実現できると考えています。

(著者追記:ファンタシーフットボールとは、好きな組み合わせの選手で仮想のチームを構成し、その仮想のチームと実際の現実世界の各プレイヤーのパフォーマンス結果を基に、仮想のチームのパフォーマンスを採点するゲームのことです。日本になじみのある野球で例えると、パリーグやセリーグの選手を好きなように選び、その週の各個人の打率等を組み合わせて最高得点を競い合うようなイメージです)

 

これが実際にBOT Frameworkで開発した、ファンタシーフットボールの画面です。

 

プレイヤーの比較をすることができます。

 

BOT Framework上で、チームを構成できます。

 

次にお話したいのが、「Cognitive API」です。

BUILD2016での発表以来、これらAPIは10億回以上もコールされました。

たった1コールで、世界基準の認知サービスが利用できるのです。

 

つい2週間前には、我々はSpeech認識において6.3%のエラー発生率を実現し、世界新記録を達成しました。

それがSpeech APIとして、今、提供されているのです。

画像認識においてもDeep Residual Learningを採用することで152階層あるニューラルネットワークを構築し、世界新記録を達成しました。

 

実際にこれらCognitive Servicesを活用した企業例として、Uber社を例にしたいと思います。

今週彼らが発表した最新アプリでは、運転手のセルフィー(自画像)を利用した活用例をご紹介します。

 

「認証中」

 

「認証完了」

 

今週発表したリアルタイムID認証では、従来では実現出来なかったセキュリティリスクの回避が可能になりました。

 

この認証により、実際の運転手と、アプリに登録されているアカウント情報を照合し、本人確認ができるようになりました。

 

これによって複数のセキュリティ保護が実現できます。

登録されているアカウントの不正利用からドライバーを保護し、乗車客は認証されたドライバーであることが確実にわかります。

 

次にVOLVO社とのお話をしたいと思います。

自動運転よりも前に解決するべき課題が「ながら運転」です。(他のことをしながら運転すること)

我々が日々車内に持ち込むデバイスが、事故の元となっています。

そこでVOLVOでは、ながら運転を認識し、運転手にフィードバックを与えられる方法を模索してきました。VOLVOでは、Cognitive Servicesを利用して、シミュレーターを開発しました。人を認識するだけでなく、感情を認識することで、ながら運転を認識するのです。

 

VOLVOでは、ながら運転による事故の防止方法を研究してきました。

 

我々のシミュレーターでは、コネクティッドカーよりも先のステップを踏み、人工知能やCognitive Servicesを組み合わせて様々なシナリオを分析しようとしています。

 

乗車した瞬間から、機械工学的にどのように運転しているかを監視します。合せてカメラを経由してCognitive Servicesからの感情分析や集中度合いを監視します。

 

そして、これらのデータを組み合わせることにより、運転状況や、パフォーマンス、安全性などを評価できます。

 

疲労:なし

感情:笑顔

ながら運転:なし

 

疲労:なし

感情:笑顔/無表情

ながら運転:携帯電話

 

これからご紹介する次の例は、Cognitive ServicesとMixed Reality(MR)を活用した、魔法のような

組み合わせです。我々はPininterest社とLowe’s社(住宅リフォーム・生活家電チェーン)とのパートナーシップにより、小売業界に革命を起こそうとしています。

従来であれば、店舗でサンプルを見て、家(の内装)と照らし合わせて、もう一度店舗に戻って、ということを永遠に思えるような頻度で繰り返します。

 

実際に(家の)リフォームを進める前に、一般的にアイデアをPininterest等を活用して、集め始めると思います。では、そのアイデアをそのまま、改装する前の段階で、リフォームの内容が確認できてしまうとどうでしょう?それを今、我々はLowe’s社と実現しようとしています。

 

Hololens担当プログラムマネージャー、Jennifer氏による登壇

 

リフォームは多額の投資がかかり、非常に大きなプロジェクトです。そこでLowe’s社はすべてのお客様を対象に、個人に特化した体験を提供したいと考えました。

実際に店舗へ入る前に、お客様は好みのデザインをソーシャルアプリなどで収集しています。従来では、このデータを小売業で活用することが課題となっていました。

 

今回店舗向けにアプリを開発しました。

ここでは、お客様の一覧が確認できます。

 

お客様からは事前に気に入っているキッチンのデザインをPininterestから共有頂いています。

 

シンプルに見えますが、実際にはCortana Intelligenceがバックグラウンドで実行されており、共有された画像を基に、どのようなデザインの傾向かを事前に蓄積した数千枚ものキッチンデザインと照合し、提案してくれます。

ここでは、「The Cornerstone」というデザインが83%の確度で適しているということがわかります。

 

タップすることで、更にカスタマイズすることができます。

 

サンプルやスウォッチだけでは、新しいキッチンがどのようなイメージになるかは分かりません。ですが、HololensとCortana Intelligence Suiteによるインタラクティブな提案アプリの組み合わせにより、実寸大で確認することができるのです。

 

お客様:「カウンターの配色だけど、サンプルでは気に入ってたけど、実寸大で見ると少し暗いね。別の候補を表示してくれる?」

 

店員:「もちろん!候補をカード形式で表示しますね」

 

お客様:「キャビネットと同じ配色にしてみるよ」

 

お客様:「全体的に明るくなったから、壁の色は少し暗くしてみるわ」

 

お客様:「アイランドも追加してくれる?」

店員:「はい、追加しますね」

 

先ほどの提案で、お客様の同意を得て録画した情報を基に、Hololensテレメトリーデータを活用することで、一番長時間見ていたエリアをヒートマップで表すことができるのです。

 

この情報にCognitive Servicesの情報を組み合わせて、更に提案内容の好感度を確認することもできます。

 

不満に思われていた部分について、詳細を確認します。画面右上に、一番発言頻度の多かった文字が表示されており、この情報で、何が問題かが確認できます。このようにCognitive Servicesを組み合わせることで簡単に顧客インサイト情報が確認できるのです。

インフラストラクチャー

最後の軸として、「インフラストラクチャー」についてお話したいと思います。

 

私が一番魅惑しているのは、CPUのスケール化と、AIを開発するにあたり、どのフレームワークでも開発者は利用できることです。

 

CPUに加え、GPUもAzureで利用できるようになりました。

 

我々は更に次のステップを考え、ニューラルネットワーク等をCPUやGPUだけでなく、シリコンで動くようにしました。それがFPGAです。これにより、あなたのニューラルネットワーク等を新たな速度感で実行できるようになったのです。

 

Microsoft ResearchからDoug氏の登壇

我々はより短い応答時間を実現するために、FPGAの研究に投資してきました。FPGAはプログラム可能なハードウェアです。ハードウェアの速度を保ちつつ、プログラムのような柔軟性を持っています。これにより、すばらしい速度、スケーラビリティと効率性をグローバル規模で得ることができます。

 

(画像では分かりませんが、FPGAが搭載されている、仮想マシンでは、素早く画像が次の画像へと切り替わっています)

 

次は1440ページある、この「薄い」本の翻訳で比較してみましょう。

 

それではロシア語から英語に翻訳してみます。

右側ではFPGAを4枚搭載した環境で、消費電力は20%低い環境です。

ご覧の通り、8倍速く処理できるのです。

 

これだけではありません。それではWikipediaの英語記事500万件を対象に見てみましょう。我々が保有する、ほぼ全てのリソースを投入すると、たった10分の1秒で全て翻訳できるのです。

 

我々のシステムは、従来のスーパーコンピュータの10倍ものスピードでAIの演算処理を達成できます。つまり、数年前では不可能であった演算も可能になります。既に一部のCognitive Servicesをこのファブリックに移行し始めています。

 

他社ではより小さなスケールで進めていますが、マイクロソフトは世界で初めて、グローバルスケールでのPost CPU処理に対応したハイパースケールクラウドを構築しました。

 

みなさんに我々がどのようにして、AIをより多くの方々に利用いただけるように進めているかが確認頂けたと思います。CortanaやOffice 365とDynamics 365でのインテリジェンスの提供、Cognitive Services、BOT Frameworkや機械学習を全ての開発者へ提供し、そして世界初のスーパーAIコンピュータの構築です。

 

最初にお話したところへ戻ります、我々のテクノロジーが主軸ではありません。あなたのパッション、そしてイマジネーションと我々が提供するテクノロジーでみなさんが何を構築できるかが重要なのです。

 

最後に

情報を指先まで提供したように、我々はAIでも同様のことを実現したいと考えています。

どこでも、何にでも、誰にでも、インテリジェンスを提供したいと考えています。

 

ご静聴ありがとうございました。