サンフランシスコで開催されたマイクロソフトの開発者カンファレンス「Build」における数々の発表の中で、同社は「会話をプラットフォームとして」というコンセプトに多くの時間を費やしました。同社は、このコンセプトが人間の言語と機械知能を次世代のコンピューティングインターフェースとして導入すると考えています。Cortanaはこの広範な取り組みの中核を担いますが、実現には人工知能と機械学習、そして日常のコンピューティング体験、特に会話が行われる場面に現れるボットの活用が不可欠です。
より具体的な形で、MicrosoftはCortanaを強化し、より多くの場所でデジタルアシスタントを利用できるようにします。これにはSkype(本日より提供開始)も含まれます。Microsoftはまた、HoloLens向けのSkypeも発表しました。Microsoftによると、開発者ツールやクライアントアプリを含むこれらすべては、プレビューとして本日より提供開始されますが、すべてのプラットフォーム向けのSkypeクライアントはすでに利用可能です。
ここには非常に多くの点があり、その多くは未来志向であり、Buildの開発者エコシステムに大きく依存しています。ここでは、主要な側面といくつかの例をいくつか取り上げて解説します。また、このコンセプトについて頻繁に長々と語ってきたMicrosoft CEOのサティア・ナデラ氏は、パーソナルデジタルアシスタントがボットやアプリケーションプロセス(ボットは「新しいアプリケーション」になるとナデラ氏は推測していました)とユーザーに代わって対話する世界において、セキュリティと透明性が不可欠であることを強調しました。このコンテキストアウェアなアシスタンスは、現実世界と特定の会話の両方におけるユーザーの行動や好み、そしてコンテキストをより深く理解することに基づいています。
ナデラ氏は、これは人間対機械ではなく、むしろ人間と機械の戦いであるべきだと主張した。
どこにでもコルタナ
まず、Cortanaです。Microsoftは、パーソナルアシスタントをあらゆるデバイス(もちろんWindowsだけでなく)に組み込み、多くのアプリケーションに組み込むことを目指しています。例えば、CortanaはOutlookに統合され、(ユーザーの許可があれば)メールやカレンダーを確認し、メッセージの状況的コンテキストを理解できるようになります。会議について話しかければ、Cortanaが代わりにスケジュールを設定してくれるかもしれません。フライトについて話しかければ、Cortanaがカレンダーに追加してくれます。完了すると約束したタスクについて話しかければ、Cortanaが代わりにドキュメントを検索して送信してくれます。タクシーの領収書をメールで受け取れば、CortanaがそれをMicrosoft Expenseアプリに入力してくれます。
他にも、これらのタスクの一部は、Cortanaを搭載したAndroidやiOS上で、あるいはそれらと連携して実行できます。他のアプリにもCortanaが統合されれば、Cortanaが連携を仲介できるようになります。Microsoftはいくつかの例を示しました。その一つが、ランチタイムにカレンダーの予定と連動してオプションとして表示される、食品のピックアップ/デリバリーアプリ「Just Eat」です。(つまり、Cortanaはユーザーが特定のエリアで友人とランチを計画していることを認識し、おすすめのレストランを提案してくれるのです。)これらの機能は「プロアクティブアクション」と呼ばれ、開発者向けにプレビュー版への招待が提供されています。
Tom's Hardware の最高のニュースと詳細なレビューをあなたの受信箱に直接お届けします。
会話キャンバス
マイクロソフトは、これらのデジタルアシスタントやボットの多くが、Skype、SMS、WeChat、Slack、メールといった通常のコミュニケーションツールに浸透しつつあると見ています。Skypeはマイクロソフトの傘下であるため、デモンストレーションのほとんどはSkypeに焦点が当てられていました。例えば、あるSkypeインタラクションでは、マイクロソフトはビデオメッセージ(ビデオの下にSkype翻訳によって自動的に作成されたトランスクリプト付き)のデモンストレーションを行いました。会話(上司からのお祝いメッセージ)の一部として、地元のカップケーキ販売店からボットが起動し、ユーザーの位置情報を取得して配達する許可を求めました。配達予定時間まで提示されました。
他にも、ボットと対話してアイルランドのウェスティンのホテルの部屋を予約するなど、印象的な例はたくさんありますが、重要なのは、マイクロソフトが Skype や同様のツールを「会話キャンバス」として構想しており、開発者が Skype Bot SDK を使ってそれを実現することを想定している点です。
Bot Frameworkツールの一部として、Microsoftは開発者が組み込みのセマンティック辞書を使用して自然言語ルールをアプリ(つまりボット)に組み込む方法もデモしました。開発者が機械学習を通じてボットを徐々に賢くしていくためのツールも多数提供される予定です。
画像
1
の
2

認知サービス
Microsoftは、Cognitive Servicesの一部として、一連のAPI(合計22個)を発表しました。これらのAPIは、開発者がアプリケーションに組み込むことができる、より汎用的なインテリジェンスサービス(視覚、音声、検索、コンテキスト知識など)を基盤としています。Microsoftは、写真を撮影してそこに写っている物体を認識する機能だけでなく、CaptionBotと呼ばれる技術を用いて画像に関する情報を構築する機能など、このAPIの驚くべき初期応用例をいくつか披露しました。
あるデモでは、マイクロソフトがCRIS(カスタム認識インテリジェンスサービス)と呼ぶ技術を披露し、子供の話し声の音声テキスト翻訳と比較しました。当然のことながら、分析の結果は、子供の話し方に関する知識に基づいた、はるかに高い翻訳精度を示しました。
マイクロソフトによると、Cortanaは毎日100万件もの会話に利用されているという。iOS版やAndroid版のCortanaのインストール数や利用状況は不明だが、Google NowやAppleのSiriといったサービスと並んで、Cortanaの成長は顧客の関心の高さを示している。マイクロソフトは本日、音声検索エンジンという単なる小技の域を超えようとしていることを実証した。
フリッツ・ネルソンはTom's Hardware USの編集長です。