国内の”知の最前線”から、変革の先の起こり得る未来を伝えるアスキーエキスパート。KDDI総合研究所の帆足啓一郎氏による人工知能についての最新動向をお届けします。
世界中のビジョナリーやクリエイターが集まる一大イベント「SXSW Interactive」に、昨年に引き続き参加した。昨年のSXSWは、その直前に発表されたAlphaGoの登場で人工知能関連の議論が大きく盛り上がったが、今年はそれに比べるとそこまで大きな話題はなかった。それゆえ、引き続き盛り上がりを見せる人工知能について、各セッションでどのような議論が行なわれるのか、筆者としても注目しながら参加した。本記事では、昨年・今年と連続して人工知能関連セッションの聴講を中心に参加した観点からSXSWでの議論を紹介し、これらの議論が示唆する人工知能の時代における共通課題について考察する。
AlphaGoの鮮烈な登場から1年が経過
昨年のSXSW Interactiveでは、人工知能がテーマになったセッションが数多く開催されていたが、これらのセッションの中で大きな話題として取り上げられたのが、SXSWの直前に行なわれたAlphaGoと囲碁の世界チャンピオン イ・セドルとの対局である。ご存知の通り、この五番勝負ではAlphaGoがイ・セドルを4勝1敗で破ったわけだが、この対戦の前までは「人工知能が囲碁で人間に勝つには10年必要」という専門家の予測が出されるなど(参照:2016年1月WIRED掲載記事)、人工知能が人間に太刀打ちできるのはまだまだ先という論調が目立っていた。AlphaGoの鮮烈な登場は、この雰囲気を一変させるほど衝撃的な話題として拡散し、人工知能が人類の能力を超えるシンギュラリティがいよいよ到来するようにも見えた。
昨年はこのニュースが世界中を駆け巡っている最中にSXSWが開始されたこともあり、人工知能に関するセッションのパネリストの多くがこの話題に言及。やがて来るであろうシンギュラリティの時代を踏まえた議論が活発に行なわれた。セッションによる温度差はあったものの、筆者の印象では、総じて「人工知能がいずれ人類にとって脅威になる」という論調を強く感じた。そして、その脅威に備えるために人類は何をすべきか? といった危機感をあおる議論が多く行なわれていたように見えた。
なお、昨年のSXSWの様子について筆者が寄稿した記事(2016年6月掲載)はこちら:「弁護士の仕事も奪われる対象に SXSWで見た人工知能最前線」
人工知能脅威論から現実的な議論へ
そんなSXSWから1年が経過し、依然として人工知能に関する話題は連日メディアを賑わしている。しかし、1年前は恐れをもって捉えられることが多かった人工知能に対し、以下の2つの現実が一般認識として広く浸透していった。
- シンギュラリティは当面(少なくともここ1~2年の間には)来ない
- 用途を限定すれば人工知能関連技術の活用は極めて有用
また、この1年の間に発信された人工知能関連のニュースについても、Googleを中心に数多くの先進事例が発表されたものの、1年前のAlphaGoを越えるような衝撃をもって受け止められたニュースはなかった。
今年のSXSWは、人工知能に関する盛り上がりが(よくも悪くも)定常化した雰囲気の中での開催となった。昨年のようなわかりやすい話題がない分、筆者としては、どのような議論が繰り広げられるのかが明確に見えていない状態でSXSWに臨んでおり、本音をいえばどんな期待をすれば良いのかがわからない心理状態でオースティンに入っていた。
だが多数の人工知能関連セッションを聴講した結果、筆者の主観ではあるが、SXSWでの人工知能関連の議論に大きく2つの方向性を見出すことができた。その方向性とは、「人間と人工知能の共存」と「人工知能活用の広がり」である。
以下、これらの方向性について、それぞれ象徴的なセッションの議論の様子を紹介する。
SXSWセッション議論の方向性1:人工知能と人間の共存
関連セッション1:「AI on the Horizon: Challenges, Directions, Futures」
Microsoft Researchのフェロー・Eric Horwitz氏による、現在の人工知能関連研究の紹介と、今後に向けての課題提起のセッション。どちらかというと初心者向けに人工知能の動向の概観を示すセッションで、筆者にとっては既知の情報が多かったが、同氏が説明した課題のうち、以下の2点は現実的な脅威として捉えるべきと感じた。
- 人間による人工知能改ざんの可能性
- 人工知能による人間の操作
上記1は、悪意のある学習データを人工知能に与えることにより、人工知能による判断結果を変化させる研究事例に関する紹介。具体的には、敵対的学習(adversarial learning)という技術を応用し、AIの学習データに人間が認識できない形で改ざんされたデータを紛れ込ませることにより、AIの学習結果を意図的に変更する研究が紹介された。たとえば「STOP」という道路標識の画像に対し、人間には認識できないランダムかつ微小なノイズを付加しながら「進め」と学習させることにより、「STOP」標識に対して「進め」と判断する人工知能を作ることができる。
また、上記2では、人工知能が提示する情報にしたがい、人間の行動を簡単に変容させることができる事例が紹介された。具体的には、とあるユーザーのTwitterのタイムラインに流れる情報、およびこれらの情報に対する反応を分析することにより、そのユーザーの嗜好などを学習。ユーザーがクリックしたくなる偽ニュースの見出しを生成・提示することにより、実際にリンクをクリックさせるといった実行動を容易に起こさせることができる。
上記のように、人工知能自身の脆弱性、そしてその人工知能にしたがって簡単に踊らされてしまう人間の実態が明らかになっている。こうした状況を踏まえ、人工知能を作り、利用する人間の倫理に関する議論がアカデミアでは活性化してきているが、技術の進化のスピードも早く、人類にとってはすでに待ったなしの状態になっていることを実感した。
関連セッション2:「We Sued For Your Bots」
人工知能(実際にはウェブサイトのクローリングと解析)の技術を活用し、米国内のサービスの公平性を検証しようとしている市民運動家や研究者によるセッション。筆者が今回のSXSWで参加した中では珍しく聴衆が少ないセッションだったが、その分、パネリストとフロアとの議論が活発に交わされていた。
少し長くなるが、本セッションの背景を説明する。
多民族国家であるアメリカでは、人種や性別などによって不利益を被らせる差別的行為はかなり強いタブーとして捉えられている。この問題は、オンラインでサービスを提供している事業者でも同様である。たとえば、アパートメントなどの契約を斡旋するウェブサービスでは、アクセスするユーザーの人種によらず、公平な提案をすることが求められる。しかし、実態としてはサービス提供時に人種差別的な発想が織り込まれているサービスは数多く存在する。
こうした実態を詳らかにするため、人工知能の技術を活用する動きが出てきている。具体的には、オンラインサービスを人工知能(実際にはウェブクローラーのようなものであり、厳密には「人工知能」とは呼びにくいものだが……)にアクセスさせることにより、申請している人種などの情報による差別的なサービス提供が行なわれていないかという監視活動を進めている人や団体があり、本セッションのパネリストも含まれている。
本セッションのパネリストが提起する課題は、こうした人工知能による監視活動の阻害要因の1つになっている「Computer Fraud and Abuse Act」(CFAA)という米国の法律である。CFAAは、簡単にいうと計算機への不正アクセスを制約することを目的とした法律だが、解釈によっては、人工知能による監視活動が違法行為と受け止められてしまう懸念がある。パネリストは、この法律を改善するための活動(訴訟など)を進めており、セッションではその活動の経緯報告、および現状についての議論が行なわれた。
筆者が(自身にとっては専門外の)本セッションを通じて得られた気づきは、パネリストたちが問題提起している差別行為に対し、人工知能が寄与する可能性である。人種差別的な行動が、サービス提供者によって恣意的に行なわれているのであれば、サービスの是正を求めるのは当然である。しかし、こうした意図とは無関係に集められたビッグデータに基づき学習し、サービス提供をする人工知能が現れた場合、その責任の問い方は難しい問題である。
実は、このような事例は既に出現している。たとえば、象徴的な例としてはGoogleの画像認識技術が黒人の写真に対し「ゴリラ」と誤認識した問題がある。前述したオンライン不動産サービスの例をとっても、サービス提供者が意図的に黒人向けに劣悪な物件を進めるロジックを実装することは論外だが、過去に蓄積された取引のデータの解析によって、所得が低い地域の物件の契約者に黒人などの特定の顧客が多いという結論が導出され、その結論にしたがって物件を提案するといった挙動を起こす人工知能が出現することは容易に想像できる。このようなデータ・ドリブンな人種差別的行為をどう考え、どのように是正するべきかは今後由々しき問題になりえる。
これらを踏まえ、人工知能における公平性について議論するための研究者のコミュニティー(FAT/ML。Fairness, Accountability and Transparency in Machine Learningの略)が、本セッションのパネリストから紹介された。筆者はこの問題自体は認識していたものの、すでにここまで活発な議論が行なわれているという実態を初めて知った。日本は現時点ではアメリカほどの多人種国家ではなく、この手の問題にはうといが、特にグローバル市場への進出することを意識した場合は不可避かつ重要な課題として捉えるべきである。
関連セッション3:「HI + AI: What’s the Future of Intelligence?」
今回のSXSWでは、人工知能を「拡張知能」として捉えた議論が多く見られた(たとえば「Augmented Intelligence: The Next-Gen AI」など)。シンギュラリティ前の人工知能の限界を踏まえた上で、人間の知的活動をサポートする形で活用すべきという、現状に基づいた極めて現実的な議論である。本セッションは、こうしたセッションの中でも出色のものであった。IT系の人工知能の専門家に加え、バイオおよび脳に関するスタートアップの創業者という異分野の専門家がパネリストとして登壇し、人工知能以降の人類の未来についての議論が行なわれるという、極めてSXSWらしいセッションだったからである。
本セッションの議論は多岐にわたったが、筆者にとって印象的だったのは、人工知能を含む先端技術と人類の今後に関する議論である。パネリストの1人である、汎用人工知能の開発を目指す「Viv」の創業者・Adam Cheyer氏からは、現状の人工知能の限界を踏まえた上で、雑事を人工知能に任せるなど、人間と人工知能で役割を分担することによる住み分けという現実的な考えが示された。
これに対し、ほかのパネリスト2人からは、それぞれの立場から人類+人工知能の将来像が披露された。脳ハッキングを目指すKernel社の創業者・CEOのBryan Johnson氏は、人工知能というソフトウェアだけでなく、人間の脳そのものをプログラミングし、人工知能と融合させることが人類存続の道であると主張。Ginkgo Bioworks社の創業者・Reshma Shetty氏は、近未来に人類が火星に行くような状況を想定すると、人工知能や脳を進化させるだけでは不十分であり、バイオテクノロジーによって人体そのものを変化させていく必要があるとの考えを示した。また、脳・身体ともに、現時点の研究開発がいわゆる障害者向けが中心になっていることに対する不満も吐露された。言い換えると、「脳・身体ハッキングは、障害者のみならず、健常者にも認められるべき『権利』である」という主張である。
タブーを恐れない議論は(特に)アメリカ人は得意としているが、人工知能・脳科学・バイオテクノロジーなど多岐にわたるテクノロジー領域で最先端を走るパネリストが同じステージに上がり、議論を交わす場はSXSWならではといえる。当然ながら結論が明確に示されたわけではないが、自身の考えを発散させ、深めるための良いインプットとなった。
SXSWセッション議論の方向性2:人工知能活用の広がり
関連セッション4:「Can a Film Made by a Machine Move You?」
続いては映像制作プロダクションであり、カンヌライオンズにも定期的に作品を発表している「Zoic Studios」他が取り組んだ、人工知能関連技術を使った映像コンテンツ自動制作についてのセッション。一般論として、人間が人工知能に対して勝ると言われている能力の1つが「創造力」とされている。この前提にチャレンジすべく、ある楽曲のプロモーションビデオ(PV)をすべて人工知能に制作させたらどうなるか? という試みについて紹介したセッションである。
音楽PVの制作には、楽曲の解釈、PVのコンセプト作成、俳優のキャスティング、撮影、編集などのプロセスがあるが、今回のチャレンジではこれらのプロセスをなるべく人工知能、しかも既存の技術・アプリのみを活用して実現しようというポリシーで進められた。人工知能に任せられたPV制作の過程の一部を紹介すると、
- 楽曲の歌詞の解釈:IBM WatsonのTone Analyzer(テキスト文章に基づく感情推定API)に当該楽曲の歌詞を入力し、楽曲内の感情の推移を推測
- 楽曲を歌う歌手の心情の解釈:本楽曲の歌手に脳波センサーデバイス「Muse」を装着し、楽曲を聴かせることにより、楽曲中の脳波の推移を測定
- PVコンセプト作成:マイクロソフトのチャットボット「りんな」にPVの構成要素に関する質問を与え、その回答を元にコンセプトを決定(例:主人公の性別、PVの舞台、登場人物の服装など)
- 俳優オーディション:候補となった俳優に上記の「Muse」を装着し、楽曲を聞かせて得られた脳波の推移を、歌手のものと比較し、最も相関が高い俳優を選択
- 撮影:楽曲内の感情の推移などを元に計算された撮影角度などをドローンに入力し、カメラを搭載して撮影を自動制御
……という具合で、人間の介在は可能な限り排除されていた。
完成されたPVは本セッションの最後に「世界で初めて」(パネリスト談)上映された。そのクオリティーについては、製作者も決して満足しているわけではなく、筆者が後日話を聞いた映像クリエイターの専門家も同意見だった。だが、素人目線には計算機が完全自動で制作したものとは思えないくらいの出来栄えだった。
それよりも筆者にとって衝撃的だったのは、今回の取り組みのために新しい技術を開発せず、既存のアプリのみを使用したことである。
既存の技術の組み合わせは人間によって行なわれていたものの、それぞれの能力が限定される人工知能を融合することにより、現在の人工知能が不得手な「創造的仕事」が行なわれたという事実は、人類と人工知能の未来の協業の1つの方向性を示す成果と感じた。本セッションのタイトルの通り、そう遠くない将来、人工知能が作ったコンテンツに対して人間の心が動かされる時代が来てしまうかもしれない。(なお、今回のSXSWの後に、本制作の様子を紹介したドキュメンタリー映像がYouTubeに公開されている)
関連セッション5:「Giving a Face to AI」
ニュージーランドのスタートアップ企業、Soul Machinesの創業者であり、映画「アバター」の視覚効果を作ってオスカー賞を受賞した経歴もあるMark Sagar氏単独のセッション。同氏がプレゼンで使っていたノートPCにインストールされていた「Baby X」という、リアルなCGによって表現された赤ちゃんのアバターのライブデモなどが紹介された。
従来のデータドリブンな人工知能と異なり、「Baby X」では脳内の活動、顔の表情筋、身体の動作などをそれぞれ別々のニューラルネットワークでモデル化。そして、入力インタフェースであるPCのカメラやマイクから得られたさまざまな情報に対する反応が、赤ちゃんアバターのリアルな表情や仕草によって表現されている。たとえば、赤ちゃんに向かって笑いながらあやしたりすると赤ちゃんが笑いながら反応し、PCカメラの視野から外れたら悲しい表情でぐずりはじめる……といったアバターのリアルな動作に対し、目の肥えたSXSWの聴衆も思わず声をあげて驚いていた。
現在の人工知能に関連して話題となっている深層学習(ディープラーニング)は、大規模なデータとふんだんな計算機環境に基づく学習が前提となっている。しかし、人間がたとえば猫という概念を理解するために数百万匹の猫を見る必要がないように、実際の人間が知識を獲得していく過程は深層学習のそれとは大きく異なるものである。本セッションで紹介された「Baby X」は、あくまでシミュレーションではあるものの、実際の人間の活動がモデル化されたニューラルネットワークによって作られているという点においては、より人間に近い人工知能といえる。
トップダウン議論からボトムアップイノベーションへの転換
上記で紹介したセッションのうち、前半のセッションは人間と人工知能が共存するために解決すべき課題として、悪意ある人間への対応、法律・ルールの制定などが取り上げられた。このような議論は、人工知能関連の研究者や政府レベルでも行なわれており、たとえばIEEEが白書として公開しているものもある。
こうしたトップダウンな議論に対し、先進的な取り組みを通じて、人間社会がこれから直面する課題を投げかけるのがSXSWである。人工知能の活用についても、筆者のような研究者にとっての常識(たとえば「人工知能は創造的な仕事ができない」など)にとらわれないクリエイターたちによる発表や、多分野にわたるビジョナリーらによる議論を通じて、人工知能の可能性自体が広がっていく様子を感じた。
シンギュラリティ論に代表される、人工知能が人間社会に及ぼす影響に関する議論は、どうしても大所高所からの観点になりがちである。そのため、多くの人にとっては敷居が高く、理解しにくいイメージがあるだろう。しかし、実際には新しいコトの多くはユニークな発想を持つ個人が起こしている。そんな尖った人材が一同に会するSXSWに昨年から連続して参加することにより、人工知能の領域において、大所高所からボトムアップなイノベーションへの転換が進んでいることを実感した。
奇しくも、昨年世間の話題をさらったAlphaGoが、プロ棋士のカケツとの3番勝負に全勝し、囲碁界から「引退」して次のステージに進むことが先日発表された。「最強」の人工知能が、いよいよゲームから実世界の課題解決に乗り込んでいく。ここから次のSXSWまでの間、人類は人工知能をどのように活用し、どんな成果を生んでいくのか。そして、来年のオースティンでどんな議論が交わされるのか、今から楽しみでならない。
アスキーエキスパート筆者紹介─帆足啓一郎(ほあしけいいちろう)
1997年早稲田大学大学院修了。同年国際電信電話株式会社(現KDDI株式会社)入社。以来、音楽・画像・動画などマルチメディアコンテンツ検索の研究に従事。2011年、KDDI研究所のシリコンバレー拠点を立ち上げるため渡米し、現地スタートアップとの協業を推進。現在は株式会社KDDI総合研究所・知能メディアグループ・グループリーダーとして、自然言語解析技術を中心とした研究開発を進めるとともに、研究シーズを活用した新規事業創出に取り組んでいる。電子情報通信学会、情報処理学会、ACM各会員。経済産業省「始動Next Innovator 2015」選抜メンバー。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります