週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

KDDI×Prokldsのガチすぎるプログラミング講座に潜入

聴覚障がい者がプログラミングで情報保証を自ら実現できる未来

2018年04月04日 15時00分更新

聴覚障がい者に対するKDDIの熱い取り組み

 3月17日と18日の2日間、東京・飯田橋にあるKDDI本社のセミナールームにて、「音声認識IoTを作ろう! ~自分たちの力で世界を変える第一歩~」という、中高生向けのプログラミング講座が開催されました。

 この講座に参加したのは、都立中央ろう学校の生徒10名。まったく聞こえない、少し聞こえる、昔は聞こえていたなど各人で聴力は異なるのですが、生徒のみなさんは聴覚に障がいがあります。

 KDDIのCSR・環境推進室は、聴覚障がい者向けIT教育支援を進めており、4年前からこういったプログラミング講座を開催しています。講座自体は今回で5回目。前回に引き続きKDDIと組んで実際に講座を担当しているのが、子供からシニアまでのプログラミング講座などを運営しているProkids(プロキッズ)です。

 この講座の特徴は、土日の2日間、朝から夕方までみっちりとスケジュールが組まれている点。プログラミング講座というと、簡単なビジュアルプログラミングツールを使ってプログラミングの基礎の基礎を数時間で学ぶという内容が多いですが、KDDI×Prokidsの講座は全然違うのです。スパルタです。

 最終目標は、生徒自らがRaspberry PiとGoogle Cloud Speech APIを利用して音声認識IoT機器を開発し、それを使って模擬授業をすること。プログラミングは初めてという生徒もいたので、個人的には最初、「何言ってるののかわからない」と戸惑うほどのハードルの高いゴールだと感じました。

生徒に手渡されたプログラミングキット。ワンボードマイコンの「Raspberry Pi」と、専用ケース、USB接続のマイク、ACアダプター、iPadのほか、プログラミング用のPCとしてMacBookが貸し出されました

丁寧なテキストを頼りにAjaxプログラムにも取り組む

 1日目は午前9時から講座がスタート。まずは、KDDIの総務部でCSR・環境推進室に所属する荒川 誠氏の挨拶から始まりました。実はこのプログラミング講座、どういった内容にするかは事前に生徒にヒアリングして決めています。

KDDIの総務部でCSR・環境推進室でマネージャーを務める荒川 誠氏(右)。KDDI主催のプログラミング講座は、生徒の意見を吸い上げて内容を決めているため、毎回かなり実践的なプログラムになっています

 今回の内容が音声認識IoT機器の開発に決まったのは、「自分が好きな番組のテロップがない」という生徒の発言がキッカケだったそうです。この生徒さんはアイドルが好きなのですが、深夜に放送されているアイドル番組の中には字幕放送に対応していない番組があり、アイドルがどういうことを話しているかを理解できずにずっと不便に感じていたそうです。この不便をプログラミングで便利に変えていくわけですね。

この講座ではもはやおなじみのProkids代表の原 正幸氏。取材するたびに講座で取り扱うプログラミングのレベルが上がっているのですが、初心者でもわかりやすいように作り込まれたテキストがあるので安心です

 1日目はウェブ関連のプログラミングを学ぶ内容でした。具体的には、ウェブページの仕組みの理解からHTMLファイルの作成、CSSファイルの読み込み、Raspberry Piを使ったウェブサーバーの構築まで、要所要所で休憩を挟みながらもぶっ通しで続きました。

 最終的にはAjaxのプログラムを追加してタイマー処理なども実装。文章だけみると、プログラミング初心者には理解不能と感じるかもしれませんが、当日配布されたテキストがかなり丁寧に作り込まれていたこともあり、生徒のみなさんは苦労しながらもプログラミングを楽しんでいるようでした。1日目は18時で終了したのですが、プログラムがうまく動かず居残りした生徒もいました。

Raspberry Piを専用ケースに入れて小型PCに組み立てる作業もありました。講師はもちろん、生徒同士でもコミュニケーションを取りながら作業を進めていました

Google Cloud Speech APIを利用した音声認識プログラムを開発

 翌2日目も朝9時にスタート。最終目標である「Google Cloud Speech API」を利用した音声認識IoT機器のプログラミングを進めていきます。

2日も朝9時に講座がスタート。まずは、KDDDでCSR・環境推進室長を務める鳥光健太郎氏(左)の挨拶から

 この音声認識IoT機器の仕組みをざっくり紹介すると、必要なのはRaspberry PiとMac、マイク、そしてネット回線。Raspberry Piに接続したマイクから音声を取り込む→取り込んだ音声をRaspberry Piがクラウド上の米グーグル社の音声認識APIに渡す→音声認識APIから戻ってきたテキストデータをRaspberry Piがウェブサーバーに渡す→Macで該当するウェブページにアクセス――という流れです。文章で書くとかなりややこしいですが、実際に完成したIoT機器を試してみたところ、話した言葉がほぼ瞬時にテキスト化されてMacの画面に表示されるようになります。

今回のプログラミング講座のキモになる「Google Cloud Speech API」。継続利用には年額300ドルかかりますが、無料トライアルでもそのパワーを十分に体感できます

 なお、今回の音声認識に利用する「Google Cloud Speech API」を継続的に使うには年間300ドルの料金がかかります。今回はプログラミング講座で扱うため「無料トライアル」を利用しています。

講座終了後も継続的にプログラミングを学びたい生徒が続出

 生徒のみなさんは数時間かけて、試行錯誤しながらなんとか音声認識IoTを完成させました。そのあとは発表会となり、生徒それぞれが自作のプログラムのとプログラミング講座について感想を話しました。

 まずは、山田さん(男、高2、野球部)は、ウェブサーバーの構築に手間取ったとのこと。1日目に居残って調べたところ、その原因は本来大文字であるべき部分が小文字で書かれていたことが原因だとわかったそうです。Macを触るのも初めてだったそうですが、プログラミングの基礎を学べて満足だったとのこと。

山田さん(男、高2、野球部)

作成したプログラム。UIはシンプルです

 池田さん(女、高2、生活文化部)もやはりMacは初めて。パソコン関係はまったく守備範囲外だと思っていたそうですが、今回の講座を通じて興味が出てきたそうです。プログラムと友達関係に例えていたので印象的でした。プログラムの1つのミス→すべてアウト→訂正→OKという流れは、一度喧嘩する→仲悪くなる→謝る→仲直りすると似ているとのこと。

池田さん(女、高2、生活文化部)

「音声表示」というアプリを開発。アイコンはオリジナルです

 佐竹さん(女、中3、卓球部)は、中学生で唯一の参加者であり、今回の音声認識IoTを開発するキッカケになった生徒です。講座を受けた感想は、はじめはプログラミングなんて自分だけではできないと思い込んでいたけど、説明書を読んでそのとおりにやれば自分でもできるということがわかってよかったとのことでした。

佐竹さん(女、中3、卓球部)

イラストを使ったUIを備えており完成度が高かったです

 大平さん(男、高2、卓球部)は、プログラミングが大変だったけど楽しかったとコメント。すごく使えることがわかったので、今後はRaspberry Piをもっと広めていきたい思ったそうです。

大平さん(男、高2、卓球部)。アプリのアイコンは、口をモチーフにしたとのこと

 大石さん(男、高1、野球部)は、もともとプログラミングには興味があったので、将来の進路として考えてみたいと思ったとのことでした。

大石さん(男、高1、野球部)。プログラミングは初めてだったとのことですが、かなり楽しめたそうです

 升川さん(男、高3、卓球部)は、パソコンでこういったことが実現できることを改めて知ったとのこと。今回の講座で世界観が広がったそうです。

升川さん(男、高3、卓球部)。コードエディターの「Atom」にコードを入力する作業に苦労したとのこと

 福田さん(女、高2、卓球部)は、自分の将来のためにやるからやりがいを感じることができた。集中力が鍛えられたとのこと。これまでは機械がよくなれば生活も便利になると思っていたが、さまざまな視点からの意見がないと便利にならないことがわかったそうです。今後の目標としては、おばあさんのために家事の手伝いがやりやすくなるアプリを作りたいとのことでした。

福田さん(女、高2、卓球部)。今後の目標は「聞こえない人が健聴者と同じぐらいのタイミングで笑えるようにしたい」とのこと。出来上がったIoT機器の処理速度を目の当たりにすると、近い将来現実になりそうな気がします

 トリは宮崎さん(男、高2、卓球部)。このプログラミング講座には4回連続で参加している常連で、KDDI社内のトイレや休憩スペースの場所まで知り尽くす男。今回の講座でウェブページの作り方を学べたのがよかったとのことでした。

宮崎さん(男、高2、卓球部)。KDDI×Prokidsのプログラミング講座の常連。今後は日常会話のデータをサーバーに飛ばして学習させて変換精度を高めていきたいとのこと

情報保障が進めば視覚障がい者の職業の幅が広がる

 生徒の発表のあと、東京都立中央ろう学校の木村先生の模擬授業が始まりました。木村先生によると、聴覚に障がいのある高校生にとって、音声言語の可視化(情報保障)が進路選択に当たって大きな障害になっているとのこと。現在、大学における情報保障の手段としては主にノートテイクが用いられているものの、これは大学側にとって大きな負担だそうです。

東京都立中央ろう学校の木村先生。自らも自腹でRaspberry Piなどを買い込み、生徒と一緒にプログラミングを学んでいました。Google Cloud Speech APIの認識精度と実用性の高さにかなり感動されていました

 ノートテイクというのは、ボランティアの大学生が教授や講師が話をした内容をノートに要約筆記することで情報保障を図る取り組みです。人の力に頼ることもあり、聴覚障がいのある高校生に対して十分な受け入れ態勢を整えることができないことを理由に、多くの大学から入学を断られているのが現状だそう。とはいえこの現状は、学生の進路選択、ひいては職業選択の幅を狭めてしまうことであり、学校としても大きな課題だと認識しているとのことでした。

筑波技術大学が実施している情報保証の取り組み。予算が潤沢な国立大学などを中心に環境整備は進められているようですが、ろう学校の生徒の進学先はまだまだ限定されているのが現状です

 さらに木村先生は「今回の講座はRaspberry PiとGoogle Cloud Speech APIを教材に使った高度な内容でしたが、生徒にとって切実な課題であるためどの生徒も集中して楽しく取り組むことができました。今回2日間で学習しことを学校に持ち帰り、生徒と共に実用化に向けた試用・改善に取り組んでいこうと考えています」と話してくれました。参加した生徒からも継続的に学んでいきたいとの声が多く聞かれました。

 実際に、木村先生はもちろん、一緒に参加していたろう学校の情報科の先生も、自腹でRaspberry Piを買い込んで生徒と一緒に音声認識IoTを作るという熱の入りようでした。授業で実用的に使えるようにあれば、生徒との意思疎通がより深まることは間違いないでしょう。

2日の最後には生徒一人一人に修了証が手渡されました

 ちなみに今回の講座には、二人の手話通訳者が交代しながらつきっきりで講座の内容を学生に伝えていました。現状、こういった長時間のイベントではコスト的な問題で手話通訳者の確保が難しいこともあり、イベント自体を気軽に開催できないというジレンマもあるようです。また話している内容を手話で完全に伝えることも難しいとのこと。音声認識IoTが実用化されれば、登壇者の発言をテキスト化するという用途にも使えるはずです。

 なお、今回の講座で利用したGoogle Cloud Speech APIは、教科書などを読み上げる場合は問題ないのですが、話し言葉はまだまだ苦手で誤変換が目立ちました。機械学習によってウェブ上のテキストを読み込んで認識精度を高めているのが原因かと思われます。しかし今後、多くの人がこのAPIを使うようになって話し言葉に対する認識精度が高まれば、情報保障を図るための機器、手話通話者を補完する機器として十分に機能すると感じました。こういった高度なテクノロジーを盛り込んでくる、KDDIとProkidsの本気すぎるプログラミング講座。来年の開催がいまから楽しみになってきました。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう