2018年02月08日06時00分

大量の非定型文書をAIで一括読み取り NTTデータのベンチャーコンテスト東京選考会開催

  • この記事をはてなブックマークに追加
  • Pocket

 2018年1月19日、NTTデータが主催する「第7回 豊洲の港から presents グローバルオープンイノベーションコンテスト」の東京選考会が開催され、スタートアップ9社が参加した。この選考会は世界各地で行なわれており、すでにインドや中国、シンガポールでは開催済み。東京の後も世界各地で開催され、その優勝者が3月22日に集ってグランドフィナーレにチャレンジする。

 まずは、NTTデータのオープンイノベーション事業創発室、残間光太朗室長のあいさつからスタートした。ベンチャー企業とNTTデータの顧客企業、そしてNTTデータの3者が、Win-Win-Winとなるようなオープンイノベーションを推進している。本イベントでは、賞金などは出していないが、NTTグループのネットワークとインフラを利用した協業に本気で取り組むのが特徴だ。挨拶の締めに、「Let's change the world together!」と残間氏は叫んで腕を突き上げた。

images
オープンイノベーション事業創発室の残間光太朗室長
images
世界各地でコンテストが開催されている

 審査員は、名古屋大学 大学院情報科学研究科情報システム学専攻、教授 工学博士の山本修一郎氏、多摩大学客員教授本荘事務所代表の本荘修二氏、Global Catalyst Partners Japan Managing Director & Co-founderの大澤弘治氏、株式会社NTTドコモ・ベンチャーズ Managing Directorの近藤安氏、一般社団法人オープンイノベーション促進協議会代表理事の西澤民夫氏、新日本有限責任監査法人シニアパートナー公認会計士の齊藤直人氏の6名が務めた。アワードは、残間氏が選ぶZAMMA AWARDが3社、審査員特別賞、最優秀賞の5社が用意された。

非定型の文書でも高精度の読み取りが可能な「FLAX SCANNER」

 最優秀賞を獲得したのは、Cinnamonの平野未来氏で、テーマは「人工知能を活用した文書読み取りエンジン」。「ホワイトカラーにとって面倒な書類系の作業などを人工知能にまかせることによって、人間は人間らしい働き方ができる世界を目指しています」と平野氏。

 ディープラーニングは動画や音声といったマルチメディアの解析に適している。しかし、近年では自然言語で利用できるディープラーニングの技術が出てきており、Cinnamon K.K.はそれを活用してホワイトカラーの面倒な仕事をなくすための人工知能のプロジェクトを多種展開している。今回は、そのうちの1つである文書読み取りエンジン「FLAX SCANNER」について紹介してくれた。

 既存のドキュメントからAIが必要な情報を抜き出してきて、それをデータベースに自動で入力する。ドキュメントはデジタルでも手書きの紙でもOK。ビジネスの現場では、多くのドキュメントが非定型だが、それでも読み取りが可能だという。紙の請求書をスキャンすると銀行口座や金額などを抽出したり、たとえば保険会社では、手書きの申込書から名前や生年月日を抽出したりしてくれる。

 「新宿区と渋谷区の住民票はフォーマットが全然違うんですが、ここが氏名、ここが住所といった分類ができるようになります」(平野氏)

 手書き文字の読み込み精度がとても高いのが特徴だ。研究データで99.2%、実データでも95~98%と高精度で読み込めるのだ。さらに運送業者の伝票のように、大量の枚数でも読み込みできるという。「FLAX SCANNER」は大企業向けのサービスとなっており、オンプレミスで提供したり、AIを利用するが汎用PCで対応が可能になっているなど、コストを抑えられるのも〇。ビジネスモデルはイニシャルのカスタマイズコストと月額のライセンス使用料となっている。

 「私たちはAIエンジニア500人構想を掲げており、2022年までに実現させようとしています。人工知能ラボをベトナムに持っておりまして、天才君たちを集めて人工知能のトレーニングをして、年間50人程度AIのエンジニアを育てています」(平野氏)

images
Cinnamon CEOの平野未来氏
images
抽出したい項目を設定すると、非定型の文書からその部分を読み込むことができる
images
年間50人のAIエンジニアを育てて、2022年に500人を目指す

分散したデータを横断的に活用できるようにする「SImount Box」

 審査員特別賞を獲得したのは株式会社シマントの代表取締役和田怜氏で、テーマは「FinTech版次世代金融決済:サプライチェーン情報を銀行決済の連携」。業務プロセス間で異なるデータの連携をマルチバリューデータベース技術で実現する「SImount Box」について紹介してくれた。

 マルチバリューデータベースとは、1つのレコードに複数のデータを収める技術で、その歴史はRDBやNoSQLよりも古く、枯れた技術とのこと。機能的には、構造化と非構造化データの両方に対応している。

 起業のきっかけは、和田氏が金融機関の営業企画で働いていた時の悩みだったという。

 「各システムから出てくる業績のデータを取りまとめて、経営に報告していました。毎月要件が変わったりするのでシステム化が困難で、ユーザーも企画部門の人間だけなので手作業で処理していたのですが、時間がかかります。これを自動化できれば、生産性があがるのではないかと思いました」(和田氏)

 会社の各部署にはさまざまなデータが散在していて、横断的に情報を連携したいときでも、データの加工が面倒なので活用が進まないことが多い。これを集約して、横断的な検索ができれば、有効活用できると考えたのだ。

 「現在サービスを提供させていただいているお客様では、銀行の経営企画の計数管理や業績報告の自動化や、個人部門と法人部門といったセクターが違うところの情報を連携させてより精緻なセールスをするのに使っていただいています。また、FinTechでは会計や決済のところのデータ連携はされていますが、調達から販売までの企業活動を全部繋げで連携させることができます」(和田氏)

images
株式会社シマント代表取締役和田怜氏(左)と審査員のひとり、名古屋大学大学院情報科学研究科情報システム学専攻教授の山本修一郎氏
images
部署ごとに情報がサイロ化されデータの加工に手間がかかっている問題があった
images
「SImount Box」にファイルを読み込ませると、RPA的なデータ連携が可能になる

関連記事

あわせて読みたい

最新のニュース

アスキーストア人気ランキング

アクセスランキング

Like Ranking