週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

放送業界を事例としてデータ基盤と管理のあるべき姿を語る

テレビ東京、スペクティ、ネットアップが語るデータ活用とDXの課題

2019年10月24日 07時00分更新

人材不足を考えればクラウドだが、コスト面でオンプレミスという選択も

 後半のパネルディスカッションは登壇者に加え、ネットアップの平松貢氏が参加。まずは現状のデータ基盤がどうなっているか? クラウドとオンプレミスの使い分けはどうなっているのか?という質問を登壇者にぶつける。

後半は登壇者に平松貢氏が加わったパネルディスカッション

 スペクティはオンプレミスとパブリッククラウドを両方とも使っており、機械学習のモデル生成はオンプレミスで行ない、サービスの展開はパブリッククラウドを使っているという。理由はやはりコスト。サーバーの管理や増設を考えれば、クラウドですべて完結するのが望ましかったが、パブリッククラウドの機械学習サービスは従量課金で高価だったため、現在はオンプレミスも併用している。

「(スペクティは)データ量が増えるタイプのビジネスなので、コストも上がるし、苦労もしています。大型コンピューターを所有するのはスタートアップでは荷が重いのでクラウドがなければ始めれなかったのも事実だが、クラウドは従量課金なので調整するのも大変。正直、手探りでやっています」(村上氏)

 パブリッククラウドに関しても、当初はAWSを用いていたが、最近はコスト面で有利なAzureを採用しているし、導入実績が増えてきたGCPにも興味あるという。「複数のクラウドを利用しつつ、オンプレミスも視野に入れる」という方向性を考えれば、ネットアップのデータ ファブリックの方向性にはまさに合致しそう。

「われわれのストレージOSをまさにas-a-Service化したのですが、AWS、Azure、GCPで同じデータ管理を実現しています。スナップミラーのような高速な差分同期やコールドデータのみをクラウド上で階層管理させたり、全体を可視化する仕組みを提供しています。マルチクラウドを標榜するのであればぜひご検討いただきたい」(近藤氏)

 テレビ東京でも用途にあわせてオンプレミス、クラウドなどさまざまなインフラを利用しており、データも分散しているのが正直なところだという。

「データ基盤の定義が、機械学習やデータ分析用の基盤なのか、大容量用のストレージなのかによりますが、おおむね業務システムはオンプレミスで、視聴データやVOD系など新しい toC サービスはクラウド。外部サービスと連携したデータ活用はTreasure Dataで、分析用のデータウェアハウスはAmazon RedshiftやBigQueryなどを使っています。目的ごとに最適化しているが分散して管理コストが多くかかっているので、全体方針を作っていきたい」(段野氏)

 とはいえ、クラウドでのネックはコスト。特に放送事業者としては、サイズの大きい動画データのアーカイブや解析サービスはコスト的に難しい。PoCから先に進まないのも、24時間・365日での運用コストがネックだ。そのため結局オンプレミスになる例も多いが、深刻な人手不足を考えれば、管理負荷の低いクラウドに行くのは必然だという。段野氏は放送業界でのエンジニア不足についてこう語る。

「放送業界は技術領域が変わってきてます。今までは放送設備の設計・保守、放送運行支援が重要でしたが、ビジネスモデルが変わってきて同時に求められるエンジニアや情シスの役割も変わってきています。今後必要となるエンジニアは感覚的には、『ユーザー3割、SIer・ベンダーが7割』どころか、1:9くらいでエンジニアは不足しています。われわれもデータエンジニアの採用も力をいれていますが、良い人はビッグデータを持っている会社にいってしまうんです。まさにスペクティさんのエンジニアがほしい(笑)」(段野氏)

 ここまでは放送業界だったが、他業界でのデータ基盤はどうなのだろうか?ネットアップの二人からは以下のような回答が戻ってきた。

「日本市場におけるデータ基盤としては、現状サービスプロバイダーがユーザー向けに構築する事例がもっとも多いです。ユーザー企業としては製造業が多く、生産工場でデータ基盤を構築し、改善活動を進めています。ただ、AI向けのデータ基盤はまだまだ研究レベルがほとんどです」(平松氏)

ネットアップ合同会社 ソリューション技術本部 執行役員 本部長 平松貢氏

「端的に言えば、自動車業界はデータ基盤を構築することが多い。コネクテッドカーやHPCを含めた分析基盤で、オブジェクトストレージやデータレイク、Hadoop/Sparkストレージを使ってもらっています。特にコネクテッドカーやMaaSのプロジェクトでは膨大なデータが必要になるので、データ基盤が重要になります」(近藤氏)

レガシーシステム、サイロ化、ライフサイクル管理の苦労

 続いてデータ活用に向けての障壁を聞いた。まず村上氏や段野氏からはレガシーシステムが多く、クラウドでのデータ利用が意外と難しいという点が挙げられた。

「街頭に設置されているカメラは、放送局にはつながっているけど、インターネットにはつながっていないので、実は放送局の人がデータをアップロードしています。放送業界に限らず、ネットにつながってない機材は多いので、データがあるのに活用できていないことも多い」(村上氏)

「社会インフラを担う会社では、セキュリティの観点でインターネットにつながれない閉域ネットワークも多いので、クラウド利用の障壁は意外と高い。オンプレミスのレガシーシステムもAPIがないためデータ収集は難しい。バッチ処理で定期取得すると、リアルタイムは失われます。クラウドにつなぎ込むのも専用線が必要になるので、クラウド事業者ごとに専用線が必要になります」(段野氏)

 また、段野氏が挙げた組織とデータが紐付く「サイロ」の話は、近藤氏曰く「ほとんどそうではないか」とのこと。ネットアップとしては全体戦略をきちんと練った方がいいという提案はしているが、データガバナンスが進むかどうかは「正直、就任されたCIO次第」(平松氏)だという。

「正直、SaaSの弊害は感じています。導入が簡単すぎて現場で導入した結果、シャドーIT化され、IT部門が統制をとれない状況になりつつあります。データを活用して新しいことをやろうとしても、現場の状況を知らなければ、うまく統合して分析できなかったり、そもそもデータを取り出すこともできません。なんのためにデータを活用しようとしているのかの統制が必要です」(段野氏)

 さらにデータのライフサイクル管理についても苦労が多い。あとで使うからという理由で、なんとなくデータを保管し、必要なデータが探せなくなったり、保管やバックアップにコストをかけてしまう例は枚挙にいとまがない。

「弊社は創業して長いわけではないのでデータは捨てずに保管しています。ただ、機械学習用にタグ付けされたデータはすぐに陳腐化してしまう。5~10年経ったらタグ付けされていないアーカイブから映像データを探すの苦労している放送局と同じ道をわれわれもたどりうる。なにを捨てるのか、どう活用していくかというのは、やはりきちんとした戦略に基づいて進めるべきだと思います」(村上氏)

「DMBOKにもありますが、そもそも整理されていないのであればデータとしては価値はありません。多すぎて管理できないのであれば、そのデータは必要なのかという疑問に行き着きます。データ活用の目的が決まっていないデータなのであれば、コストを考えて、むしろ保管しないという選択はありだと思います」(段野氏)

データ活用に向けたストレージの進化、今後へのアドバイス

 もちろん、いくら戦略があっても、これらをきちんと適用していくのは大きな負荷がかかる。これに対してネットアップは可視化や自動化、最新技術の導入などで新しいストレージの価値を提案していくという。

「膨大なデータでも、きちんと可視化できるという価値は提供していきたい。オブジェクトストレージのように、ファイルやボリュームに対してある程度、自動的に属性情報をタグ付けし、検索可能にするようチャレンジしていきたいし、セキュリティや暗号化の状態もチェックできるようにしたい」(近藤氏)

可視化できる価値を提供したいと語るネットアップ近藤氏

「ネットアップは25年以上にわたってストレージを扱っていて、数十ペタを超えるお客様もいます。データ量が増えると、計算が追いつかないということは起こりえるので、われわれはつねに最新インフラ技術を製品に取り入れ、パフォーマンス、容量、管理性を進化させていく。具体的にはクラウドに連携して容量を拡張したり、NVMeやフラッシュメモリを適正な価格で提供したり、重複排除のようなデータ削減技術など提供している」(平松氏)

 最後、村上氏と段野氏にデジタルトランスフォーメーションに向けたデータ活用の提案やアドバイスを聞くと、こんな答えが返ってきた。

「最近のWebメディアの編集部では、リアルタイムにPVが見えるようになっている。単なる数字の羅列であるデータは可視化してあげると、いろいろなアイデアが出てくるはず。社内に埋もれてるデータをなんらかの形で見える化することから始めてみてはいかがでしょうか?」(村上氏)

「DXに向けてITを一新するのは難しいが、データに関してはオープンに使っていくという方針を決めてしまえば、使うデータを集中管理していくのはわりとやりやすいことが多い。まずは社内にあるデータをオープンにしていくという方針を打ち出すことが最初にやるべきことだと思います」(段野氏)

 事業会社、サービスプロバイダー、そしてベンダーという3つの立場からデータ活用について語り尽くした2時間半。デジタルトランスフォーメーションを踏まえ、どの組織にとっても正面から向かわなければならないデータ活用の課題と奥深さについて、いろいろな示唆を得られたイベントだった。

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう

本記事はアフィリエイトプログラムによる収益を得ている場合があります