週刊アスキー

  • Facebookアイコン
  • Twitterアイコン
  • RSSフィード

AIを活用して句読点を含めた自然な日本語を読み込みを実現

1時間の音声を5分で文字起こしできる「Rimo Voice」

2020年09月01日 10時00分更新

 Rimo合同会社は9月1日、日本語に特化したAI文字起こしサービス「Rimo Voice」のリリースを発表した。

 句読点を含めた自然な日本語を読み込むことが可能。会議の議事録や会話の記録、取材内容の文字起こしといった利用シーンを想定しており、1時間の音声データを5分程度で文字化するという。

 パソコンやスマホのブラウザーを使った録音、もしくは既存の音声データをアップロードすることで文字起こしデータを作成可能としている。

文字起こしデータは3〜5行程度の読みやすい形で表示され、読み取りが曖昧な箇所は文字の色が薄く表示される(こちらが実際の取材時の音声をもとにした文字起こしデータ)

 また、音声データと文字起こしデータはリンクしており、文字を選択することでピンポイントに該当部分の音声を聞くことが可能。そのほか、URLで文字起こしデータを簡単にシェアでき、さらに文字起こしデータはユーザー自身で修正できるという。

リモートワークの弊害になり得る会議などをサポート

 開発を手がけたRimo合同会社は、「はたらくを未来に」を理念に、フルリモートワークや副業など新しい働き方をより良くするため2019年に立ち上がった企業だ。Rimo Voiceは、リモートワークの弊害になり得る会議などのコミュニケーションに関わる領域でサポートするツールとなる。

 開発を手がけた代表社員兼エンジニアの相川 直視氏は、Rimo Voiceのメリットについて以下のように語ってくれた。

 「取材やユーザーインタビューの文字起こしに使えるのはもちろん、録音データを文字によって検索できるため、議事録の代わりとしても使っていただけます。また音声も残すことができるため、言質が取れるだけでなく、温度感やニュアンスも伝えることができます。たとえば、上長がメンバーに任せてあえて会議に参加せずとも、必要があればRimo Voiceで確認をとるといったシーンを増やせるはずです。このように、以前からあったものの便利な代替で終わらないツールとしてお使いいただけます」

Rimo合同会社 代表社員兼エンジニア 相川 直視氏

 昨今、リアルタイムでの音声認識市場が伸びている状況となっている。他社との戦略の違いについて相川氏は、「リアルタイムじゃない方が、音声認識精度はこの先も高めていけると思っています。YouTubeにある自動での英語字幕はとても精度が高いですが、リアルタイムなように見えて実は時間をかけています。リアルタイムでの音声認識は技術的にできないわけではないですが、リアルタイムではないことによる精度の向上を狙い、この先もツールを拡充していきたいと思っています」と語った。

 料金は30秒20円の従量課金がベースとなり、別途定額プランも用意している。くわしくはサービスページを参照してほしい。

■関連サイト

この記事をシェアしよう

週刊アスキーの最新情報を購読しよう