AI開発大手のOpenAIは3月1日、同社の会話型AI「ChatGPT」と、音声をテキストへ変換するオープンソースAI「Whisper」のAPIを開発者向けに公開した。ChatGPT APIは1000トークンあたり0.002ドル(約0.27円)、Whisper APIは音声1 分あたり0.006ドル(約0.82円)で利用できる。
ChaGPTは既存モデルより10倍安く
ChatGPT APIは「ChatGPT」をAPI化したもの。このAPIを利用すれば、開発者は自社のアプリやサービスにChatGPTをより平易に組み込むことができる。
3月1日時点のバージョンは「gpt-3.5-turbo 0301」で、少なくとも6月1日まではサポートされる予定。また、4月にはより新しいバージョンの「gpt-3.5-turbo」安定版がリリースされる見込みだ。
なお、開発者側は自分で利用するバージョンを選ぶことができる。
価格は1000トークン(英語の場合で約4000文字または750語)あたり0.002ドル(約0.27円)で、同社が以前から提供していた「GPT-3.5」モデルより約10倍安い。
オプションとして特定のモデルバージョンとシステムパフォーマンスをより詳細に制御したいユーザー向けに専用インスタンスも用意されるが、こちらの価格は非公開(要問い合わせ)だ。
同社によるとChatGPT APIは、SNSサービスSnapchatのチャット型AI「My AI」など複数のサービスで既に活用されているという。
Whisper APIではより大規模なモデルを利用可能に
音声をテキストへ変換するWhisperのAPIでは、より大規模なモデルのV2を利用可能となる。
価格は音声1 分あたり0.006ドル(約0.82円)。「transcriptions」(ソース言語で書き起こす)と「translations」(英語に書き起こす)の2つのエンドポイントが用意される。
入力する音声のコーデックは、m4a、mp3、mp4、mpeg、mpga、wave、webmの7種類だ。
OpenAIによると、Whisper APIは高レベルの最適化により、他のサービスよりも高速なパフォーマンスを発揮できるという。
週刊アスキーの最新情報を購読しよう
本記事はアフィリエイトプログラムによる収益を得ている場合があります