トレンドニュースサイト STRAIGHT PRESS【 ストレートプレス 】

株式会社Verbex

Verbex、リアルタイム音声対話AIを支える独自音声認識・音声合成モデルをAPIとして提供開始

このエントリーをはてなブックマークに追加

~電話応対・コールセンター・AIエージェント開発に活用できるSTT・TTS APIを提供~

音声対話AIプラットフォームを提供するVerbexは、同社のリアルタイム音声対話AIを支えるコアモデルであるSTT(Speech to Text/音声認識)およびTTS(Text to Speech/音声合成)を、単独のAPIとして提供開始したことをお知らせします。
VerbexのSTT・TTSは、これまで電話応対、問い合わせ対応、受注対応、予約受付、代表電話の一次受けなど、リアルタイム音声対話AIの中核技術として活用されてきました。
今回のAPI提供開始により、企業、開発者、SIer、BPO事業者、AIエージェント開発企業は、Verbexの音声認識・音声合成技術を、自社サービスや業務システム、コンタクトセンター基盤、AIエージェントに柔軟に組み込むことが可能になります。

背景:AIエージェントの実用化において、音声インターフェースの重要性が高まる

生成AIやAIエージェントの普及により、AIの活用はテキストチャットにとどまらず、音声を通じて自然にやり取りする領域へと広がっています。
コールセンター、電話応対、店頭端末、業務アプリケーション、ロボット、IoT機器、車載システムなど、さまざまな領域で「音声でAIとやり取りする」体験が求められています。
一方で、音声AIの体験品質は、LLMだけで決まるものではありません。人の発話を正確に認識するSTT、AIの応答を自然で聞き取りやすい音声に変換するTTS、さらにそれらをリアルタイムに処理する低遅延性が、音声AIの実用性を大きく左右します。
特に電話応対やコールセンターのような実運用環境では、電話回線特有の音質、周囲の雑音、言い直し、聞き返し、住所・氏名・商品名・数字の認識、日本語らしい抑揚や聞き取りやすさなど、汎用的な音声技術だけでは対応が難しい課題が存在します。
Verbexは、こうした実運用上の課題に対応するために開発・改善してきたSTT・TTSを、今回、単独のAPIとして外部提供します。

提供開始するAPI

Verbex STT API:電話・会話音声を業務で扱えるテキストへ変換
VerbexのSTT APIは、電話応対や会話音声をテキスト化する音声認識APIです。
問い合わせ内容、注文内容、予約希望、顧客情報、社内問い合わせなど、人の発話をAIや業務システムが処理しやすいテキストデータに変換します。
電話回線特有の音質や雑音環境、日本語における氏名・住所・商品名・数字など、業務利用で重要となる認識課題への対応を強化しており、コールセンター、通話要約、会話ログ分析、AIエージェント、業務アプリケーションなどに活用できます。

Verbex TTS API:AIの応答を自然で聞き取りやすい音声へ変換
VerbexのTTS APIは、テキストを自然な音声に変換する音声合成APIです。
AIエージェントの応答、電話の自動応答、FAQ回答、予約受付、受注確認、案内音声など、さまざまな音声インターフェースに利用できます。
業務利用における聞き取りやすさ、自然な日本語の抑揚、リアルタイム対話に適した応答速度を重視しており、コールセンターや電話応対だけでなく、アプリ、Webサービス、店頭端末、ロボット、IoT機器などへの組み込みにも対応します。

サンプルボイスはこちらから聴くことができます。
※サンプルボイスを聴いてみる

Verbex STT・TTS APIの特徴

1. リアルタイム音声対話AIで鍛えた実運用品質
VerbexのSTT・TTSは、単独の音声処理技術としてではなく、電話応対や問い合わせ対応などのリアルタイム音声対話AIの中で活用されてきました。
実際の業務環境で求められる認識精度、応答速度、安定性、自然な会話体験を重視して設計されています。

2. 日本語の電話応対・業務会話に対応
氏名、住所、商品名、数字、日付、予約希望、注文内容など、日本語の電話応対で頻出する表現への対応を強化しています。
コールセンター、通販受注、予約受付、代表電話、自治体問い合わせなど、業務特化型の音声AI開発に活用できます。

3. 低遅延なリアルタイム処理
AIとの自然な音声対話では、認識から応答までの遅延が体験品質を大きく左右します。
VerbexのSTT・TTS APIは、リアルタイム対話への組み込みを想定し、低遅延での音声認識・音声合成処理に対応します。

4. 既存システムやAIエージェントとの柔軟な連携
APIとして提供することで、企業は自社のAIエージェント、CRM、CTI、PBX、FAQシステム、業務アプリケーションなどにVerbexのSTT・TTSを組み込むことができます。
既存のLLMや業務システムと組み合わせることで、業務要件に応じた独自の音声AI体験を構築できます。

5. セキュリティ要件に応じた提供形態
Verbexは、クラウド型のAPI提供に加え、用途や要件に応じて、閉域接続、プライベートクラウド、オンプレミスなどの提供形態にも対応可能です。
金融機関、大企業、公共機関、BPO事業者など、厳格なセキュリティ要件を持つ組織での活用も想定しています。

想定ユースケース

VerbexのSTT・TTS APIは、以下のような用途で活用できます。

コールセンター/コンタクトセンター
通話内容のリアルタイム文字起こし、オペレーター支援、通話要約、応対品質分析、顧客発話の自動分類、AIオペレーターへの組み込みなどに活用できます。

電話応対AI/音声AIエージェント
代表電話の一次受け、予約受付、受注受付、FAQ回答、問い合わせ分類、有人転送前のヒアリングなど、電話業務におけるAIエージェントの構築に活用できます。

SIer/BPO/AI開発企業
SIer、BPO事業者、AI開発企業は、自社ソリューションや顧客向けシステムにVerbexの音声認識・音声合成機能を組み込むことで、業界特化型の音声AIサービスを開発できます。
PBX、CTI、CRM、FAQシステム、予約システム、受注管理システムなどとの連携にも活用可能です。

アプリ/Webサービス/IoT/ロボット
音声入力UI、音声案内、対話型端末、店頭受付端末、観光案内端末、ロボット、IoT機器、スマートデバイスなど、さまざまなプロダクトの音声インターフェースとして利用できます。

音声対話AIプラットフォームから、音声AIインフラへ

Verbexはこれまで、STT、TTS、LLM、対話制御を組み合わせた音声対話AIプラットフォームとして、企業の電話応対や問い合わせ対応の自動化を支援してきました。
今回、STT・TTSを単独APIとして提供することで、Verbexの音声技術をより柔軟に利用できるようになります。
これにより、企業は既存のAIエージェントや業務システムに音声認識・音声合成機能を組み込み、SIerやBPO事業者は、自社の顧客向けソリューションにVerbexの音声AI技術を活用することが可能になります。
Verbexは、完成された音声対話AIプラットフォームの提供に加え、音声AIインフラとしてのAPI提供を通じて、より多様な業界・用途における音声AI活用を推進していきます。

今後の展開

今後Verbexは、STT・TTS APIの対応領域をさらに拡張し、日本語電話応対における認識精度、業界固有用語への対応、リアルタイム処理性能、音声表現の自然さを継続的に向上させていきます。
また、SIer、BPO事業者、AIエージェント開発企業、業務システムベンダーとの連携を強化し、金融、自治体、通販、医療、ホテル、コールセンターなど、業界ごとの業務要件に合わせた音声AI活用を推進します。
Verbexは、音声対話AIプラットフォームに加え、STT・TTS APIを通じて、音声をあらゆるAIサービス・業務システムのインターフェースにすることを目指します。

株式会社Verbexについて
Verbexは、「声で世界をつなぐ」をミッションとして、独自の音声対話技術を研究開発しているAIスタートアップです。
STT(Speech to Text)/TTS(Text to Speech)/Speech Engineなど音声対話に必要な機能やデータのトレーニングメソッドを独自研究開発し、極めて自然で低遅延な対話を実現するため音声AIプラットフォームを提供しています。
経営メンバーはバングラデシュと日本のシリアルアントレプレナーがチームを組んでおり、国際ハイブリッドなスタートアップとして、アジア・日本発の音声AIの実用化を推進しています。
すでに日本を含む25カ国で56件の特許を保有し、独自技術の研究開発を進めながら、グローバルな事業展開を見据えて活動してきました。

WEBサイト:https://jp.verbex.ai/

本件に関するお問い合わせ先
株式会社Verbex 沖津
Email:contact@verbex.ai

企業プレスリリース詳細へ
PR TIMESトップへ

最新情報をXで受け取ろう!
前の記事
一覧へ戻る
次の記事