Conformer-2: 最先端の音声認識モデル
Conformer-2 は、110 万時間の英語音声データで訓練された最新の AI モデルです。このモデルは、Conformer-1 をベースにしており、固有名词、英数字、ノイズに対する堅牢性などの面で改良が加えられています。
コア機能
- 英数字の認識精度が 31.7%向上
- 固有名詞の誤り率が 6.8%改善
- ノイズに対する堅牢性が 12.0%向上
基本的な使用方法
- ユーザーは当社の API を通じて Conformer-2 を利用できます。
- 新しい API パラメータ「speech_threshold」により、音声の割合を設定して処理することができます。
Conformer-2 は、音声認識の分野において大きな進歩を遂げており、様々な実用的なシチュエーションでの利用が期待できます。