Recogni: データセンター向けの革新的なジェネレーティブAIソリューション
Recogniは、データセンター向けのジェネレーティブAI推論コンピュートを提供しています。このソリューションは、世界のAI野望を加速させることを目的としています。
コア機能
- 3nm TSMCテクノロジーノードを採用し、エネルギー効率とコストを最適化しています。
- TP > 100のテンソルパラレルズムにより、AIモデルをチップ全体に並列化し、高速化と大規模モデルの実現を可能にしています。
- HBM3eの最高帯域幅メモリを実装し、GenAIモデルの出力速度を向上させています。
基本的な使用方法
- ハードウェアとソフトウェアの共同設計により、ボトルネックのないデータ移動と高いテンソル並列度を実現しています。
- ユーザーのニーズに合わせて設計されており、CapEx、OpEx、コンピュート密度、拡張性、電力効率、AIグラフのカスタマイズ性などを考慮しています。
Recogniは、高い精度(99.9%以上)、低コスト(標準的な数学より4倍の電力消費削減)、短いコンパイル時間(Llama 405bのコンパイル時間は10分未満)などの特徴を持っています。