OpenNMT - オープンソースの神経機械翻訳
OpenNMTは神経機械翻訳と神経系列学習のためのオープンソースのエコシステムです。2016年12月にハーバードNLPグループとSYSTRANによって始められ、それ以来、いくつかの研究と業界のアプリケーションで使用されてきました。現在はSYSTRANとUbiqusによって維持されています。
OpenNMTは2つの人気のあるディープラーニングフレームワークで実装されています。OpenNMT-pyはユーザーフレンドリーでマルチモーダルで、PyTorchの使いやすさを活かしています。また、OpenNMT-tfはモジュラーで安定しており、TensorFlowエコシステムによって動作します。
各実装は独自のユニークな機能を持っていますが、類似の目標を共有しています。高度に設定可能なモデルアーキテクチャと訓練手順、現実世界のアプリケーションで使用できる効率的なモデルサービング機能があります。また、テキスト生成、タグ付け、要約、画像からテキスト、音声からテキストなどの他のタスクを許可する拡張機能も備えています。
OpenNMTエコシステムには、CTranslate2(CPUとGPU上のTransformerモデルの効率的な推論エンジン)やTokenizer(BPEとSentencePieceサポートを備えた高速でカスタマイズ可能なテキストトークナイザーライブラリ)など、NMTワークフロー全体をカバーするプロジェクトも含まれています。