昨日、@grassと@inference_netは、クローズドモデルよりも15倍安く、GPT-4.1やClaude 4 Sonnetのパフォーマンスを上回るか、それに匹敵する12B動画アノテーションモデルをリリースしました 特にGrassのネットワークからの100万ビデオフレームでトレーニングされたので、かなりおかしいです。 また、ネットワークの製品化を見るのも非常に楽しみです。 Grass/Inference が連携し続け、Grass がインターネットの前進状態全体をスクレイピングしてモデルをトレーニングすることで、これらのモデルがどれほど優れたものになるか想像してみてください。 想像する🌱
Inference
Inference8月15日 02:02
ClipTagger-12bのご紹介です。 @grassと共同でトレーニングされた最先端のビデオアノテーションモデル。 ClipTagger-12bは、Claude 4やGPT-4.1と同等の動画注釈機能を17倍の低コストで提供します。 詳細情報:
5.13K