昨天 @grass 和 @inference_net 發布了一個 12B 視頻註釋模型,成本比封閉模型便宜 15 倍,並且超越或匹配 GPT-4.1 和 Claude 4 Sonnet 的性能。 這真是太瘋狂了,尤其是它是基於 Grass 的網絡上 100 萬個視頻幀進行訓練的。 我也非常期待這個網絡的產品化。 想像一下,隨著 Grass/Inference 繼續合作,Grass 抓取整個互聯網的前進狀態來訓練模型,這些模型會變得多麼優秀。 想像一下🌱
Inference
Inference8月15日 02:02
介紹 ClipTagger-12b。 這是一個最先進的視頻註釋模型,與 @grass 合作訓練。 ClipTagger-12b 提供與 Claude 4 和 GPT-4.1 相媲美的視頻註釋能力,成本低17倍。 了解更多:
5.13K