Wczoraj @grass i @inference_net zaprezentowali model adnotacji wideo 12B, który jest 15 razy tańszy niż zamknięte modele i przewyższa lub dorównuje wydajności GPT-4.1 i Claude 4 Sonnet. To całkiem szalone, zwłaszcza że został wytrenowany na 1 milionie klatek wideo z sieci Grass. Jestem również bardzo podekscytowany możliwością wprowadzenia sieci do produktów. Wyobraź sobie, jak dobre mogą stać się te modele, gdy Grass/Inference będą kontynuować współpracę, a Grass będzie zbierać całą przyszłą zawartość internetu, aby trenować modele. Wyobraź sobie🌱
Inference
Inference15 sie, 02:02
Przedstawiamy ClipTagger-12b. To nowoczesny model adnotacji wideo, wytrenowany we współpracy z @grass. ClipTagger-12b oferuje możliwości adnotacji wideo na poziomie porównywalnym z Claude 4 i GPT-4.1 przy 17-krotnie niższych kosztach. Dowiedz się więcej:
5,61K