熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
PUMP 公售結束了,原本我也是大額在Bybit,鏈上只放1/2,最後只有鏈上的打成功,還好沒有提前套保…
話說最近AI社群上很多人在討論 VLA(Vision‑Language‑Action)
特別去研究了一下鏈上項目有沒有人在做VLA相關的,看到了這個 CodecFlow @Codecopenflow 的項目,買了一點。
== CodecFlow這項目在幹嘛 ==
簡單介紹一下VLA,VLA 是一種讓 AI 不只「能說」,而是「能做」的模型架構。
傳統的 LLM(像 GPT)只能理解語言、提供建議,但它不會動手操作、不會點擊畫面、不會抓取物體。
VLA 模型的意思就是整合了三大能力:
1. Vision(視覺):看得懂畫面、截圖、攝影機輸入或感測器資料
2. Language(語言):理解人類的自然語言指令
3. Action(動作):產生可執行的指令,如滑鼠點擊、鍵盤輸入、控制機械手臂
CodecFlow 他們就是在做鏈上的VLA,所有操作流程還可以上鏈,可審計、可驗證、可結算。
簡單來說就是 “AI 機器人” 的基礎架構。
== 為什麼我會特別注意這項目?==
我發現他們的開發者是 VLA 領域最火開源專案 LeRobot 的核心貢獻者!
LeRobot 就是開源界打造 VLA 模型的頂級基地,包含了 SmolVLA 等能在筆電上跑的輕量 VLA。
代表這團隊是真的懂VlA架構懂Robot的。
我看他們也持續的在建設,幣價也穩定的在上漲,我自己是很看好VLA賽道,而且從整體趨勢來看VLA跟機器人在市場上確實是未來。
• Web2 巨頭(Google、Meta、Tesla)目前已全力投入 VLA & 機器人訓練;
• Web3 項目好少有能執行任務的 VLA 應用還非常稀缺
• VLA 有機會在 DePIN、Web Automation、鏈上 AI Agent 執行等場景發揮巨大價值。
CA:69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
Always DYOR。

2025年6月26日
什麼是$CODEC運營商?
這就是視覺-語言-行動模型最終使人工智慧對實際工作有用的地方。
操作員是由 VLA 模型提供支援的自主軟體代理,透過連續的感知-推理-行動循環執行任務。
法學碩士可以出色地思考和說話,但他們無法指向、點擊或抓住任何東西。它們是純粹的推理引擎,對物理世界沒有基礎。
VLA 將視覺感知、語言理解和結構化動作輸出結合在一次前向傳遞中。雖然 LLM 描述了應該發生的事情,但 VLA 模型實際上透過發出座標、控制訊號和可執行命令來實現它。
運運算元工作流程為:
- 感知:擷取螢幕截圖、相機來源或感測器資料。
- 推理:使用 VLA 模型處理觀察結果以及自然語言指令。
- 動作:透過 UI 互動或硬體控制執行決策,所有這些都在一個連續的循環中完成。
範例:LLM 與由 VLA 模型提供支援的運算子
排定會議
LLM: 提供日曆管理的詳細解釋,概述安排會議的步驟。
具有 VLA 型號的運營商:
- 擷取使用者的桌面。
- 識別日曆應用程式(例如 Outlook、Google 日曆)。
- 導覽至星期四,在下午 2 點建立會議,並新增出席者。
- 自動適應使用者介面變更。
機器人技術:對物體進行分類
LLM: 生成對對象進行排序的精確書面指令,例如識別和組織紅色組件。
具有 VLA 型號的運營商:
- 實時觀察工作空間。
- 識別混合物件中的紅色元件。
- 規劃機械手臂的無碰撞軌跡。
- 執行拾取和放置操作,動態調整到新的位置和方向。
VLA 模型最終彌合了能夠推理世界的人工智慧和能夠實際改變世界的人工智慧之間的差距。他們將自動化從脆弱的規則遵循轉變為適應性問題解決的能力——聰明的工人。
「傳統腳本在環境變化時會中斷,但操作員使用視覺理解來即時適應,處理異常而不是崩潰。」

11.18K
熱門
排行
收藏