一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

介紹SparseLoCo：一種通信效率高的LLM預訓練方法。簡而言之：我們利用Top-k稀疏化 + 錯誤反饋與DiLoCo的不頻繁外部步驟——僅傳遞1-3%的梯度，使用2位量化——超越了DiLoCo和DeMo。1/N， ArXiv： Github：

38K