熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁

Tomasz Tunguz
現在我們已經將幾乎所有人類知識壓縮到大型語言模型中,下一步的前沿是工具調用。將不同的AI工具串聯在一起可以實現自動化。從思考到行動的轉變代表了AI實用性的真正突破。
我為自己構建了100多個工具,它們大多數時間都能正常工作,但並非總是如此。我並不孤單。Anthropic的經濟指數報告顯示,77%的商業使用Claude集中在全任務自動化,而不是協同駕駛。
Anthropic上週發佈了關於令牌效率和重新架構工具以優化其使用的文檔。該指導意見是反直覺的:與其創建許多簡單且標籤清晰的工具,不如創建更少但更複雜的工具。
以下是我構建的七個電子郵件工具——Ruby腳本,每個都有明確的目的。“安全發送電子郵件”腳本旨在防止AI在未經批准的情況下發送電子郵件。
美麗而天真,簡單而清晰,難道語言模型不應該能夠閱讀這些並確切知道我在要求它做什麼嗎?但事情並沒有那麼簡單!
Anthropic建議創建複雜的工具。他們的研究表明,當使用複雜的、參數豐富的工具而不是簡單工具時,“請求在輸出令牌上平均節省14%,最高可達70%”。原因是什麼?AI系統比片段化的意圖更好地理解完整的上下文。
我花了一個週末將所有工具整合成統一的工具,比如這個電子郵件工具:(第三張圖片)
對準確性的影響是立竿見影的。Claude的成功率接近100%。系統更快。因此,我使用的令牌大大減少,系統更高效。
這是我當前的思維模型:(第四張圖片)
當我為AI認知而不是人類直覺重新設計時,一切都得到了改善。我的CRM操作、日曆管理和數據庫工作流在整合成全面的、參數豐富的工具時變得更加可靠。準確性提高了,因此總成本顯著降低。
但別讓我使用這些工具。我現在在複雜性中有點迷失。這是以更高抽象層次工作不可避免的結果,不再深入理解機器。
我們花了幾十年讓軟件對人們變得簡單。現在我們正在學習如何讓它對AI變得複雜。



491
就像在餐館吃早餐一樣,軟件的製作便宜且快速。請求一個新的任務管理工具,你會在比做一個煎蛋卷更短的時間內以更少的錢得到第一個版本。
AI構建的工具可能不會持久。有些工具只存活幾分鐘,足夠回答“我們這周的週轉時間是多少?”
其他工具則在幾天或幾周內仍然有用,比如一個可以為沃爾瑪的入職培訓快速搭建輕量級項目跟蹤器的應用。有時它們會持續超過一個月。
如果持久性定義了過去二十年的軟件,那麼無常性可能會定義未來。
我們現在看到沿著一個連續體形成了三個層次:
持久SaaS:像管道儀表板這樣的長期記錄系統。
短暫應用:像沃爾瑪入職項目跟蹤器這樣的短期工具。
即時問題:一次性查詢,例如“告訴我關於蘋果賬戶的事。”
短暫應用和即時問題的數量將遠遠超過SaaS應用,可能是數百萬對一。即時解決問題的多巴胺快感是上癮的,並加速了職業生涯。
所有這些應用的基礎將是一個記錄系統,通常是一個現有平臺,但越來越多的是一個新的平臺。
財務和運營團隊依賴持久的儀表板進行治理和報告,彷彿一個指標的定義可以在整個組織中標準化。市場營銷人員快速搭建持續幾個月的數據應用來分析他們的付費支出表現,支持團隊在繼續之前快速詢問週轉時間。
像@omni這樣的底層BI平臺的可信模型、權限和業務邏輯使用戶有信心去嘗試短暫應用和即時問題。對基礎的控制確保了對上層的控制。
這種設計模式超越了AI,適用於大多數其他軟件。
無論你是喝咖啡、吃煎蛋卷,還是享用五道菜的盛宴,下一個偉大的創業公司將會提供這一切。

5.67K
熱門
排行
收藏