热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
在传统软件开发中,您会根据功能深度或用户需求为新产品规划 v1、v2、v3。随着 AI 系统的出现,视角发生了变化。
每个版本的定义是系统拥有多少自主权,以及您愿意放弃多少控制权。
首先,识别一组高控制、低自主权的功能(如下图中的版本 1)。
这些功能应该是小型的、可测试的,并且易于观察。从这里开始,考虑这些能力如何随着时间的推移而演变,通过逐步增加自主权,一次一个版本。目标是将一个宏伟的最终状态分解为您可以评估、迭代并从中构建的早期行为。
例如,如果您的最终目标是自动化公司客户支持,那么高控制的起步方式是将 v1(版本 1)简单地定义为将工单路由到正确的部门,然后转到 v2,系统建议可能的解决方案,只有在 v3 中才允许其自动解决并提供人工备份。
这里还有几个例子:
市场助理
v1:根据提示草拟电子邮件、广告或社交文案
v2:构建多步骤活动并运行它们
v3:启动、A/B 测试,并在各个渠道上自动优化活动
编码助手
v1:建议内联补全和模板代码片段
v2:生成更大块(如测试或重构)供人工审查
v3:自主应用范围更改并打开拉取请求(PR)
如果您关注过 GitHub Copilot 或 Cursor 的演变,这正是他们使用的剧本。大多数用户只看到当前版本,但底层系统是逐步攀升的。首先是补全,然后是块,然后是 PR,每一步都是通过使用、反馈和迭代获得的。


8月20日 00:21
你不能像其他产品那样构建AI产品。
AI产品本质上是非确定性的,你需要不断地在自主性和控制之间进行权衡。
当团队没有意识到这些差异时,他们的产品会面临意想不到的失败,他们被困在调试大型复杂系统中,无法追踪,而用户对产品的信任也在悄然流失。
在看到这一模式在包括@OpenAI、@Google、@Amazon和@Databricks在内的50多个AI实施中反复出现后,Aishwarya Naresh Reganti和Kiriti Badam开发了一个解决方案:持续校准/持续开发(CC/CD)框架。
这个名字是对持续集成/持续部署(CI/CD)的引用,但与其名字所指的不同,它是为行为非确定性且需要获得自主性的系统而设计的。
这个框架向你展示如何:
- 从高控制、低自主性的特性开始
- 构建真正有效的评估系统
- 在不破坏用户信任的情况下扩展AI产品
它旨在识别AI系统的独特性,帮助你构建更有意图、更稳定和更值得信赖的AI产品。
他们首次公开分享这一内容:

60.74K
热门
排行
收藏