2026世界杯-最新版官方软件 探索智能体工程的 5 个陶冶


旧年12月,我在玩 Ollama 和 Gemini API,试图创建一个能运行肖似 DND(龙与地下城)笔墨冒险游戏的 Agent。我最终排除了,因为状态管制对 Ollama 来说太难了,致使对 Gemini 2.0-flash 来说也太贫困。我最终排除了创建一个可用的 DND 模拟器,转而作念了一个轻便的计数器,附带一个旁白来解释用户的更新操作。
在那次尝试递次时,我得出的论断是:
"让 LLM 更新状态,就好比让詹姆斯·乔伊斯帮你报税相通离谱。"
然则,在那之后的几个月里,我收回了我方说的话。Claude Code、OpenClaw 以及最近几个月表示的一系列 Agentic 步履,集体轰动了通盘这个词科技行业。我第一次使用 Claude Code 是在二月中旬,用来完成 BetaZero UI 的构建。其速率、体量和编码才能远远杰出了我之前从 Agentic 编码器具中体验到的任何东西。
是以,带着这个布景……
名堂 1:James Joyce,税务助手
https://github.com/EvanMcCormick37/mvp-james-joyce
这是我要谈到的名堂中的第一个。我用了 2 天时候完成了它,作为丹佛一家公司第三轮口试的作品(我走收场一齐四轮口试,但缺憾地未能得到实习契机)。

我花了约略一个小时笃定了领先的主意。一个能指引你了解税务现象、帮你列出可能有经验得到的扣除项的 Agent,同期还会构建一个举止筹谋,匡助你得到最大可能的税务扣除。
陶冶 1:快速迭代,手动测试
当我领先有这个思法时,责任流看起来与上头的图表彻底不同。我领先设思模子是一个 Agentic Graph-RAG 问答系统,使用基于当年官方 IRS 出书物构建的常识图谱和向量数据库。我思象用户建议一个问题,模子提供一个班班可考、带起原的谜底,同期附带 1-2 个相干问题,匡助笃定用户的扣除经验。
我推敲了架构,草拟了一份 ARCHITECTURE.md,然后用 Claude Code 在不到一小时的时候内完成了一次 one-shot 构建。
但当我现实使用这个哄骗时,嗅觉有些不合劲……
问题出在问答责任流上。用户的每条述说和问题皆会收到一大段笔墨酬劳,末尾附带一个商讨财务历史中某个赶快方面的问题。这既不是优雅的对话,也不是勤俭时候的哄骗。事实线路,表率的 RAG 文档问答责任流在这个用例中根柢行欠亨。
于是我尝试了别的方法。我顺利和 Gemini 聊了聊我可能得到的扣除项,然后思象怎么转换这个体验。

在原始基础模子上测试责任流。
Gemini 的强项在于其对话性。它分解地回答了每个问题,给了我探索的宗旨,何况从不让东说念主合计它在强行倾销某个话题。这等于对话式 Agentic 哄骗的上风场所。
我重新调养了联想,米兰体育2026世界杯指定中国官网优化对话经过而非数据组织。我大幅简化了高下文工程:我用一个 YAML 文献替代了通盘这个词 Graph-RAG 系统,将 IRS 个东说念主扣除指南颐养后作为系统教导的高下文。模子使用 tool-calling 来更新三个输出文献:user-profile.yaml、deductions-tree.yaml 和 action-plan.yaml。我莫得让模子试图用无穷的援用走动答用户问题,而是告诉它专注于建议正确的问题:我让它把对话行为一场"20个问题"的游戏,尽量用最少的对话轮次笃定用户的通盘扣除经验。
陶冶 2:能用一个 Agent 处罚的,就不要用两个
这少许应该不言自明。在联想哄骗架构时,我领先推敲使用一个 Agent 与用户对话,另一个来更新状态。同期,笃定用户的税务扣除经验要么使用 Agentic Graph-RAG + 推理模子,要么使用一个"税务引擎"(一个 DAG,每个节点包含一个蓄意或决策。思思杂志上那些"你的男性名东说念主偶像是谁?"的秉性测试题,只不外问题造成了"你有经验得到哪些税务扣除?")。但关键在于:多个 Agent 意味着多个"高下文"。"状态更新"Agent 需要了解若干对话内容才能正确更新状态?它的高下文每次皆相通吗,如故随每次函数调用而修改?Agent 之间怎么"通讯"?它们是开启对话,如故使用"音问"函数互重迭信?
你的步履中运行的 Agent 越多,出现误调换、脱落乃至失败的空间就越大。真理的是,这亦然联想笃定性系统时的一个好准则:一个单体作事容器平庸比 10 个通过易拉罐和绳索互重迭信的微作事更优雅、更容易达成。
陶冶 3:尊重 KV Cache
在领先构建哄骗时,我一直在纠结怎么向模子提供哄骗确面前状态(归来一下:user-profile.yaml、deductions-tree.yaml、action-plan.yaml)。咱们的税务助手必应知说念哄骗确面前状态才能建议"最优"问题(即能处罚最多未笃定扣除项的问题)。但咱们应该怎么向它提供这些状态呢?淌若咱们只是在每次用户回答时不停提供新状态,世界杯压球官网就会在高下文窗口中塞满旧状态的"阴灵"。咱们照实需要一种方法让模子识别哄骗确面前状态,何况只是是面前状态。我领先的思法既轻便又灵活:把状态顺利反应到系统教导中!
这是一个要紧造作。
LLM 有一个叫作念 KV Cache 的特质。它保存了与之前生成文本关联的已蓄意推理值。因此,在每个生成法子中,模子只蓄意最近生成 token 的关联。这意味着:1) 模子的运行资本权贵裁汰,2) 它的扩展是线性的而非二次的(尤其适用于长高下文窗口),3) 你始终不应该修改高下文窗口发轫的 token。
淌若你照实剪辑了模子高下文窗口发轫的高下文,就会迫使它重新蓄意你剪辑之后每个 token 的 KV 对。这相配奋斗。我第一次运行 James Joyce 的"高下文注入"达成时,一次 20 轮的对话就在 Anthropic API 上花了 1.50 好意思元。
我最终接收的处罚决策是将面前状态作为用户面前问题的前缀注入,并在每次新的对话法子中,从用户之前的问题中剥离逾期的状态。淌若让我回头转换这个名堂,我会尝试在每个用户查询中保留通盘状态视图。
名堂 2:Scathach Agentic 导师
https://github.com/EvanMcCormick37/scathach-tutor

我在 Scathach 上确面前"统计"页面
这个名堂与我的个东说念主经历更近一些。已往一年我读了好多东西:商量论说、零丁著作、商量论文、博客著作等等。然则,我常常操心我方并莫得确实从所读的内容中学到东西,或者这些常识在几个月莫得深化构兵后依然遗忘了。
OD体育(ODSports)官网入口LLM 匡助我发展和测试对所读论文的富厚。它们让我能立即与一个了解相干话题的实体进行对话。它们还不错创建测试题,让我能在惊东说念主的深度上测试我方对某个话题的富厚。但我但愿这些对话能在我脑海中留住握久的印象。
为了处罚这个问题,我构建了 Scathach。它骨子上等于"阅读著作 -> 回答对于该著作的小历练"的责任流,封装成了一个 Python 包。除了基本的历练功能外,它还将通盘已回答的问题存储在配备了 FSRS 算法的数据库中,这么跟着越来越多的文档被导入系统,用户不错遴荐性地温习他们最不擅长的文档。它当今不错作为 Python 包装配在你的腹地 Python 环境中。
陶冶 4:警惕界限膨大

在迭代 Scathach 和 James Joyce 时,我领先用 React 前端 + REST API + FastAPI 后端构建了 MVP。为什么不呢?归正编码通盘这个词东西也只花了 15 分钟。
事实线路,即使有 Agentic 编码器具,界限膨大也瑕瑜常真实的。重构频频比运行构建更毒手,何况当你 vibe coding——对不起,"Agentic 工程化"——时,你一脱手并不会对架构有深化的富厚。
我很快发现我方更心爱在莫得"全栈"架构的情况下建设这两个哄骗。当我脱手联想和构建这些哄骗时,我对思要什么和用例是什么有一个稚童的思法,但对责任流会是什么时势并莫得分解的愿景。我发现这个轻便的联想周期在快速迭代和转换家具联想方面相配雄壮:
联想 -> 达成 -> 手动测试
一朝我对 Scathach 的责任流感到舒心,我可能会把它构建成可实施文献或云哄骗。不外当今,我闲适于持续用我阿谁小巧的 Python 模块进行迭代。
陶冶 5:界限常识始终蹙迫
是以……我照实尝试过把 Scathach 构建成可实施文献。更准确地说,我让 Claude Code 把 Scathach 构建成可实施文献。我思把它移植成一种我爸爸(他不太懂本事)能使用的形貌。它构建了竣工的前端和 API,将后端编译成二进制文献,并使用一个 Rust 库将通盘内容打包成一个不错装配到用户电脑上的 .exe 文献。
那么,我对 Rust、Tauri 或者将哄骗编译成二进制 .exe 文献了解若干?一窍欠亨。但 Claude 了解,是以应该没问题。嗯,淌若我有这些方面的经验,可能照实没问题。
现实发生的是,我花了一个小时搞明晰为什么 npm 构建剧本不责任,然后又为 Tauri 二进制文献查找和形貌化图标,临了胜利装配了 .exe……着力装配后的步履打不开。
虽然,我坚信只是犯了某个入门者弊端。在 Tauri+Rust 二进制编译方面更有经验的东说念主会坐窝修好它。何况我信托淌若给阿谁东说念主 Claude Code 的使用权,他们会构建一个好 10 倍的哄骗版块,何况会衔恨说"这不是我我方写的"。但从某种意思意思上说,他们照实写了。即使在依赖"人人 Agent"的时候……
……东说念主类专科常识仍然很蹙迫。
这亦然我暂时把这个哄骗保留为 Python 剧本的另一个原因。只好我富厚它,我就能智能地持续更新它。
看到东说念主们为了"Agentic 智能"而排除东说念主类专科常识,这让东说念主感到缺憾。我合计社会正在走向《蠢蛋进化论》和《瓦力》那样的漫画式反乌托邦。但即使在智能 AI 系统的时期,那句老话依然适用:垃圾进,垃圾出(Garbage In, Garbage Out)。
就这些了,列位!淌若你思试试 Scathach2026世界杯-最新版官方软件,只需按照 README 上的装配证据操作即可。
