2026世界杯中国压球官网 a16z 搭伙东谈主：大模子吃掉通用任务，创业公司吃掉垂直行业

发布日期：2026-06-08 14:02 来源：未知作者：admin 浏览次数：

最近半年，险些每一个 AI 创业者都会有一个疑问：OpenAI 和 Anthropic 会不会把咱们全吃掉？模子越来越强，Codex 和 Claude Code 越来越像操作系统，那应用层还有得作念吗？硅谷顶级风投 a16z 的搭伙东谈主 Joe Schmidt 有益写了一篇著述回话这个问题。他的中枢判断是：大模子公司的主攻标的（代码生成、写稿、图像创作等通用任务）如实是创业公司的禁区，但在这条"黄砖路"除外，还有大宗复杂、垂直的问题实验室压根够不到，果真的契机在那些需要让 AI 输出真实、合规、能在具体行业里运转的方位。创业公司不错靠四谈护城河守住阵脚：行业隐性常识积存成的数据飞轮、跨厂商跨模子选最优解的纯真性、按任务难度分级路由的老本上风、以及帮客户招揽监管复杂性的治聪慧力。他用一句话抽象这场博弈：模子不错替换，但深耕行业的责任系统不行。

2026世界杯博亚体育(中国)官方平台

以下为编译。

每个东谈主都在问：AI 应用层还有得作念吗？

我最近被首创东谈主和求职者反复问归拢个问题：AI 应用层还有莫得空间？照旧说 OpenAI 和 Anthropic 会吃掉一切？

这问题背后有一种特殊的 AI 惊慌症。一些东谈主依然认定，唯独能幸免沦为历久底层的位置，要么在大模子实验室里，要么在机器东谈主、硬科技这类"实验室碰不到"的前沿地带。要是每一款软件都注定被吃掉，要么被 Codex 或 Claude 径直招揽掉责任流，要么被下一代模子径直造成过剩，那就飞速跑吧。

听着，我险些比谁都更 AI 原教旨方针，况且我合计他们只说对了一半。实验室如实会吞掉一大片应用层。但"应用层"不是一个同质化的契机池。正确的念念考框架是：你站在黄砖路上，照旧奥兹国的其他方位？

大模子公司吃通用任务，创业公司吃垂直行业

"黄砖路"是咱们对大模子公司主攻标的的简称，它们在这条路上插足了极其巨大的资源。代码生成、写稿、图像创作这类问题之是以自然属于实验室，是因为这些问题跟着模子原始智力的提高会径直变好：每一块钱的预测验和后测验开销，都会径直改善家具体验。

要是你在创业，黄砖路是最彰着的标的，亦然最危急的标的。拿一个高性能模子，接上几个现成的贯穿器（Google Drive、Slack、Salesforce、Notion、GitHub），再在上头搭一层代理编排，看起来像变魔术一样浅易。

问题是，这即是实验室在作念的事情。他们虽然领有模子自己，这意味着更好的利润率、更强的搁置力，以及对下流悉数参与者的订价权。但更重大的是，他们也领有决定家具架构的职权，家具为哪些问题而假想、用什么面貌来解决。他们到目下为止一直在刻意采取"模子加器用调用"的模式，而这偶合是黄砖路上那些水平化、低步数任务所需要的。

退一步说，就算有创业公司能在家具上跑赢 Codex 或 Claude Code，实验室手里还执着巨大的分发渠谈和 AI 领域最强的品牌光环。要是你是一家 AI 应用公司，用相通的贯穿器、相通的模式、莫得底层子代理或深度确立、也莫得我方的分发智力，那你简略率走在一条通往"何处都不是"的路上。

但对创业公司来说，这不是全盘悲不雅的场所。黄砖路除外有巨大的契机，创业公司不错在那里果真领有客户、解决复杂问题。

这些公司构建的是代理式体验，模子被编织进一张由器用、自动化、集成组成的复杂汇集里。这使得它们自然是垂直化的。它们不错作念多步、多变装合作的责任，领有针对特定变装和垂直场景的子代理，而这些都是 Anthropic 和 OpenAI 用水平化平台无法触及的：跨系统收罗转折文，然后在不同阶段由多个东谈主审批流转。这些场景往往触及一个或多个留传系统，倾向于需要细目性的末端，疲塌是不可禁受的，况且最终频频绑在某个有价值的业务后果上。

实验室很了了这些问题的价值：他们之是以在搭建我方的外包确立团队，以及为什么会出现一通盘面向大客户的强化学习产业，原因就在这里。

对此最常见的反驳是：历史上押注"模子不会变好"从来都是倒霉的赌注。它们简略会一直变强，最终吃掉这些应用层公司的市集。

实验室虽然会连接率先，但我合计奥兹国其余步区的公司有几谈护城河不错守住。

第一，数据和学习的飞轮。好多常识不在职何测验集里，不成文的行业常规、莫得文档记载的法式、只存在于从业者头脑里的隐性常识。这些十足不在公开网页上。再多测验算力也替代不了果真镶嵌这些常识所在的业务流。这里有两个叠加的飞轮：跨客户飞轮，当你看到归拢种问题的更多变体时明白的模式；以及单个客户里面飞轮，具体有缱绻背后的原因、未说出口的例外、公司我方不成文的教育法则，这些惟有在与系统的真实交互中才会透露。

即使客户数据不可在客户之间径直使用，应用公司依然不错应用跨客户问题类型的模式识别，来率领未来问题的架构假想。一个让代理跑过一百次法律红线审查、一千次保障核保周期、一万次销售诞生代表任务的公司，依然把问题的"气象"内化了，这种积存是下一个新进入者用一套全新代理重新驱动无法复制的。

第二，治理模子的变化与复杂性。实验室依然在作念里面路由了，不同请求调不同模子类别、底层用集成。但他们作念不到跨厂商路由，不可用竞争敌手的模子来评估某个子任务，也不可为一个极窄的枢纽有益用开源微调。奥兹国公司不错在通盘模子市蚁合为每一个子任务选最优模子，而不是只可用母公司发货的那一个。他们还作念了没东谈主想作念的责任：每次新模子发布时再行跑评估、针对客户边际场景再行校准教唆词、在不炸掉坐褥环境的前提下完成部署。实验室不会替客户作念这些；他们把下一个模子卖给你，让你我方迁徙。奥兹国公司帮客户招揽掉迁徙老本。客户得到的是通盘市集最优智能的组合，以及每次升级时无感的连气儿性。

第三，老本优化。每个查询都跑 Opus 4.7 是通往负毛利的最快旅途。最佳的奥兹国公司在不同级别的模子之间作念路由，最难的任务用前沿模子，大部分用中端模子，在依然得回实足积存的枢纽用更小的定制或微调模子。有些公司当今更进一步，在这些基础上作念我方的后测验，针对客户关爱的极窄责任流作念优化，作事老本仅仅前沿 API 调用价钱的零头。实验室定的是智能的底价：花 X 元能买到的最低智能。奥兹国公司卖的是反过来的东西：为责任流骨子所需的智能水平，找到最低的好意思元老本。这惟有在你精准知谈每个子任务需要什么水平时才可能，而实验室在结构上不可能了解悉数垂直行业。

第四，治理。成为客户在某个垂直行业使用 AI 的"搁置平面"，这件事自己就有尽头大的价值，权限、审计、代理被允许作念什么、代理骨子作念了什么，沿路集聚于一处。这个搁置平面由具体场景的护栏组成，而不同业业、不同岗亭需要的护栏完全不同。因为奥兹国公司领有端到端的器用、责任流和数据，他们能在水平器用难以企及的方位提供细目性末端。他们亦然替最终客户招揽监管复杂性的实体：法律行业的 FRCP 和讼师法律讲明注解、医疗领域的 HIPAA、金融领域的 SEC 和 FINRA、各州保障法则等等。一个水平化玩家要是不造成一百个不同的垂直行业公司，就不可能果真联贯这些拖累。CIO 们想要的是一个能在公约里空口无凭写明"我会为提供的代理承担合规拖累"的合作伙伴。

悉数这些都指向归拢件事：专注。不错是一个垂直行业（保障、法律、司帐），也不错是一个作念深作念透的功能（销售、客服、财务）。无论哪种，都需要一支团队全身心扎进一组客户里，它的责任流、它的边际场景、它的监管法律讲明注解。实验室不是为这个假想的。他们必须同期障翳悉数东谈主，这是他们铺出黄砖路的面貌。相通的弃取也让他们进不了奥兹国的其余步区，你不错同期无处不在，也不错在一件事上作念到极致。二者不可兼得。

销售的例子：复杂业务需要什么

怎样在实践中念念考这件事？11x 的 CEO Prabhav Jain 给出了一些来自一线的提议。

从客户果真关爱的末端起程。对 11x 来说，即是帮客户产生更多销售管谈。从这个问题起程，追问就变得极其具体：咱们但愿端到端领有哪些果真驱动管谈的行动？把每个行动分解成任务，哪些是代理式的、哪些不是，哪些需要深度的领域知悉、哪些不需要。实验室虽然也会发布责任流，但当历程有好多方法、输入很脏、现象很浩荡析、存在多样实验宇宙敛迹时，单靠更好的模子是作念不到的。这部单干作回到传统软件工程，而实验室在一个专注的应用公司眼前莫得任何上风。

举个例子，11x 处理的任务包括：基于自界说信号作念陈迹挖掘、陈迹数据补充、深度账户筹备、从 CRM 中抓取转折文、针对不同渠谈的音问生成、陈迹质料判断代理、邮件投递系统。这些不是一次性就能完成的任务，需要深度工程。

奥兹国譬如中最枢纽的一个知悉是：在职何一个真实责任流里，2026世界杯-最新版官方软件简约有一半非代理式任务，实验室在这些任务上莫得任何上风，他们写模子层底下的细目性软件，并不比你强。另一半代理式任务，仍然需要你针对果真想要的末端去调、去测验、去敛迹模子。领域常识往往不在通用测验数据里。这些智力是从垂直或功能的泥土里长出来的，在历程的枢纽时刻被喂给模子。当 11x 的代理在电话上评估一个 inbound 陈迹时，它需要被测验去相识"什么是针对这个特定行业、这个特定东谈主群的好销售对话"。这是应用公司才能作念的责任，况且会不休积存。

更重大的是，业务在演进，这些妙技会不休逾期，你的智力即是连续演进这些责任流和转折文，这自己就造成了竞争上风。11x 的界限化邮件外拓家具刚起步时，" AI 味"的邮件刚驱动进入东谈主们的视线。到今天，东谈主们对哪些是 AI 写的、哪些是东谈主类写的依然有了机敏的判断力，而这个判断法式每隔几个月就在变。代理必须不打消据市集动态调度，而护城河恰是在这里被建出来的。事实上，尽管存在这种变化，11x 的正面回复率在当年几个月飞腾了 4 倍，依然为客户创造了数亿好意思元的管谈。

在复杂度高的问题上责任。复杂问题才是果真开释买卖价值的方位，不然你只会发现我方搭了一层薄薄的壳。拆罢职何一个实足复杂的买卖问题，衰败会迅速透露。举个听起来很浅易的 GTM 场景的例子：要是一家公司依然是你的客户，你就不应该再联系这家公司里的任何干联东谈主。但这事少许都不浅易。也许 CRM 里联系的是这家公司的一个域名。那些有几十个子公司的集团怎样办？要是 CRM 记载里留的是母公司域名怎样办？要是一个 Salesforce 里逾期的匹配字段，把一封冷销售邮件发给了一位现存客户的 CRO？真实宇宙的数据是脏的，东谈主类尚且搞不定，模子也不会自动跨过这谈坎。从衰败中提真金不怕火顺次，需要的是为问题具体款式而假想的专用代理，而不是一个对着 CRM 指疏浚点的通用副驾驶。事实上，凭证 11x 的数据，他们依然发现我方的数据质料和极新度远高于客户，是以他们默许以我方的数据为准。

护栏不单用来注重赖事发生。这是客户付钱给你的原因。护栏被严重低估了。即使在归拢个家具里面，每一个场景都需要我方的护栏。一个受到严格监管的金融作事客户，和一家中等界限的 SaaS 客户，要求的保障完全不同，这些各异一直浸透到代理怎样写、能联系谁、能触碰哪些数据、电话里能说什么、以及每个有缱绻怎样被记载。一套"放之四海都准"的系统在这种各异眼前会崩溃。护栏必须按场景构建、按客户确立、连续审计，而这项责任完全属于应用公司。这即是 11x 有前置部署工程师和手艺部署战术师的原因，他们需要为每一个客户的需求作念定制。举个例子，他们曾与一家 F1000 企业合作，通过语音向他们的大宗中小企业客户作念授权外呼。最初几次迭代接听率很低，他们必须快速迭代，学会怎样让这个特定东谈主群在前 10 秒内产生互动。中小企业主的步履和大企业买家、普通浮滥者完全不同。当今他们一天为这个客户创造的销售契机，比他们通盘销售团队针对这个细分市集一个月作念的还多。

保障的例子：智能不在模子里，在责任流里

保障是另一个切面，归拢个论断。FurtherAI 的 CEO Aman Gour 是这么相识这件事的：

当他们驱动在真实保障运营中部署 AI 时，反复听到一种假定：模子是智能的载体，责任流仅仅围绕它的脚手架。跟着合作了越来越多的保障公司，他们越来越敬佩这个假定是反的。

在保障业，好多智能自己就存在在责任流里。两家保障公司可能走归拢条旅途处理一份投保请求：接件、审核、报价、承保。但旅途仅仅最容易的部分。果真分别两家公司的是旅途里面的沿路细节：哪些风险需要上报、哪些耗损信号值得关注、两条法律讲明注解冒失时哪一条优先级更高、什么情况下必须有东谈主署名、哪些外部数据会被调取、最终有缱绻怎样存档。这些逻辑不在一个干净的法律讲明注解引擎里，而是洒落在 SOP、司理审核记载、核保理念、公司特定的风险偏好和多年的操作教育中。其中很大一部分压根莫得被写下来，模子无法径直读取。

这即是为什么 FurtherAI 不信赖一个每次都从零推理的纯代理，也不信赖一个实验一乱就崩溃的硬编码责任流。他们在构建的是代理式责任流，责任流给你可重叠性、可审计性和老本搁置，代理处理不细目性并在干线走欠亨时还原旅途，东谈主类留在轮回里处理那些需要承担拖累的判断。

在第一天，这能自动化东谈主工操作。但假以时日，每一次上报造成信号，每一次例外是一次反映，每一次东谈主类修正展示了操作手册何处不完竣。沉着地，责任流不再是剧本，而是造成了保障公司的运营挂念。实验室很难触达到这个层面。他们会连续发布更好的模子和更好的通用代理，他们也理当如斯。但他们不会坐在一家保障公司的坐褥历程里实足久，去相识为什么某一个账户被上报、某一个风险被拒保、某一位核保东谈主推翻风险偏好指引况且他推翻得对。这种相识，只可来自把责任流跑在坐褥中数千次。你第一天托福的责任流不是护城河。坐褥使用所产生的反映轮回，跟着时辰积存，才是。

三个测试判断你的标的，两条路都有赢家

器用与步数测试。完成这项责任需要几许步？你需要构建的器用复杂到什么进度？对比一下：水平化 AI 搜 Google Drive，一步，操作一个器用，末端错了用户不错重搜；和一份针对律所三年前例的多步法律红线审查，几十步、跨多个器用、输出必须通过搭伙东谈主审核且最终可能在法庭上被辩说。两者看起来都像"代理在作念责任"，但惟有后者需要一个专注团队花几年才能构建的那种深度软件。

系统测试。你在构建的是客户用来完成责任的"系统"，照旧叠加在客户已有系统之上的"器用"？系管辖有端到端的责任流，数据采集、治理、完成事项的记载，是客户刻画骨子责任如何发生时指向的东西。器用仅仅在客户依然在运行的责任流上加一层智能。作念器用能产生真实收入，况且实验室不错拿走，因为客户并不依赖你四肢编排层。高客单价时时是系统的信号，因为系统替代果真的东谈主力岗亭并据此订价，但这不是保证。问我方一个问题：要是实验室发布了一款据称与你径直竞争的家具，客户还需要你的家具吗？要是谜底是"是"，你在构建系统。要是"否"，你仅仅器用，即使你的客单价很高。

对冲基金 /P&L 测试。实验室的发挥用 benchmark 来评判，奥兹国其余步区的发挥用客户的 P&L 来评判。你的客户不关爱你的模子在 SWE-Bench 或 MMLU 上拿了几许分，他们只关爱你的代理有莫得惩办那笔交游、有莫得把公约条件审对、有莫得签下正确的保单。要是他们死死盯着业务流的末端，而不是一个通用的智力评分，你就在奥兹国其余步区。要是他们买的是通用智力，你卖的东西他们买一张 Claude 或 Codex 的席位就能得到。最佳的代理公司需要像对冲基金一样运作，用客户 P&L 预见的 alpha 来取胜，而不是用 benchmark 分数。

咱们会在黄砖路上和路除外同期看到巨大的赢家。

模子公司会连接赢，因为他们领有模子，也领有他们假想的水平器用的分发智力。奥兹国其余步区的公司要是能领有"责任系统"，公司骨子履行责任的界面，以及从责任中产生并千里淀下来的数据，就能赢。这些公司领颠倒据采集、责任流行动系统和治理层。跟着某个垂直领域内更复杂的责任流不休锻真金不怕火，它们会集聚成一个客户最终依赖的中枢体验。当新一代模子从既有大公司和新兴玩家中不休发布，这些公司就成了整合一切、把智能托福给客户的中间层。模子在底层不错替换，但责任系统不行。

下一代企业软件2026世界杯中国压球官网，会在黄砖路除外被建出来。

下一篇：下一篇：世界杯压球官网颤动！巴萨官方晒新援戈登参不雅梅西8座金球：历史最好🐐

世界杯官网

2026世界杯中国压球官网 a16z 搭伙东谈主：大模子吃掉通用任务，创业公司吃掉垂直行业