狂飙200天：进退两难的中国大模型团战

来源： 36氪2023-07-08 04:13:14

极速200天

两个月前，「暗涌Waves」曾向一位投资了王慧文光年之外的基金合伙人提问：中国创投史上，哪个公司在创办之初就众望所归、并且最终也拥有美好结局？

(相关资料图)

“说实话，我很难想到。”这位投资人答道。

作为一位AI行业的“门外人”，王慧文的杀入格外有戏剧性，最终能有多大的胜算？

沉吟片刻后，这位合伙人打趣说道：“至少，老王是一个有争议的人。”他的言下之意是，对于多数头部美元基金来说，大概没有理由不投资王慧文这样“能够集资源、钱、以及号召力为一体的大佬”。

后来的故事众人皆知。伴随着王慧文确诊抑郁症，光年之外被美团接手，这个大模型创业潮中引发最多关注的故事戛然而止。

当我们提出那个问题时，中国大模型的创业还在狂飙之时。人们无比相信那个比“移动互联网大10倍”的平台级大机会：在GPT-4推出不过20余天时，已有超10余家创业公司坐上大模型牌桌，总融资额数十亿美金。此后包括大厂在内的20多家公司公布了自研AI大模型，“就连上古神仙的名字都不够用了”。

顷刻间，光年之外的戏剧化故事，似乎应验了通用大模型很难属于创业公司的预言。越来越多的公司开始逃离大模型神话。

时间回到一年前。在旧金山第18街和Folsom街交叉口，有一座不起眼的灰色三层小楼，很快它将名声大振——这是OpenAI的办公所在地。一位硅谷人士告诉告诉我们，红杉中国创始及执行合伙人沈南鹏和OpenAI沟通之后，“大为震撼”，这位如饥似渴的投资人而后便令团队“动起来！”

红杉再次展现出了它一贯的战斗力。“在国内投资人中，Neil的认知应该是跑到最前面的。”上述人士表示，沈南鹏开始更大力度地抓AI投资，“能见的人都见了一圈”，其中就包括沈向洋、杨植麟和阿里CTO周靖人等。而外界所能看到的是，2022年9月，红杉官网发表了《Generative AI, a Creative New World》一文，*次提出生成式AI的概念。

“从硅谷到国内，创投风潮的传递大约会有3个月的延后。”一位美元投资人对「暗涌Waves」表示，所以ChatGPT在去年11月底发布，直至今年春节后，国内关于大模型的讨论才瞬间热烈起来。

春节后，踏上去硅谷航班的源码资本合伙人黄云刚，本来还想一并考察SaaS、Bio-tech，但最后几乎所有会议都和AI相关。此时想约OpenAI的人已不再容易：其员工后来基本关闭或隐藏了包括LinkedIn在内的各类个人联系方式。

这可能是过去十年、从硅谷到国内最快的一次共识收敛。

在生成式AI面前，本就力竭的移动互联网，顷刻仿若陈旧之物。新一轮的世界交接俨然已经开始。

人人都能感受到市场的躁动。2月中旬，在微软战略孵化器组织的一次AI分享会上，人头攒动，茶歇区被挤满，连咖啡师都在柜台里拿着手机拍PPT。墙上各种NFT印刷品的包围，似乎又在提醒人们这里数月前还属于Web3。

仿佛一种应激反应，国内投资人一头扎进AI，却又发现大量功课要做。多位投资人在采访中不约而同称自己“还在学习”，以及反问：你们最近还跟谁聊了？

今年3月，在接受我们访谈前一天的凌晨，阿尔法公社创始合伙人&CEO许四清正在“读paper”，然后接到一位成功创业者师弟的微信，问能否一聊AI。后者驱车20公里来到他的住处，两人一直讨论到凌晨三点才散去。

创投界的大小人物纷至沓来，王慧文也是群情激昂中的一份子。曾有接近他的人对「暗涌Waves」透露，王慧文对大模型创业的态度变化非常之快，原本他只是计划以投资的方式入股一家公司，但在三天内就决定躬身入局。

但风口总是不长命。尽管严格来说，相比于移动时代尾声的众多议题，大模型或AGI无疑是一个真命题。在GPT-4推出不过20余天时，市场已明显感受到，在这个注定是少数人的游戏中，国内通用大模型的创业潮首战已基本终结。

6月底，猎豹移动CEO傅盛和金沙江创业投资基金主管合伙人朱啸虎在朋友圈的互怼，在体现投资人和创业者视角种种差异的同时，也显示出一种异常冷静的共识：有机会，但不会是BAT式的大机会。

短短200天，更多的投资人和创业公司的焦点开始往垂直大模型或中间层、应用层迁移，而那个狂热的平台级或颠覆性的大机会，也逐渐被更现实的“零零散散的小机会”替代。

真格基金管理合伙人戴雨森曾对我们说，随着一波波新技术的兴衰，AI在创投界不断进入冬天和春天。每一次看似高蹈的技术理想面前，都悬着一把难以商业化的达摩克利斯之剑。

这次也没有例外。

浮沙上的高塔

共识可以快速形成。

ChatGPT的发布让国内市场的FOMO情绪在年初达到顶峰，团队和资金快速集结大模型。牌桌上的选手，分为：互联网创业派、大厂派，以及来自高校和研究机构的学院派。

共识也可以快速瓦解。

注定是烧钱游戏的属性，算力、数据和人才的门槛，以及当下资本市场的变化，让“大模型是否是创业公司的机会？”的诘问一直悬在头顶。

事实是在今年4月，「暗涌Waves」就注意到国内通用大模型创业潮的首战，已基本终结。这一说法后来也得到一些投资人证实，“就这些了”，此后声称要入局大模型的创业公司基本绝迹。

在一位一级市场观察人士看来，关于大模型，不光创业团队，敢下场的大基金也只有少数大名字，而且机构主要基于赌人的逻辑，前方还有漫长的证明题要做。

和傅盛论辩完的朱啸虎，第二天就在朋友圈表示，他的核心观点是：不要迷信通用大模型，因为明年GPT-3.5就成commodity（通用基础设施），而3年后，GPT-4也会是。

这背后正是关于大模型的另一重隐忧：底层的大模型本身在变，而未来很可能大量开源，或者1-2个头部厂商赢者通吃。如此一来，中国大模型创业的价值与投入就根本不成正比。

至于那个众人言说中的“比互联网更大的机会”，在戴雨森看来，立足点是“能做出可以使用工具、解决任务、分解任务的AGI”，而能实现这一点的团队，即便在世界范围内都很稀缺。

前不久，在Waves大会的一场圆桌论坛上，中国人民大学高瓴人工智能学院卢志武教授，就质疑了所谓“国产大模型的春天”。在他看来，这不过是很多公司在“微调国外底座模型”的假象。

现实也的确如此。一位AI创业者告诉我们，很多声称要做大模型的创业公司，其实从一开始就是在用Supervised Fine Tuning等快捷技术，做一个“还可以的”语言大模型出来，真正有资金和技术实力去挑战GPT4的团队和项目屈指可数。

更多创业公司开始向医疗、法律等垂直大模型以及中间层、应用层迁移。王慧文的光年之外，以及王小川的新公司，后来都选择了同时做大模型和基于模型的应用。

“42章经”曲凯发布的数据显示，以他的体感，前一段拿到融资的AI项目中，做底层模型的大概有10%-20%，做infra/中间层的有20%-30%，做应用层的有60%-70%。其中如果把还没拿到钱的也加进来，做应用的估计至少是95%+。

但垂直大模型以及应用这条路也并非坦途。对创业公司来说，垂直领域的场景和数据很难获取。而它所构建的能力又不能是通用大模型轻易覆盖的。

像infra/中间层，一位投资人曾在社交媒体上表示，旨在满足数据采集、标注、模型调度等MLOps需求的创业公司，会面临“中间商难赚差价”的夹心尴尬——前有免费开源工具，后有云厂商打包工具和服务。同时，“国内客户付费习惯仍然没有很好地养成，尤其在企业开支紧缩的经济恢复期”。

在Waves大会上，真格基金戴雨森提到，在中国做2B服务，会受到市场付费意愿、客户采购方式特点的限制。“中国互联网之前一大特点，就是要直接找用户收钱很难，很多时候都是羊毛出在猪身上。”像OpenAI和Claude在美国可以直接通过公有云卖API服务，而在中国只提供API还不够，“很多做大模型的公司针对企业客户，现在是连服务器带模型一起卖，还得提供训练和微调服务”。

上述在社交媒体发文的投资人还提到，应用层项目可以分为两种：那些垂直场景里深耕的老项目在积极接入大模型，手握数据做微调；而新项目谈格局为时尚早，在大模型的迭代能力被充分释放前，很容易“速生速死”。

这在海外市场已有表征。例如去年尚风头无两的美国独角兽Grammarly和Jasper，在GPT4发布后，现有功能即被代替，价值迅速被摊薄，朱啸虎公开称“这两家公司或将很快归零，根本守不住”。

今年3月，OpenAI发布论文开源了新模型代码：效果一步成图，1秒18张。有人因此评价“扩散模型Diffusion的时代结束了”。而此时距离后者成为2022“AIGC元年”诞生的重要技术基石，以及基于此带来许多模型的涌现，还不到一年。

所以这一波AI创业者、尤其是应用层公司，始终存在于一个左右互搏的困局里：不做，错过了是输；做了可能很快被替代，同样是输。

在Waves大会上，昆仑万维CEO方汉提到，他和中国最*的产品经理交流后发现，对方还处在很懵的状态：“这一波大模型远超产品进展”。随后的独立演讲中，猎豹CEO傅盛快速反驳了这一判断：“产品经理并不懵，很多已经在行动”。但显然至今，还没有令人满意的杀手级产品出现。阿里巴巴、百度推出大模型的当日，股价均不同程度下跌。

这些特性也造成了一级市场的一种奇观：除了红杉中国、真格、源码、五源、IDG资本等机构，“机构新出手很谨慎，更多积极在促成老项目和portfolio往AI方向转，从而多出去融钱”。

在一些投AI投资人眼中，不光是模型升级问题，如果AI安全冲突——这个普罗大众更关心的问题——进一步加剧，也可能会让AI浪潮再次进入低谷，这一次的AI信仰还能持续多久？

十年AI梦

十余年来，AI风口在创投界一直回环往复地出现。

技术路线的不停演化，让这个行业充满了那种“枪出现之前，研究如何能磨一把更快的刀”以及“发现未被识别的枪”的故事。

如同深度学习路线在2012年以前被忽视一样，在AlphaGo最热的2016年，通用人工智能被业界普遍认为不可能实现。“2018年GPT1推出，在当年看来是离经叛道的路。”绿洲资本创始合伙人张津剑曾对我们描述，当时的行业主流路线是垂直模型、人工标注，“仿佛雕花”，而GPT做通用，“强行用大量数据硬怼，在学界看起来很粗鲁”。

出门问问创始人兼CEO李志飞回忆起2年前开始做大模型的经历：团队顶着很大压力，技术总监几度提出离职。而此时其实距离谷歌2017年发表Transformer模型、为通用人工智能打开了*扇门，已经过去了三年，然而少有人识别出背后的意义。

追溯历史，从1960年代人工智能概念在学界被提出以来，仅本世纪就诞生过两次AI浪潮。

2012年，在全球*规模的视觉识别比赛中，时年65岁的Geoffrey Hinton教授带领两名学生拿下冠军。成功来源于在一种新的AI研究范式中找到突破：以深度学习为代表的神经网络派，从此前沉寂20余年的学术边缘研究，一跃成为正统主流。

之后十年间，深度学习成为大多数人工智能企业的底层技术基础，并从学术走向产业，在视觉、语音和语义技术等领域率先应用。

在中国，语音识别领域，诞生了出门问问、科大讯飞、云知声等公司，图像识别领域，则出现了AI四小龙旷视、依图、商汤、云从以及第四范式等。

而在2016年，谷歌AlphaGo在人机围棋比赛中以*优势击败世界围棋冠军李世石，让“机器智慧战胜了人类”的现实，*次在大众层面上被广泛认知。这迅速引发了全球AI军备竞赛，并很快迎来国家政策层面的支持。

在这场AI热潮中，大厂宣布All In，陆奇空降百度，腾讯、字节等相继组建AI Lab，阿里达摩院成立，马云喊出“三年投入1000亿元”的豪言。

各大科技论坛上，人们乐此不疲地探讨“奇点已来”和机器人三定律，投资人笃信，人工智能将是继蒸汽机、内燃机和互联网之后的第四次生产力革命。

彼时的创投行业正面临投资主题的缺乏（与当下不无相似），几次互联网大并购相继落幕，平台型机遇消退，巨头的触角无处不在。AI和直播短视频、共享单车等一起，接棒成为热门赛道。

AI投融资趋于狂热。有报告显示，2016年全球AI融资规模近百亿美元，相当于2000年到2013年13年间总融资额之和。一个侧面佐证是，在2016年全球股市低迷的情况下，英伟达股价依然涨了3倍。

但疲态很快显现。2019年，中国在AI领域的投资额与投资笔数大幅下降，9成AI创业公司处于亏损状态。猛烈降温开始了。

据IT桔子等数据显示，2014年至2018年，中国人工智能领域的IPO退出平均回报仅为1.83倍，2018年全年有将近90%的人工智能公司处于亏损状态。2019年，“投资人逃离人工智能”刷屏，经过几年凋敝，除联想之星、创新工场等机构外，国内真正在持续关注AI的投资人寥寥，大基金也几乎没有专人在长期覆盖。

可以说，除了少数早期投资者落袋为安，AI至今是一个没能让投资人赚到大钱的赛道。

一则至今被反复提起的投资人旧闻，或能代表其间惨烈：成立于2013年的格灵深瞳，传言公司在拿到天使轮后，徐小平在饭局上称其至少估值5000亿美元，而沈南鹏认为1000亿美元比较实际，最终妥协在了估值3000亿美元的中间数上。而现实让所有人意外，时隔9年，经历了流血上市的格林深瞳去年终登科创板，当前市值是65亿人民币（以7月6日收盘价计算）。

AI十年，至今还走在阻且长的道路上。

在旷视的首位投资人、联想之星总裁/主管合伙人王明耀看来，十年前的AI创业者处在摸索阶段，背景大多来自学术界，对变现的思考不甚清晰，加上并不成熟的产业配套，共同导致了AI商业化道路的漫长。

2011年，联想之星决定扶持三位年轻人走上创业之路，旷视当时估值仅1400万人民币。天使轮后，为避免人民币无钱可融，公司才转为美元架构。彼时资本市场的低预期，让“早年的AI创业者起步很难”。之后，旷视从CV游戏一路到相亲社交、商品推荐的尝试都不顺利，直到2015年与支付宝开始人脸支付合作。王明耀回忆，公司甚至“成立5年才拿到*笔政府安防订单”。而今天的市场，不可同日而语。

这也让创投界对AI的又一次狂热，显得格外义无反顾。而这次技术进步*的意义不同在于——AI*次具备了通用的可能。

如果说过去十年深度学习的两轮AI创新，仍然是点状分布，是面向特定任务的智能、作用于垂直行业，这一轮的大模型则是李开复所说的“从孤岛到大陆”的进步：无需人工标注，模型规模大，具备跨领域能力。

技术突破对旧世界的改造是剧烈的。一位互联网投资人对我们说，新浪潮之下，像商汤、旷视这样的大公司，至少还留下了大量算力和经验储备。而对更多的AI企业来说，随着技术的演化，或将“创业未半而中道崩殂”。

回不去的旧世界

“Holy shit！”DCM董事合伙人林欣禾脱口而出。

这是22年初联系到Tiamat创始人青柑时，林欣禾*次看到文生图效果的下意识反应。

这位亲历互联网浪潮的成功创业者，一直活跃在一线的古典互联网投资人。在对「暗涌Waves」描述当时情境时，他毫不掩饰惊讶，并坚定认为“新一代AI浪潮真的来了”，“不再以TMT时代的推荐为逻辑，而是直接替人完成所有事，人连鼠标都不用动。”

尽管对AI的投资还在迷雾中行走，甚至在短期内都将保持低沉，但这不妨碍它持续向旧世界开炮：像SaaS、出海等大量原有商业模式，面对即将被AI改写的命运。

一位长期关注企业服务的投资人认为，未来中国的SaaS公司，甚至所有2B企业，都应该是人工智能公司，软件将被智能即服务所替代。

AI一方面降低服务成本&提高人效，另一方面打通服务的流程环节。如果仍然是一家传统的软件公司，“那基本没戏了。”

风暴同样席卷原有的AI创业者，技术路线的失灵，带来的危机只会更甚：上一波基于深度学习做垂直小模型的AI公司，要么革命，要么死亡。

李志飞举例，以前很多做NLP的人，总觉得这些变化影响不到自己，“过去有PhD或教授专门研究语法解析、词性标注，未来这些中间环节都会消失”。很多从业者如今终于意识到，未来就不应该存在一个专门做机器翻译、问题回答或语音识别的工种。如果不转型，就将面临失业或工作无人关注的窘境。

在一些投资人看来，当生产力的供应结构被重新塑造，无限量的初级工程师将由AI替代。被长期作为中国商业自信叙事一部分的“工程师红利”，或将不再存在。

心识宇宙创始人陶芳认为，面对AI，接下来只有两种人：“溺水者or淘金者”，他进而反问到：“蒸汽火车来的时候，难道只影响马车司机吗？”

真格基金合伙人刘元则表示，对于投资人和创业者来说，这意味着“三五个人可以干翻大厂的机会”又重新存在了。他甚至感觉，“之前所有的积累恰好是为这一刻准备的”。

刘元在2014年入行，作为早期投资人，他“偶尔觉得有些生不逢时”：错过了移动互联网*的2011-2012，后来的双碳、新能源、汽车等风口又极度资本密集。而突然，TMT投资人所熟悉的数据飞轮、颠覆式创新、产品思维同理心等经典理论，“好像又重新有用了”。

在访谈中，刘元反复向我们提到维特根斯坦的那句名言：“语言的极限就是世界的极限”。他说，这是AGI更令他激动的部分：如果人的思维就是一个语言过程，那文科生臆想中的世界极可能在语言大模型上实现。

目前，经过*阶段的角逐，许多投资人们似乎更看好大厂的大模型试验。

不过，正如不久前下场大模型的幻方创始人梁文锋所言，“市场是变化的。真正的决定力量往往不是一些现成的规则和条件，而是一种适应和调整变化的能力。“而这或许才是创业公司的缝隙。

林欣禾在欢呼新时代到来的同时，也认为当前很多大模型有“因为缺乏应用而受阻”的可能。他类比五六年前美国AR/VR赛道的火热：谷歌眼镜烧钱无数，但至今未做出来。何况在这波AI革命中，软件尚未和硬件充分结合，“很多事情We still have to see”。

但无论如何，在林欣禾看来，ChatGPT就像一道玻璃门，一旦跨过就再也回不去了：“AI is the new internet.”

这场至今不过200天的创业潮，或许正是未来创投故事的典型样貌：道路无疑正确，但注定漫长。

关键词：

责任编辑：sdnew003

返回首页返回期货首页

狂飙200天：进退两难的中国大模型团战

相关新闻

热文排行

投资

产业

创投

关注

热门主题

综合热门

热门主题

科技热门

热门主题

狂飙200天：进退两难的中国大模型团战

相关新闻

热文排行 投资 产业 创投

关注 热门主题

综合热门 热门主题

科技热门 热门主题

热文排行

投资

产业

创投

关注

热门主题

综合热门

热门主题

科技热门

热门主题