129. 全球大模型第一股上市访谈：对话智谱CEO张鹏，敢问路在何方？

本集简介

上市前夕，智谱CEO张鹏在一次出差途中摔断了右腿。抵达访谈现场时，他拄着双拐。当时智谱尚未公布具体上市日期。与MiniMax关于"全球大模型第一股"的角逐仍在继续，胜负未分。张鹏引用了一句西方谚语：Break a leg（断条腿），这通常寓意着好运。数日后，谜底揭晓。智谱确认将于2026年1月8日在港交所挂牌，成为中国首家上市的大模型企业，这也意味着它将摘得"全球大模型第一股"桂冠。若百年后智谱被载入AI史册，你希望它如何被铭记？ "AGI的探路者。"张鹏沉吟片刻答道，"一个开道者。" 这是《张小珺商业访谈录》2026年首期节目——恭祝新岁！期待2026年我们与AI共成长！ 02:22 第一个吃螃蟹的人 20:29 从感知智能到认知智能的探索 29:25 GPT-3横空出世！ 40:46 ChatGPT再掀浪潮：既焦虑又亢奋的2023 01:09:06 2024年：新主角登场 01:17:58 规模法则的范式演进 01:29:56 2025年：向深度求索取经 01:38:40 开源与闭源之争 01:48:33 IPO：全球大模型第一股 02:01:40 开道者【更多信息】本节目由语言即世界工作室与微博财经联合呈现。免责声明：本内容不构成投资建议。

双语字幕

仅展示文本字幕，不包含中文音频；想边听边看，请使用 Bayt 播客 App。

Speaker 0

开了一扇窗户，它并不是开了一个很敞开、很大的一个门。

Speaker 0

说你随便走吧。

Speaker 0

所以我们是首先吃螃蟹的人。

Speaker 1

跟投资人当时讲这事儿的时候，他们兴奋吗？

Speaker 0

听不懂，他们完全听不懂这是什么东西。

Speaker 0

你们怎么赚钱？

Speaker 0

怎么把这个东西商业化了？

Speaker 0

投资人问的都是这个。

Speaker 0

我印象特别深刻，有个投资人：‘这东西你们能变成钱吗？

Speaker 0

’就给你看这个大环境这么差，经济这么差，要不你们把估值降一半怎么样？

Speaker 1

我听过一个评论啊，就是在讲智普的。

Speaker 1

因为智普其实一直不算是市场上最火、最明星的项目，但是是技术延伸的项目。

Speaker 1

然后你们是有视野、有技术，但是看起来会有点……Boring，他给我一个描述说就像水泥一样。

Speaker 0

他能干得很漂亮，但是他就是没有太多的情绪价值。

Speaker 1

哈喽，大家好，欢迎收听张小俊商业访谈录。

Speaker 1

我是小俊，这是一档由元吉世界工作室出品的深度访谈节目。

Speaker 1

我们希望和你一起从这里探索新世界。

Speaker 1

上市前夕，智普CEO张鹏在一次出差途中摔断了跟腱，到达访谈地点时他拄着一副拐杖。

Speaker 1

当时，质朴确切的上市时间尚未明朗。

Speaker 1

它与MINIMAX之间围绕全球大模型第一股的竞争仍在持续，结果并未尘埃落定。

Speaker 1

张鹏提到一句西方俚语：BREAK A LEG，摔断一条腿。

Speaker 1

它通常意味着祝你好运。

Speaker 1

几天之后，结果揭晓。

Speaker 1

智普确定于2026年1月8日，也就是今天，登陆港交所，成为中国首家上市的大模型公司。

Speaker 1

这也意味着它将是全球大模型第一股。

Speaker 1

就在这个意味深长的历史性的时刻，我与张鹏做了一场三小时的长谈。

Speaker 1

一百年后，如果智谱会出现在人工智能的历史书上，你希望它是被怎么撰写的？

Speaker 0

智谱是A G I历史上的一个先行者，就开路的人。

Speaker 1

这是张晓珺商业访谈录，与大家2026年见面的第一集节目。

Speaker 1

祝大家新年快乐，期待在2026年我们与AI一起进步。

Speaker 1

张鹏老师，先给观众朋友们打个招呼。

Speaker 0

大家好。

Speaker 1

小军好。

Speaker 1

我来这栋楼感觉还挺恍惚的，因为从二三年开始我就经常来这栋楼进行采访。

Speaker 1

然后那个时候这里有很多公司，对，比如说你们，然后有百川、百川，还有当年的光年之外。

Speaker 1

是今天这些公司，感觉命运已经开始分化和变得迥异了。

Speaker 1

你有什么想说的？

Speaker 0

呃，说长吧。

Speaker 0

你说六年多时间，你从二三年开始算到现在，可能就三年时间。

Speaker 0

但是说我们质朴成立开始算，有六年多时间。

Speaker 0

那段时间六年多时间，说长不长，但是确实发生了非常非常多的事情。

Speaker 0

嗯，我们有时候经常的感慨，可能过去需要十年、十五年发生的事情，可能就在这五六年的时间里面就发生了。

Speaker 0

嗯，所以确实是变化很大吧。

Speaker 0

但是也也很感慨，是否能走到今天也非常不容易。

Speaker 1

是怎么开始这段旅程的吧？

Speaker 0

可能我在有一些场合跟大家讲过我们出来创业的这个故事，因为我的履历也非常的简单。

Speaker 0

其实大家就是清华，对，基本上从九八年进了清华就没离开过，到现在为止也在给清华打工，因为是我们的股东嘛。

Speaker 0

嗯，那我毕业以后其实就在清华大学的计算机系工作，在实验室里面工作，叫知识工程，就是人工智能相关的这样的一些事情。

Speaker 0

那到1516年左右的时候，其实是一个很关键的一个点。

Speaker 0

嗯，呃，因为之前像我们实验室里面也走出去过，像呃唐文斌啊、杨木啊这些呃学生，然后很成功的，对对对，很成功的创创办了旷世。

Speaker 1

对创旷世的联合创始人。

Speaker 0

对对对，也是上一代我们叫上一代人工智能四小龙之一吧。

Speaker 1

嗯。

Speaker 0

AI一点零时代。

Speaker 0

对，在那个时候，1516年的时候，其实我们在内部就在讨论这个问题，当然是在实验室里面讨论这个问题。

Speaker 0

看到这些企业其实非常的成功，也在市场上也取得了一定的成就，也面临一些问题。

Speaker 0

但是因为我们当时在学校里面，更多要关注的是说技术本身的眼镜到底有什么样的一些问题。

Speaker 0

其实那个时候很多大家其实对于未来人工智能技术的眼镜这个事情，其实看得更远。

Speaker 0

嗯，他们会觉得说，哎，其实呃，像CV、像早期的NLP和机器学习的这些方法。

Speaker 0

可能也就天花板就在这儿了，他可能也做不到我们说理想当中的通用人工智能啊等等这些事情。

Speaker 1

那时候还没有这个概念吧？

Speaker 1

通用人工智能。

Speaker 0

AGI是有的，AGI是有，但是呢，这个当时的这个第一代这个人工智能企业之后再往后是什么，就大家其实想不太清楚。

Speaker 0

嗯，所以大家是借着这个问题看到了这个现象，借着这个问题在讨论说我们下一代应该怎么办。

Speaker 0

像张博院士啊，带着我们系里面很多老师，包括我们这个年轻的一些人一起在。

Speaker 0

然后在聊这个事情，所以那个时候其实就逐渐的有一点想法，说我们要去做下一代的人工智能这个事儿。

Speaker 1

当时就想做下一代人工智能。

Speaker 0

没错。

Speaker 0

其实有两个点，第一个就是说技术上现有的这些呃技术它确实是有天花板的，你再怎么样做它，比如说人脸识别它超过人又怎么样呢？

Speaker 0

超过人之后没有意义了，就是再往上已经无法再去突破了，它能取得的产业的效果也就这个样子。

Speaker 0

那下一代的技术是什么？

Speaker 0

第二个点是说，呃，也看到了这一代就上一代的这个人工智能企业的成功，也吸取了一个经验。

Speaker 0

人工智能这件事情它本身不是一个纯科学，不是理论科学，它是一个工程实践加理论科学，这个同步演进的这样一个综合性的学科。

Speaker 0

所以做下一代的人工智能。

Speaker 0

不光是学校的事情，不光是研究的事情，也要到产业里去做啊。

Speaker 0

所以当时就这两个方面，一个是说我们技术上还需要突破，做下一代到底是什么，我们要把它想清楚。

Speaker 0

下一个这个事情也需要在产业里面慢慢去孵化它、去成熟它。

Speaker 0

所以那个时候就其实给了我们一个一个一个一个契机，就是说讨论说：哎，下一代到底是什么？

Speaker 0

然后这下一代的这个事情到底要怎么去办、怎么去做。

Speaker 0

跟企业到底是什么关系？

Speaker 0

产业是什么关系？

Speaker 0

所以这是大概一六年左右的事情。

Speaker 0

一六年的第一个问题的结论，就是说我们产生了一个词叫认知智能。

Speaker 1

认知智能对。

Speaker 0

叫认知智能，就是那个时候大概是在那个时候一六年左右的时候。

Speaker 1

那时候还不叫通用智能。

Speaker 0

对吧？

Speaker 0

通用人工智能只是一个很大的目标，呃，很大的一个目标。

Speaker 0

当然我们认为认知智能是我们说的感知智能的下一代啊。

Speaker 0

啊，就是它是迈向通用人工智能的一个下一个台阶。

Speaker 1

它并不等同于对它。

Speaker 0

并不等同于通用人工智能，因为那个时候其实大家对通用人工智能觉得唉，很遥远，我也定义不清楚，就不用强行去定义它。

Speaker 0

但是呃，如果是下一步嗯，NEXT STEP这个事情，我是可以尝试去定义它的。

Speaker 1

清华当时就已经有很多这种跟产业界的合作。

Speaker 0

对吧？

Speaker 0

非常多很多。

Speaker 1

它有这种渊源。

Speaker 0

对，清华一直是在人工智能这一块是非常重视产业落地的，做了很多的跟呃企业的合作，对吧？

Speaker 0

不光是纯粹在实验室里面做这个研究，嗯，做应用、做落地。

Speaker 0

当时我们实验室其实还是非常厉害的，当时我们在那个年代的时候是少有的。

Speaker 0

可以拿我们的技术去挣美金的，怎么挣？

Speaker 0

就跟国外的企业合作啊。

Speaker 0

哦，他付我们都是美金。

Speaker 1

哦，至少有能挣美金的实验室。

Speaker 0

对对对，就是说明那个时候其实中国的人工智能技术和研究还是比较靠前的，嗯，比较靠前。

Speaker 0

所以那个是在那个年代到一六年的时候，我们就基本上心里就有这个准备，就要去做一个企业，拿我们的一些啊阶段性的、研究性的成果来去寻找下一代人工智能，就认知智能的这个路径。

Speaker 1

为什么是要你们几个人来开始做呀？

Speaker 1

这个是有渊源的吗？

Speaker 0

这个不是别人要我们怎么做，是你们想做。

Speaker 0

这是我们自己想做。

Speaker 0

我当时在实验室里做工作的时候，其实负责的就是就叫工程转化这一块。

Speaker 0

教授们带着学生们做研究，博士们说什么做研究，做完研究的这个东西他可能发paper了，做了一个prototype，做了一些简单的代码。

Speaker 0

但是我要去deliver给。

Speaker 0

这个我的企业的客户说，按企业的客户的要求，肯定不只是说一篇PAPER，或者说几个呃PROTOTYPE的代码，需要是一个SYSTEM，需要是一个PRODUCT。

Speaker 0

那段时间我就带着一帮人在做这些事情。

Speaker 1

清华一直有这个工程转化的这个职位。

Speaker 0

对我们清华的一个非常有意思的事情，一直有我们系也一直有我们实验室有甚。

Speaker 0

啊，所以这是我们的传统啊。

Speaker 0

就是就是从我的导师建立这个实验室开始，他就非常重视这个事情。

Speaker 0

他提了一个概念，叫我到现在还记得特别清楚，叫P TO P，不是那个爆雷的那个网贷P TO P啊，它叫PAPER TO PROJECT或者叫PAPER TO PRODUCT，就是你的PAPER研究成果一定要转换成实际能用的产品。

Speaker 0

或者系统，嗯啊。

Speaker 0

你看现在这个清华基本上工科类的这种院系，现在基本上推广这个概念已经非常普遍了。

Speaker 0

嗯，就对于原来博士生来说，可能你教一篇论文、博士论文，然后理论上有突破OK就可以了。

Speaker 0

但现在基本上都要求要有实际的SYSTEM，要有实际的应用。

Speaker 0

这就其实就是一个推广的过程，大家都接受了这个概念。

Speaker 0

所以早期的时候其实我们就有这个基因，就有这个想法做这个事情。

Speaker 0

嗯，所以我们当时就认为说我们既有研究上的这个前沿，又有这个水平。

Speaker 0

那工程上呢，我们把研究成果转换成工程呢，我们又有这样的基因，又有这样的这个能力。

Speaker 0

那其实这个事情就满足了这两个条件，我们可以去把它在产业化的这个角度来说，把它落地。

Speaker 0

嗯，同时反补用我们的工程实践来反补我们的研究工作啊。

Speaker 0

所以这个就是我们选择做这个事情的动因，并不是谁要求我们去做这么个事情，当然有一些。

Speaker 0

老师们倒是也还提过这件事，就比如说张茂老师其实还很清楚的跟我们讲过。

Speaker 0

他说人工智能这件事情，它就是一个跟产业紧密不可分的事情，你们就应该去产业里面去做这个事。

Speaker 0

嗯，不管是研究还是真正的去啊商业化，这个都是一个产业的事情。

Speaker 1

是普有几位联合创始人，你们当时的分工是什么样的啊？

Speaker 1

就在学校里面啊。

Speaker 0

当时其实在实验室里面没那么复杂，都比较简单。

Speaker 0

你比如说像几位教授啊，唐老师、李老师、徐老师，他们主要是做科研，嗯，啊做研究，核心的技术的突破，带着学生一起做研究，写PAPER。

Speaker 0

然后做一些事情，然后我会带着工程师团队们一起去把这些东西承接下来，做一些系统，做一些呃PRODUCT，然后去交付一些客户的一些需求啊。

Speaker 0

所以当时我们能挣外国人的钱啊，像德斌他也是做知识产权出身，他博士毕业以后，他高高文的院士的学生嘛，毕业以后在做知识产权专利相关的事情，做了一段时间，所以他这一块比较熟悉成果的转化怎么去做IP。

Speaker 0

怎么去做这个推广？

Speaker 0

技术的推广啊，合作。

Speaker 0

嗯，然后三门呢是后来加入我们实验室之后，就是我们总裁啊王少兰。

Speaker 0

他是因为在一个上市公司的北京这边呃中国区这边当老大，就市场他非常熟悉，而且他也是工科出身，做芯片的企业出身啊，所以他也非常熟悉我们这个行业，要帮助我们去做一些推广啊，做一些联合生态这些事情。

Speaker 0

所以其实它这个分工就跟我们现在其实基本上是很类似的，所以很自然的我们组合到一起来做这件事情。

Speaker 1

当时要负责工程转化嘛，你当时想认知智能应该怎么转化？

Speaker 0

其实这里边有一些讨论出来的一些结论，就是首先第一个工程转化这件事情呢，除了你要把这个原来的PROTYPE变成一个呃生态环境里边可用的产品。

Speaker 0

这个相当于是一个SOFTWARE的东西，嗯，对吧？

Speaker 0

第二个呢，你还要去真正的落地，去结合真正的这个实际啊，生产场景里边的各种各样的硬件、软件、各种条件。

Speaker 0

所以这是一个适配性的问题。

Speaker 0

更复杂的就是你要真正到推到市场上去跟客户去售卖这些东西的话，它还有一个呃商业的问题，就是你的成本、你的收益之间怎么样去平衡的问题。

Speaker 0

嗯。

Speaker 0

对，所以这些这些事情就是在那几年里边，或者说那十几年里边，慢慢地去学会的。

Speaker 0

嗯，我也不是干这个出身。

Speaker 0

就比如说，尤其商务那一套东西，商务对对对，那套东西你怎么跟大家报价？

Speaker 0

对吧？

Speaker 0

你报什么样的价格是合适的？

Speaker 0

你的成本该怎么核算？

Speaker 0

嗯，啊，这些事情其实以前你在学校实验室里面肯定是不太考虑这些东西的。

Speaker 0

嗯，但是你真正面临商业客户的时候，肯定就会人家说。

Speaker 0

那那那你报个价格给我。

Speaker 1

第一次报价紧张吗？

Speaker 0

其实挺紧张的，心里没啥底。

Speaker 0

嗯，因为那个时候也不像在公司里面有这么完整的财务啊什么之类的，你能知道说我每个人花多少钱，对吧？

Speaker 0

我每天的办公费用是多少，其实也没有什么太大的概念。

Speaker 0

所以很多时候就拍脑袋拍了，大概估了一个。

Speaker 0

哦，对。

Speaker 0

所以早期的时候其实很多的项目大概大家就是收了点辛苦钱，对，挣了点成本，然后大家发了点呃学生们、老师们发了点那个奖金。

Speaker 0

嗯。

Speaker 1

也就那样了。

Speaker 1

一六年还没有想过要创业吧？

Speaker 0

一六年其实在考虑这个问题，已经开始考虑了，已经在考虑这个问题。

Speaker 0

真正我们开始行动是一七年，一七年我们就尝试在学校这个体制底下啊，科研院所这个体制底下，怎么去把这个商业化、这个转化这个路径走通。

Speaker 0

因为那个时候其实唉，学校里面的这些这个叫呃体制内人员去开公司这个事儿其实是不允许的，敏感对对，它是不允许的。

Speaker 1

大家都知道之前没有先例吗？

Speaker 1

有。

Speaker 0

在职人员有，但是呢，大家都是就是不是这种正式的官方的渠道。

Speaker 0

就是你一个老师在外面开一个公司，好像也没人举报你什么的，你也就过去了。

Speaker 0

但是严格来讲，这个事情是需要跟学校去报备批准的。

Speaker 1

对吧？

Speaker 1

或者是不是可能公司如果开得好的话，就慢慢就离职了？

Speaker 1

从学校严格来讲。

Speaker 0

这两件事情不它不能联系起来，它是并行的两条线。

Speaker 0

但学校呢，就是这个事情发生多了之后呢，像这种学校呢，它会有些考量，它会有一些规管理规定出现。

Speaker 0

就不允许啊，或者什么你要报备啊，什么反正就出现这些事情。

Speaker 0

所以在1617年的时候开始做这件事情的时候，我们就找想找一个官方的路径，就专门做这件事情的路径。

Speaker 1

正式的没有想过先悄悄的做，然后悄悄的做被发现了再说。

Speaker 0

这这个总会留下一些首尾嘛，我们还是希望说这件事情呢走的比较顺畅，不要给自己留下一些首尾一些问题。

Speaker 0

所以1617年的时候，其实在找这个路径。

Speaker 0

学校其实也想干这个事儿，他想做一些，比如说学校那个时候成立了一些产业转化的一些机构，像数据科学研究院，像巴拉巴拉的一些机构。

Speaker 0

二级机构其实他就是想做这个事儿，而且请来的这个负责的人都是原来在产业界待过的啊。

Speaker 0

你看这个意图就很明显啊，他也学校也觉得我有很好的这种科研成果。

Speaker 0

那我为什么不能把它转换成商业价值呢？

Speaker 0

对，但这个路径怎么做呢？

Speaker 0

也在探索。

Speaker 0

后来这个契机是到一八年的时候，国家包括教育部，包括呃几个部委吧，联合给了一个意见，就给了一个专门针对这种事情的一个意见，一个一个办法，就允许。

Speaker 0

这个科研院所的这个在职人员，用已有的研究成果做科技成果转化。

Speaker 0

然后规定了说怎么分配啊，一部分给到这个原来科研院所，一部分给到这个创始的团队或者研究团队啊，他们自由支配。

Speaker 0

啊，这是开了一个窗户。

Speaker 1

但是这个分配比例好吗？

Speaker 1

条件好吗？

Speaker 0

当时的分配比例其实没有特别明确的说到底这个比例是是多少。

Speaker 0

我印象当中啊。

Speaker 1

没有白纸黑字的写下来。

Speaker 0

还是要谈的是要聊的，好像是定了一个底线还是什么，我忘记了这个细节，有点记不太清楚了。

Speaker 1

嗯，如果学校把自己的比例抬得过高的话。

Speaker 0

对创业公司也不好，不是很有利嘛，对吧？

Speaker 0

所以那个时候其实当当然这个事情我就跟说了，他开了一扇窗户，就大家看到了，哎，外面还可以有这么一条路。

Speaker 0

他并不是开了一个很敞开、很大的一个门，说你随便走吧。

Speaker 0

啊，他也没有那么方便。

Speaker 0

所以出了这个意见之后，他怎么执行？

Speaker 0

这个比例到底定多少？

Speaker 0

谁拿多少？

Speaker 0

谁拿什么分？

Speaker 0

怎么约定？

Speaker 0

怎么评估这个成果？

Speaker 0

其实这些细节都没有。

Speaker 0

所以我们是首先吃螃蟹的人啊，我们就拿这个东西。

Speaker 0

诶，你看国家给了这个东西，那跟学校谈说：‘学校，你你怎么办？

Speaker 0

我要我想办怎么办？

Speaker 1

’这个是你负责谈吗？

Speaker 0

这个当时还不是我的，就我们董事长去谈的，他对这块比较熟悉。

Speaker 0

我刚才讲了嘛，他做IP啊什么相关这些事情，然后就跟学校去沟通这个事儿。

Speaker 0

学校这边其实也挺马爪的，他说我只有这个文件底下这这个操作细节是什么我也不知道呀。

Speaker 0

啊，你们是第一个，或者说我们你们是最先开始来聊这个事情的人，那我们就一起来聊这个事儿呗。

Speaker 0

嗯，所以学校到我还特别记得当时那个科研院的院长啊，金院长，还有当时管这个成果转化孵化啊，也是我们的一个师姐。

Speaker 0

呃，叫志鹏吧。

Speaker 0

呃，反正还有很多人呐，包括学校的领导都很支持这个事儿，大家一起坐在一起聊这个事情呀，怎么办？

Speaker 0

怎么分？

Speaker 0

怎么样合理，对吧？

Speaker 0

因为刚开始，嗯，国家的意图也很明显，就鼓励大家去做这科技成果转化嘛，对吧？

Speaker 0

不要躺在这个这个这个保险柜里，然后把它转化成产业的这个这个这个价值。

Speaker 0

嗯，所以就开始聊。

Speaker 1

其实大家还其实还是啊。

Speaker 0

其实双方都很有意愿。

Speaker 0

嗯，无非就是说在这个过程当中怎么把这个东西厘清，嗯，操作的流程怎么来定这个东西。

Speaker 0

之后大家不要留下一些遗留的问题，没考虑到的细节等等等等。

Speaker 0

所以当时我们就开始走这个事情，它真正走通就已经到一九年。

Speaker 1

我们是两年。

Speaker 0

一年多一年多啊，那个办法是一八年的，我记得是应该是一八年的一月份嗯出来的，然后研究这个细节，走通整个流程，公司注册到六月一九年的六月份，一年半时间我们是第一家，我们系里面第一家。

Speaker 1

所有整个清华都是第一家。

Speaker 0

呃，至少我们计算机系是第一家。

Speaker 0

其他学校我不是很清楚，不太了解。

Speaker 1

这一年半主要就是时间耗在哪儿啊？

Speaker 0

就是谈这个中间这个过程啊。

Speaker 0

比如说大家分多少是三七开、二八开还是一九开？

Speaker 0

哦，啊，你评估多少？

Speaker 0

就是你整个这个东西我们有科技成果。

Speaker 0

我们也有拿奖的成果，这成果都做过一些鉴定。

Speaker 0

那到底它值多少钱？

Speaker 0

嗯，以前都不拿钱来评判的嘛，顶多是说啊，是一个什么样的一个水平，对吧？

Speaker 0

他没有拿钱，因为你一旦产业化这做东西，最后都归到钱上，对吧？

Speaker 0

因为做股占股本啊什么之类的，你都需要作为用钱作为单位来衡量。

Speaker 0

所以他最后一个这个评估的这个过程怎么来？

Speaker 0

定义这个价值是多少，货币上怎么定义这个事情就谈就弄了很久。

Speaker 1

最后让你满意吗？

Speaker 0

我觉得还挺好的吧。

Speaker 0

嗯嗯，我觉得还挺好的，还算是比较顺利。

Speaker 0

虽然耗去了一年多时间，但是我刚才讲了，因为你毕竟是第一个吃螃蟹的嘛，你前面没有人走过这个路，嗯，就学校也没走过，学校也不太清楚这个事情该怎么办。

Speaker 0

所以大家是在互相理解，互相的配合，找到这个契合点。

Speaker 0

合适的契合点又不要给大家造成一些后续的麻烦，嗯，什么之类的。

Speaker 0

因为他们可能也体制内嘛，他从快也还有一些哼国资啊什么的这些事情的一些要求，能把这个事情能这么快的走下来，我觉得是非常不容易的。

Speaker 0

肯定是学校我们还有各方大家配合把这事情做下来的。

Speaker 1

嗯，当时有没有参考一些比如说海外斯坦福教授？

Speaker 1

在我们看公司，因为海外这个非常多。

Speaker 0

非常多。

Speaker 0

嗯，所以当时确实是看了很多，然后学校这边肯定是广泛的调研和看过这个事情，然后我们也就反正也举过一些例子跟大家解释这些事情，谈这些事情。

Speaker 0

但是这个细节我有点不太清楚，因为主要是董事长德斌他们跟他们他们跟学校去谈的嘛。

Speaker 0

我那时候这个事儿我没参与太多，但这个历程我知道确实不容易。

Speaker 0

啊，搞了挺久的。

Speaker 0

其实我们那个团队运转是一七年就开始，我们就在哦相对比较独立的在运转哦。

Speaker 1

但是公司注册成立是一九年。

Speaker 0

完全转出来那个时候就一九年注册以后，就把这个团队从学校的实验室里面哒哒哒全部都转出来。

Speaker 1

哎，这个还挺有意思的，因为其实这个政策出的时候是一八年，然后第一个你们作为第一个吃螃蟹的人，是其实你们在很主动在铺置这件事情，在整个清华里面。

Speaker 1

所以你们还是一帮非常就是想创业的人对吧？

Speaker 0

相对于其他人来说。

Speaker 0

对，所以刚才你说的是谁让你去让你去创业？

Speaker 0

其实没有，其实我们自己想做这个事儿。

Speaker 0

所以我一直说质朴这个包括我们这个团队还是非常。

Speaker 0

幸运的一帮人，嗯，很多事情恰好就在那个时间发生了。

Speaker 0

你碰到了最好的事情，然后对，发生了，然后你正好又踩在这个点上。

Speaker 1

这是一七年到一九年，其实一条线。

Speaker 1

你们是在跟学校谈，在公司这条线上，你们当时在做哪些事情啊？

Speaker 1

以及有哪些尝试？

Speaker 0

当时的话，因为我们这个团队呃，从实验室。

Speaker 0

那个时候就已经有一个不小的团队，大概有一二十人嘛。

Speaker 0

一团队就专门做这些事儿。

Speaker 0

嗯，当时我们主要做的是一个科技情报的一个平台、一个产品。

Speaker 0

这产品在国际上还是非常有，包括国内也有很大的一个影响力。

Speaker 0

嗯，叫A MINER。

Speaker 0

当时我们就专门的一个团队在做这些产品化、做这个服务商业化的转化啊。

Speaker 0

那个时候我们就已经在通过这个产品、通过这个技术服务很多的客户。

Speaker 0

包括这个一些高科技企业，刚才说挣美元嘛，呃，当时的呃什么谷歌啊、斯美孚啊这些，包括IBM啊什么，全部是我们的客户。

Speaker 1

哦。

Speaker 0

那时候公司是盈利的吗？

Speaker 0

那时候没公司，但我们肯定很赚钱。

Speaker 1

很赚钱。

Speaker 1

就是按项目制去一个一个的去给他交付，对，能赚多少钱？

Speaker 0

那时候这个我倒是他不是太关心这个事情，但是我当时有一点印象是有一年我们大概就这个整个实验室的就挣的这种横向，我们叫横向的科研经费。

Speaker 0

就项目经费啊，我们就挣了好像一年有接近两千万。

Speaker 1

所以你们当时已经是学校非常有钱的老师了。

Speaker 0

唉，这这因为这个钱进不了个人兜。

Speaker 0

对，一方面我是觉得其实挺好的，市场有很大的需求，这个技术确实也有它的领先性，我们就想做这个事情，而且也确实让我们看到了一些机会，说去向这个就刚才说的下一步的这个认知智能这个方向去迈进。

Speaker 0

对这个更新迭代的速度，可能去产业界之后会更快。

Speaker 1

你们怎么能定义这个感知智能到认知智能的这个技术区别？

Speaker 0

其实有一个很经典的问题，就是我们跟张博老师聊天的时候，张博老师老举的一个事情。

Speaker 0

那个时候啊，他说那个时候的上一代的人工智能是解决的是个感知的问题，其实他不知道，他不知道。

Speaker 0

对你想想这个问题，其实挺有意思。

Speaker 0

他画了一个象限，他在一个象限里面。

Speaker 0

一个二维的象限里面，他画了一下。

Speaker 0

叫现在的问题，人工智能解决的这个问题，就是说就是一些非常小的一个范围的这个问题。

Speaker 0

嗯，然后再往外就是认知上，就是我知道我不知道啊，对吧？

Speaker 0

就人有这个这个这个这个能力嘛。

Speaker 0

然后还有一块呢，是我不知道我不知道。

Speaker 0

嗯，所以其实我们现在探索的事情，就是想让机器具备类类似这样的认知的能力，而不是简单的就是说我识别个图片或者是理解个语，就翻译个语音这样的一个事情。

Speaker 0

就这个东西，它没有脑子。

Speaker 0

就原来的那个技术，它其实不是个脑子，嗯，它只是一些技能，嗯，单个的技能。

Speaker 1

现在人工智能具备认知了吗？

Speaker 1

我看前几个月吧，唐杰老师还发了一个微博说，大家觉得人工智能有认知吗？

Speaker 1

可以跟我交流。

展开剩余字幕（还有 480 条）

Speaker 1

就现在现在解决这个问题了吗？

Speaker 0

我觉得正在解决的。

Speaker 1

途径当中还没有解决完。

Speaker 0

嗯，因为认知的本质是什么，这件事情还没有得到最终答案。

Speaker 0

嗯，这个事儿是一直是。

Speaker 0

呃，计算机科学家，嗯，还有这个脑科学，还有这个认知科学，有专门的认知科学，嗯，认知心理学。

Speaker 0

这些科学家们一起在研究的一个问题，就是人的认知能力到底是因为什么？

Speaker 0

不知道，现在还没有彻底把这个奥秘解开。

Speaker 0

嗯，所以现在的包括带大模型。

Speaker 0

之内在内的这些技术，是不是真的模拟了人的这个认知？

Speaker 0

或者说掌握了人人类认知的这个本质？

Speaker 0

我觉得肯定不是，还没有到那个地步。

Speaker 0

因为你自己都没搞清楚这个本质是啥，嗯对吧？

Speaker 0

所以你很难说这个事情你已经解决掉了。

Speaker 1

但是站在那个时时间窗口上，你们当时看到的下一代人工智能就是这个认知智能。

Speaker 1

所以想做这个事情，认知智能和那个情报系统他们是什么关系啊？

Speaker 0

我们是把这个认知智能的能力应用在某一个领域里面去。

Speaker 0

去做这个研究，以及体现它的能力。

Speaker 0

因为为什么做情报这个事情呢？

Speaker 0

其实我不知道你了不了解这个情报学。

Speaker 0

原来情报学的定义，在学科定义里边，情报学的定义是在图书馆下面，就是原来就很多的这种图书馆，它保存了大量的科技文献。

Speaker 0

然后所谓的情报学，就是通过大量的这些文献数据的这种分析和研究，得出新的知识或者新的信息啊。

Speaker 0

这个叫我理解啊，我理解它就是情报学要做的事情。

Speaker 0

那你想想，为什么这些顶级的这个研究人员才能做这个事情？

Speaker 1

因为他需要涌现出新的知识。

Speaker 0

对他要理解原有的那些文献表达的那些知识，首先这是第一理解的能力。

Speaker 0

第二，你要把能把这些理解的这些能这些知识综合起来，重新演绎，重新按照你的目标、你的想要解决的问题，重新演绎去推理。

Speaker 0

并且第三，得到一个新的东西，得到新的知识。

Speaker 0

这个事情很伟大，人类的知识就是这样出来的，不断的增长、不断的增长、不断的增长。

Speaker 0

因为用旧的东西，然后融合，然后推演，然后得到新的东西。

Speaker 0

其实本质上它就是这么来的哦。

Speaker 0

对，所以情报学研究的这个东西，它特别像我们刚才说的那个认知的能力，就不是像它本质就是认知能力的一种应用哦，非常密集的一种应用啊，非常典型的一种应用。

Speaker 0

所以我们一开始就做这件事儿，它是因为难度很高啊。

Speaker 1

大公司为什么买单？

Speaker 0

比如说GOOGLE，你知道他们找我们做什么事儿吗？

Speaker 0

不知道。

Speaker 0

那非常有意思，就大公司向我们买单的就是找我们做这件事儿。

Speaker 0

他问的问题也非常简单，就你就告诉我未来三到五年，在某一个领域里边，哪些技术会成为热点。

Speaker 0

成为重要的。

Speaker 1

技术哦，它其实是个预测。

Speaker 1

对。

Speaker 0

技术预测对。

Speaker 0

所以你看预测这种事情，它一定是要基于认知的。

Speaker 1

现在市场上大家也在做市场预测。

Speaker 0

是一个事儿，是一个事儿。

Speaker 0

但是这个事情呢，你再往下下钻细分呢，其实还有很多种的这种问题。

Speaker 0

你像科技情报，因为科技、科技类的信息它相对来说比较规范，比较好做论文、科技报告、专利这些东西，它都是有规范性格式的啊，也描述相对来说也比较严谨。

Speaker 0

有语料，对的。

Speaker 0

你有数据啊？

Speaker 0

嗯，啊，算法是我们擅长的。

Speaker 0

那我们加上这些数据，比较规范的数据，我们来做这个事情。

Speaker 0

最后的结论就是说告诉你一些预测的结果，我建立起一个模型，对吧？

Speaker 0

我们交付的就是这么个东西。

Speaker 1

那时候给谷歌预测了点啥？

Speaker 1

有预测到大语言模型的爆发吗？

Speaker 1

不太记得细节了。

Speaker 1

嗯，他们是怎么找到你们的？

Speaker 1

就是全球来看，做这个情报系统的人是不是也不多？

Speaker 0

那个时候呃，其实国外还是有的。

Speaker 1

国内也有一些做，他们为什么不用国外的团队啊？

Speaker 0

所以我们当时说的我们那个平台叫A MINOR，那个平台其实本身在国际上影响力还不错。

Speaker 0

而且我们专门做这一块啊，其他呢可能就是咨询机构在做，包括国内的其他一些厂商做的这个事情。

Speaker 0

单位也是从图书馆出来的，比如说原来的中科院的这个情报所，他们是图书馆出来的啊。

Speaker 0

你们是计算机系出来的，对我们是注重算法啊。

Speaker 0

我们那时候不是通过人做，传统的做法是通过专家。

Speaker 0

大量的调研问卷，然后研究文献、阅读文献、写报告。

Speaker 0

嗯，统计人工去做这个事情，靠专专业的这个专家的这个经验去解这个问题。

Speaker 0

那个时候我们是用机器、机器学习的算法，用模型来解决这个问题。

Speaker 0

嗯，效率也不一样，嗯，处理数据的速度也不一样。

Speaker 0

可能准确率也可能不一样啊，高低啊。

Speaker 1

反正就是这个算力需要的大吗？

Speaker 0

啊，那个时候机器学习算法不像现在还好，也需要嗯，也需要。

Speaker 1

其实是找到了一个场景，所以你们当时一出来创业就是有一个确定性的场景的。

Speaker 0

是当时出来的时候其实是在做这个事情，嗯，但本质上我们是在做背后的这个核心的这个技术，就怎么样用数据机器学习的算法去构建这个模型。

Speaker 0

它本身跟大模型现在解决这个问题非常类似的，嗯，只不过是用的一些上一代的这种像进行学习的这种办法。

Speaker 0

那时候赚钱吗？

Speaker 0

那时候也挣钱，但肯定也还是亏着的。

Speaker 1

也是亏着的。

Speaker 1

但是那时候就开始融资了。

Speaker 0

对吧？

Speaker 0

对，我们出来呃学校办完那个那个科技成果转化之后，呃，第一笔天使投资很快就拿到。

Speaker 1

那时候好拿吗？

Speaker 1

还好。

Speaker 1

怎么跟他们讲这个事儿？

Speaker 0

因为这个事情就是我们跟他讲的，其实就就刚才说的那个逻辑。

Speaker 0

首先第一我们是核心，我们是要做认知智能。

Speaker 0

做下一代人工智能技术。

Speaker 0

嗯，然后呢？

Speaker 0

其次呢，在这个基础上，我们找到一个场景，有这样一个产品和平台，它也有非常不错的用户基础和市场基础。

Speaker 0

我们已经在学校里面已经服务了这么多客户，所以这个事情大家一看，哎，这已经有了，都不需要等你去做产品了。

Speaker 1

是一个相对确定性的事情。

Speaker 1

那一九年到CHATGPT真正出来，你们中间一直在做这一一件事情哦。

Speaker 0

倒没有。

Speaker 0

其实这个中间还是变化很大的，就是一九年我们成立公司。

Speaker 0

其实那个时候我们就在做相关的一些呃机器学习算法的研究，其实之前大模型的上一代就是那个我们现在叫小模型或者叫呃早期的预训练模型，比如说像BERT啊什么这类的东西，我们其实也一直在用，一直在研究，我们自己也做一些算法的研究。

Speaker 0

这个是你用它的东西，自己训练一些模型。

Speaker 0

所以那个时候就关注到GPT，GPT是呃GPT一是一八年一九年发的是GPT二，嗯，其实GPT二已经在学术界有些影响了。

Speaker 0

大家争论其实比较多，讨论比较多。

Speaker 0

嗯，我们也一直在关注这个技术到底行还是不行。

Speaker 0

其实是GPT320年发布是个分水岭啊，是很大的分水岭。

Speaker 0

正好是公司一周年。

Speaker 1

也是六月。

Speaker 0

对它发布应该是五月底吧，还是六月初啊？

Speaker 0

忘了大概那个时间，就是公司大概一周年的时间。

Speaker 0

正好嗯说那个我们请张院士，因为我们的这个。

Speaker 0

战略的这个顾问嘛，就是请他来公司我们一起座谈聊一聊。

Speaker 0

那时候大家还比较轻松啊，就是没有现在这么卷。

Speaker 1

你说多少人？

Speaker 0

那个时候大概几十个人吧，五六十人。

Speaker 0

看样子肯定不到一百人。

Speaker 0

嗯，人不多。

Speaker 0

然后请张老师来，我们内部就讨论说：哎呀，这个请张老师来，你不能跟他闲哈啦呀，这个还是得问他一些有意思的问题。

Speaker 0

他能帮我们解答的一些问题，我当时就说，我说因为我也我也在关注这个市面上很多的这个一些最新的研究进展嘛。

Speaker 0

我说诶，我说前段时间有一段有个东西很火叫GPT三，出现了之后很有意思。

Speaker 0

呃，我就想问一下这个张院士怎么看GPT三？

Speaker 0

这当时我记得特别清楚，这个这个是我说的。

Speaker 0

后来来了以后，这个张院士来了以后，还真为了讨论了这个问题。

Speaker 0

张院士其实给出的评价还是非常高的，就对GP三的评价非常高。

Speaker 0

他说是这个积极学习，这个一个比较里程碑式的一个进步，就有一种新的范式。

Speaker 0

但是他当时还是除了肯定这个事情以外，他还是也还是担心一个问题，就是刚才说的那个问题，他其实还是不知道自己不知道，对，甚至就连他知道自己不知道都。

Speaker 0

对吧，因为那个时候你看呃GB三，那个时候大家都很开玩笑说，说是一个就怎么说呢？

Speaker 0

就是你他会一本正经的胡说八道嘛。

Speaker 0

就就是那个时候开始的说这个话，就你问他什么任何问题，他都会给你编一段答案出来。

Speaker 0

他其实不知道，但是他会编一个答案给你。

Speaker 0

嗯，对吧？

Speaker 0

所以他实际上就是不知道自己。

Speaker 1

不知道嗯。

Speaker 0

对吧？

Speaker 0

所以他给了很高的一个评价，说这个是个很好的一个进步。

Speaker 0

嗯，但是他仍然没有解决那个最本质的问题。

Speaker 0

其实是这已经是个很高的评价了。

Speaker 0

嗯，然后我们那个时候就开始关注这个事儿，做这个事情。

Speaker 1

开始用他的这个技术方案了吗？

Speaker 0

对，我们就研究说这个预训练这个事情，就是GPT这个事情。

Speaker 0

啊，自回归的预训练这个事情，它和我们之前用的像BERT类似的这样，到底有什么区别？

Speaker 0

它能不能干掉这个原来的这种方式？

Speaker 0

我们就开始研究这个算法相关的这些事情，做了很多的东西。

Speaker 0

所以我当然记得记得是20年年中间GPT3发布，然后我们自己的GM这个算法是在21年大概我们把它。

Speaker 0

相对比较成熟的成型。

Speaker 1

做了一年。

Speaker 0

研究嘛。

Speaker 0

对，做了一年差不多一年吧。

Speaker 1

哦，所以那时候还是FOLLOW了，对吧？

Speaker 1

就是很很快做了决定。

Speaker 0

呃，对，还是跟进了研究嘛。

Speaker 0

这个大家很、很、很喜欢这些新的东西，我们去研究这些新的东西。

Speaker 0

但是确实不一样的地方就在于那个时候，就是说呃，业内其实并没有像现在这么高度统一的认为。

Speaker 0

那个GPT那个路线就是OK的嗯啊，所以那个时候大家还是在想说，诶，那有没有什么办法去走出自己新的创新的一些东西？

Speaker 0

嗯，所以GM是那个时候定下来的。

Speaker 0

嗯，所以GM是在BERT和GPT之间，我们当时想综合这两种算法的这种优势哦。

Speaker 1

是有一个综合性的对。

Speaker 0

所以它出来这这个算法本身它是非常典型的一种带自己典型特征的这样一个算法。

Speaker 0

嗯，所以那个时候是开始在做这个事情。

Speaker 1

GPT和BERT它的差异是什么？

Speaker 0

BERT它是一个双向注意力。

Speaker 0

它同样是基于TRANSFORMER做注意力计算，比如你给给一个句子、一个文本，它可以从前算到后，同时它也从后算到前。

Speaker 0

GPT大家知道就是单向的嘛？

Speaker 0

我只看前面，预测下一个，预测下一个，预测下一个，预测下一个，它是单向这样出现线性的生成。

Speaker 0

BERT是把中间抠掉，就我我让它预测中间。

Speaker 0

那预测中间呢，我就既要看前面，也要看后面。

Speaker 0

所以它是双向的。

Speaker 0

嗯，所以当当时这个大家很形象的描述说BERT就是个填空机器人，GPT呢就是一个蹦词器啊，就一个往外蹦，一个往下蹦，预测预测下一个。

Speaker 0

它其实都是预测，只不过是双向往中间预测和单向往后预测。

Speaker 1

那你们GMM是怎么综合它们两个的？

Speaker 0

GM的话，综合的方式其实还挺巧妙的。

Speaker 0

我们把这个问题做了一个统一，就是你看它原来不是往中间预测啊，不是往两项往中间预测嘛。

Speaker 0

GPT是从前往后这样预测嘛，然后我们把这个两项往中间预测这件事情，把这个词的顺序调一下哦，它实际上也变成了单向往后预测哦。

Speaker 0

啊，一样的。

Speaker 0

所以把这两个模型就这样统一起来了。

Speaker 0

所以当时GM出来的时候，在很多效果上最典型的一个特征，就是或者说最有优势的一个特征，是说它既能做填空题，也能做这个续写预测，就单向预测这个事情。

Speaker 0

因为当时GPT三他们做填空题还挺麻烦的。

Speaker 0

它不能做，做的没有不好。

Speaker 0

其实嗯啊，所以当时GM出来的时候是综合的这两种能力，而且这是第一个，就是本身融合了两种方法。

Speaker 0

第二个呢，呃，由于它采用了一部分的双向注意力，它是不是全部的双向注意力？

Speaker 0

是一部分的双向注意力。

Speaker 0

嗯，其实取得了一个意外的一个效果，是说整个在训练的过程当中，它的稳定性更好。

Speaker 0

嗯，就大规模训练的时候，它稳定性感觉更好。

Speaker 0

嗯，啊，就是体感上、工程上得到的一个结果。

Speaker 0

然后再一个呢，就是说它训练完了以后，这个模型它得到的那个参数矩阵，它的分布相对来说比较集中，就是它不会特别散。

Speaker 0

所以集中的好处是什么呢？

Speaker 0

我可以。

Speaker 0

做量化的时候，精度的损失少啊。

Speaker 0

这个很好理解，比如说你的值域是这么宽的话，你要做量化，比如说平均把它分八等份，那每一个域的宽度就很大，你一个量化后的结果代表的这个宽度，它的精度损失就大。

Speaker 0

嗯，但是我如果我的分布本身就窄，那我量化的时候同样是分八等份，那我每一等份它精度的这个阈值就小，嗯，我的精度相对就更准确一些，嗯，对吧？

Speaker 0

这是很好理解的一件事情，数学上。

Speaker 0

所以这也是一些额外的一些因素吧。

Speaker 0

所以那个算法本身还是挺受呃学术界和产业界的认可啊，到现在大家也还是认可GM是独树一帜的一个流派。

Speaker 0

嗯啊，然后后来再接着下来就是这是21年了，呃对，21年嗯啊，然后接下来就是22年，就是我们当时就开始。

Speaker 0

决策要不要像GPT三一样去做一个，因为那个时候SCANNING还很简单的。

Speaker 0

你参数量翻一倍、翻十倍上去，你智能水平就啪就上去了，对吧？

Speaker 0

大家都相信这个。

Speaker 0

嗯，所以那时候就开始决策说我们要不要去用GPTM算法去做一个千亿的模型。

Speaker 1

千亿的模型，二二年、二二年啊，二二年几月份啊？

Speaker 0

应该是二一年底。

Speaker 1

当时你们怎么认知OPENAI？

Speaker 0

其实我们就很关注OPENAI，一直在感觉这个这个公司挺神奇的。

Speaker 0

一五年成立。

Speaker 0

然后之前一直在做强化学习，突然到一八年的时候把强化学习扔了，然后开始搞这个GPT这个事儿。

Speaker 1

嗯，然后开始重视于训练。

Speaker 0

对重视于训练这个事儿。

Speaker 0

然后一亮，我我个人还是挺挺喜欢这个，我他的基本上他的论文也好，他的很多的这个文章也好，我都看。

Speaker 0

我觉得他很多的思考还是非常深入的，而且。

Speaker 0

确实是很到。

Speaker 1

很到点子上。

Speaker 1

那时候应该觉得他们就是一个研究机构，对吗？

Speaker 0

对，那个时候因为大家都知道他是当时是很多人投资，呃，包括马斯克在内投进来的是一个做非盈利的一个机构。

Speaker 0

就觉得他就反正就是一个OPEN LAB。

Speaker 1

你们当时有没有想也也做一个这样的OPEN LAB？

Speaker 1

就是你们做一个中国版的这种OPEN I。

Speaker 0

其实我们的气质就挺像的啊。

Speaker 1

在那个时候就这么想了。

Speaker 0

对对对，其实那个时候就就想干这个事情。

Speaker 0

但你公司已经成立了，你不能不拿它退回去。

Speaker 1

那肯定还是得有公司的。

Speaker 0

对对对，有公司实体就还是更方便一些。

Speaker 0

就那个时候，就在公司这个实体里面就讨论说要不要去对齐GPT三去做这么一个模型的训练。

Speaker 0

就那投入挺大的。

Speaker 1

投入需要多少钱？

Speaker 0

因为GPT三当时整个火了之后，大家分析它整个的训练成本是2000多万美元。

Speaker 0

OK，对吧？

Speaker 0

那个时候成本就已经这么高嘛。

Speaker 0

然后我们自己要去训练的话，估计花费可能也得千万级人民币以上。

Speaker 0

嗯，这种水平，哪怕我们再节省，哪怕我们的成本控制得更好，呃，也得也差不多这个水平。

Speaker 1

比如说我们在外面成立一个公司，我们就做成果转化好了，只赚钱，就是把这些项目卖给客户，然后这也是一种做公司的方法，对吧？

Speaker 1

为什么还要去追求这种更好的技术？

Speaker 0

你看，为什么我们要讲从一六年开始那个故事。

Speaker 0

嗯，就是从16年开始，那个故事其实其实就想跟大家传递一个信息，就是说质朴其实不是单纯的说我们就是想成立一个公司去挣钱。

Speaker 0

其实本愿还是在于我们要去探索AGI到底是什么。

Speaker 0

嗯，这是这才是我们的本愿。

Speaker 0

只不过呃，我们觉得在成立一家公司，在产业里面去做这件事情，它更符合当下的人工智能发展的这个需求。

Speaker 0

嗯，而不是简单的只是做研究。

Speaker 0

嗯，也不是简单的去挣钱。

Speaker 1

不是简单做商业化。

Speaker 0

对，其实这个事情它是这样，因为你是一个探索的过程，技术的往前的演进这件事情其实是一条主旋律。

Speaker 0

嗯，你的商业化是另外一条主旋律。

Speaker 0

嗯，这两者之间我们认为在人工智能当下的这个生态里头没有办法完全分隔开的。

Speaker 0

嗯，就恰好后来OPENAI走的这条路之后你会发现。

Speaker 0

也事实证明就是这样。

Speaker 1

所以当时你们是很喜欢OPEN I的，在嗯，很关注它。

Speaker 1

20年、21年、22年是，然后你们最后是怎么决策的？

Speaker 1

要不要投这千万？

Speaker 0

对。

Speaker 1

当时当然账上有这么多钱吗？

Speaker 0

具体因为我不管财务，所以我不是很清楚。

Speaker 0

开玩笑，但其实确实这个事情的投入对我们来说还是挺大的。

Speaker 0

嗯嗯，风险还是有的。

Speaker 0

所以当时要不要做这个事情，其实还是很慎重的考虑了一下。

Speaker 0

最后的决策应该还是就说我们应该做，而且必须我们自己来做。

Speaker 1

必须自己来做。

Speaker 1

还有别的选择。

Speaker 0

别的选择就是等着看其他人。

Speaker 0

所以呃，我们就很果断的去做。

Speaker 0

当然这个主要还是科学家团队在里边起了很大的一个作用。

Speaker 0

那因为之前的GM的研究。

Speaker 0

呃，算法的研究包括刚才说的那些特点，都使得我们呃有这个信心说能把这个一样的一个模型把它训练出来，并且呢性能不会差，不会让这个钱打水漂。

Speaker 0

所以最后决策还是要做这个事情，我们就投了这个2021年12月底到大半年时间吧，一直到2022年的七八月份哦，把它弄完哦，大概九个月时间。

Speaker 0

我们那个BLOG还挂在。

Speaker 0

网上可以看得到整个这个历程。

Speaker 1

然后又过了三个月，CHANGEBT九来了。

Speaker 0

对，年底正好二二年年底的时候，十一月三十号的时候，CHANGEBT就上线了。

Speaker 0

其实这个中间这几个月其实还挺我印象挺深刻的，我那时候也不在北京，我在外地，在深圳回不来。

Speaker 0

那个时候我们就因为花了这么大一笔钱，我们得去接着去融资。

Speaker 1

跟投资人聊。

Speaker 0

应该是开始融B轮了吧？

Speaker 0

嗯。

Speaker 1

B轮就是第二轮吗？

Speaker 1

对。

Speaker 0

对于你们来说，呃，第二、第三轮吧。

Speaker 0

应该是我有点记不太清楚了细节，但是那个时候就开始跟很多投资人聊聊这个事情，然后跟大家讲我们训练这样一个模型，有GPT三，我们也训练了一个对标的一个模型，性能很不错，我们也把它开源了啊。

Speaker 0

啊，那个时候我们开第一次开源，八月份开源这个东西。

Speaker 0

为什么要开源？

Speaker 0

因为我们当时觉得这个东西捏手里，你自己捏手里，你有没有短时间之内你也没办法把它变成钱，而且这个事情刚启动，刚启刚开始。

Speaker 0

让更多的人知道这件事情更重要，嗯，对吧？

Speaker 0

而且我们要打出我们自己的这个在国际上的影响力。

Speaker 0

那时候我们都是看到国外，看到我们应该看的这个国际的这个这个事情。

Speaker 0

所以开源是一种很容易接受的一种文化。

Speaker 0

嗯，中美之间现在还没有现在那么复杂啊，所以我们就选择把它开源了。

Speaker 0

开源之后确实影响力非常不错，有多不错？

Speaker 0

国外还是非常认可的。

Speaker 0

嗯，我们当时当时看完之后应该是那个报告斯坦福的那个李飞飞那个报告，我忘了是22年还是23年出来，应该是22年出来，在我们开源后不久。

Speaker 0

嗯，出来那个报告应该10月份、11月份，我忘了。

Speaker 0

他那个报告里边唯一一个参与这个评估，而且排得比较靠前，来自中国的。

Speaker 0

就是我们嗯，就是这个就是GM130B，所以影响力也非常不错。

Speaker 0

嗯，而且评估下来结果也非常不错，基本上跟呃GB三互有胜负。

Speaker 1

我在想那个时候国内同同期还在做这件事情的还有谁？

Speaker 1

那只有你们在做这个事情。

Speaker 0

其实之前应该还有一些百度在做哦，百度有earning哦，百度有earning。

Speaker 0

然后嗯，其实那个时候阿里也其实也开始做了哦。

Speaker 0

阿里红霞，对对对对对，还做那个M O E啊什么那些东西。

Speaker 0

然后研究机构就当时我们因为呃唐老师是那个智源的嘛，智源的一个副院长，智源当时也是唐老师带着团队做了一些事情。

Speaker 0

哦，对公司是除了阿里和百度以外。

Speaker 1

就是我们在做。

Speaker 1

跟投资人当时讲这个事儿的时候。

Speaker 0

他们兴奋吗？

Speaker 0

听不懂，投资人听不懂，嗯，完全听不懂。

Speaker 0

这什么东西？

Speaker 0

你们怎么挣钱？

Speaker 0

怎么把这个东西商业化了？

Speaker 0

嗯，投资人问的都是这个。

Speaker 0

我印象特别深刻，有个投资人往线上聊的这东西，你们能变成钱吗？

Speaker 0

啊，现在这个你看这个大环境这么差，经济这么差，要不你们把估值降一半怎么样？

Speaker 1

降了没？

Speaker 0

肯定不会啊，肯定不会。

Speaker 1

就是在那笔融资其实没那么顺利的。

Speaker 0

其实挺那个那个时间，其实挺艰难。

Speaker 0

拉了多久？

Speaker 0

就这也是我们幸运的地方。

Speaker 0

你看我们把这个事情做完之后，到ChatGPT火起来是十一月底。

Speaker 0

嗯，那真正在国内火起来是在春节前后。

Speaker 0

嗯，在国内啊，春节前，其实就就就就小半年时间，就半年时间。

Speaker 1

这小半年你们正好是处于融资的期期期哦。

Speaker 0

对，其实ChatGPT火起来就帮了我们一个很大的忙，就是大家再也不用质疑说哎你这东西到底是啥，我们就告诉他说你看ChatGPT你懂吗？

Speaker 0

你看过吧，知道吧。

Speaker 0

呃，我们做的这个事情就是往这儿去的。

Speaker 1

然后后来都是投资人找你们了。

Speaker 0

是吧？

Speaker 0

对对，就很让人就要问：哎，你们什么时候能把那个CHATGPT的东西做出来啊？

Speaker 1

什么什么之类的。

Speaker 1

哦，所以你们这笔融资CLOSE是在那个之后了。

Speaker 0

春节之后了，应该是吧？

Speaker 0

就细细节我还不太记得清楚了。

Speaker 0

哦，过去也算比较久了。

Speaker 0

所以那个时候就是确实是有一段时间是正好卡了那个中间，然后CHATGPT帮了我们一个大忙。

Speaker 0

然后我们自己说实话也算是比较争气啊，就是很快的我们把那个CHATGPT对标的这个CHATGM，我们就把它弄出来，然后也能上线。

Speaker 0

大家看到效果也非常不错，尤其在中文上效果非常好。

Speaker 0

而且我们还同时开源了一个CHATGM的一个开源版本、一个小型化的版本，因为那个时候只有CHATGPT嘛，嗯，然后CHATGPT也很大，嗯，大家嗯三以后它也不开源了，大家拿不到。

Speaker 0

很多研究人员就心里痒痒的，说我只能用，我不知道这个里面到底是啥，我自己不能玩。

Speaker 0

嗯，所以我们开了那个小的一个6B的版本，60亿参数的版本，一张这个家用的GPU就能跑起来。

Speaker 0

那大家就很爽。

Speaker 0

所以那个时候那是我们第一款爆火的，在开源社区里面爆火的一个开源项目。

Speaker 0

嗯，下载量非常大，嗯。

Speaker 1

非常大。

Speaker 1

同期好多大模型公司其实刚开始组建。

Speaker 0

你们就已经有产品了，肯定是二三年初嘛。

Speaker 0

嗯。

Speaker 0

二三年初嘛，大家看到ChatDB火了。

Speaker 1

很多人开始做。

Speaker 1

从GPT三到ChatGPT，OpenAI的动作有超出你们的预期吗？

Speaker 1

虽然你们一直都关注它。

Speaker 0

其实那个时候OpenAI还是比较开放，还真的挺Open的。

Speaker 0

很多东西它发论文，呃，其实后来论文发的少了，但是它的比如TECHNICAL REPORT还有一些呃，它的BLOG啊什么之类的，其实会把这些东西都慢慢的放出来。

Speaker 0

呃，其实我们就紧跟着它研究，包括那个时候我们私底下的一些很多交流，因为你有很多清华的学生，当时我讲九个人里面有四个是。

Speaker 0

清华，但是这个底下的交流还是非常顺畅的。

Speaker 0

就大家也知道他们在干嘛哦。

Speaker 1

包括CHATGPT也是知道的。

Speaker 1

就这个产品要发布对。

Speaker 0

知道。

Speaker 0

但是他那个项目本身、产品本身保密得很、很那个。

Speaker 0

但是我们很知道说他们还在持续的在GPT之上在做很多事情，在往那个方向去走，然后他的目的是什么？

Speaker 0

最终的可能的形态是什么？

Speaker 0

嗯，对，其实那个时候根本就不是太意外上这个东西。

Speaker 0

所以他上了这个东西之后，至少我个人是觉得就是说还是挺兴奋的，嗯，挺兴奋。

Speaker 0

因为觉得赌对了啊，对，第一赌对了，第二就是说啊，确实这条路走下去它还是有很光明的这个那个前景。

Speaker 1

当时内部是什么状态啊？

Speaker 1

当拆之于火了之后，智普当时你们有什么讨论，有什么交流，是一个什么样的公司状态？

Speaker 0

其实大家我觉得跟我可能状态差不多，都是属于那种比较兴奋的状态，就觉得哎，这个事我们做对了，之前的那个赌注下对了，就是我们走到这现在了，我们已经相对来说是比较靠近的，嗯，接近这个全GPT的这个事情。

Speaker 0

所以呃，我们这个研研究团队还有这个工程团队。

Speaker 0

春节那个春节是没、没有、没有休息的，然后就确这样。

Speaker 0

我们这个版本把它推上线，嗯，然后在小范围。

Speaker 0

当然这个一些原因不能让太大范围的去、去制作，就小范围的让大家去试用，大家都很惊艳。

Speaker 1

二二年到二三年转年，是不是你们的生活发生了巨大的变化？

Speaker 1

是。

Speaker 0

整个就是有点那种，网上有个那个话叫十年干什么什么无人知，一朝什么什么天下晓。

Speaker 0

其实类似就是你之前其实做了很长一段时间，你想想我们从一几年开始搞这个算法，二零年自己研究这个算法，二一年、二二年把模型训练出来，然后把这个东西想要商业化，想要去跟投资人聊说这个东西未来的前景多么大。

Speaker 0

这两三年时间，其实是我们一直在努力在做这件事儿，而且也取得了一定的我们认为的一些成果。

Speaker 0

但是确实比较艰难，因为大家对这个事情的理解非常、认知非常浅、非常少。

Speaker 0

所以这个时候你就很难。

Speaker 1

而且大家对于AI一点零的四小龙已经去魅了。

Speaker 1

那个时候你说你要做第二代AI又怎么样呢？

Speaker 0

没错，他就把我们拿着跟这样比，你跟他们有什么差别呢？

Speaker 0

然后我们只能回归到技术上来说，就本质上是有很大的差别的。

Speaker 0

但这种技术上的这种本质的差别，这种东西其实在市场来看离他们好像很远。

Speaker 0

他们那个时候还不太相信说像现在这样研究和产业和和钱和市场用户之间会这么短。

Speaker 0

他们不相信这个，他们认为说：‘哎，你突破这个东西挺好的呀。

Speaker 0

’五年以后再找我吧？

Speaker 0

没想到这么快。

Speaker 0

对他没想到那么快，因为大家的这个认知还是惯性的在往前走，它不是一个革命性的一个看法。

Speaker 0

他不认为你是个革命，他只是认为你是个线性的一个线性外推。

Speaker 1

对对对对对。

Speaker 1

所以二三年一转年就感觉浪来了。

Speaker 0

对吧？

Speaker 0

一瞬间大家就一下子就热血上头啊，这个多么好的一件事情啊，怎么怎么怎么着，对吧？

Speaker 0

这个挺有意思的一件事。

Speaker 0

嗯，所以我们我个人反正在内心里一直很感谢我们家做了很多事情，让我们觉得能借上这个力。

Speaker 1

二三年有什么印象深刻的事情吗？

Speaker 0

最印象深刻的就那几个字——百模大战。

Speaker 0

圈内的。

Speaker 1

圈外的大家，因为之前你们来做这个事情还是很低调的，对吧？

Speaker 1

就是关注的人很少，也无人问津。

Speaker 1

然后二三年这变成一个市场的名牌了，是是是，老王也来了，对。

Speaker 1

然后一下大模型有六小龙。

Speaker 0

你看那个时候就熟识的人啊，很多熟识的人。

Speaker 0

小川，我师兄是吧？

Speaker 0

志林从我们学校是出去的。

Speaker 0

然后对，对你看身边的很多人就啪啪啪啪分分分就跳进来，包括那个呃现在的硅基。

Speaker 0

呃，后来袁静辉、袁静辉袁老师，我们也认识他很多年啊。

Speaker 1

他他之前在光年之外，对对对对，联合创始人。

Speaker 0

后边拉进来的嘛，你看这身边很多人都站到了里头，然后那个不认识那就更多了，那就不用讲了。

Speaker 0

所以二三年呢，特别热闹，百魔大战，对，纷纷扰扰的特别热闹。

Speaker 1

是什么感觉呢？

Speaker 1

就是我们在这里已经做了好几年，你们现在突然之间一夜之间全来了。

Speaker 0

我觉得就两个，就感觉上、感受上就是两个感觉。

Speaker 0

第一个感觉呢，就特别兴奋。

Speaker 0

就这个事儿迎来了一个很大的一个机会，很大的一个浪潮。

Speaker 0

大家都不用再去教育投资人也好，市场也好，什么也好，大家都不用再教育。

Speaker 0

反正你做这个事情，大家一听哦，知道我陪他干这个事儿吧行，挺好的。

Speaker 0

嗯，然后第二个呢，其实还是呃，说实话我个人来说还是有点焦虑，嗯，有点担心，因为每逢大浪过来，再往后看一点就是可能就是一片狼藉，最后留不下也啥。

Speaker 0

嗯，挺害怕这种状况。

Speaker 1

做最早不一定能留下。

Speaker 0

这个是焦虑的。

Speaker 0

我倒不是焦虑这个，我倒是我我我都对我们能留下或者说我们能做出来这件事情倒不是特别怀疑。

Speaker 0

我怀疑我怕的是整个这个市场有一个极端走向另外一个极端之后，然后塌掉之后再很难回来。

Speaker 0

就烈火烹油之后，剩下的是啥？

Speaker 0

如果这个市场都没有了，你做的再好也没用。

Speaker 0

为啥市场会没有啊？

Speaker 0

嗯，因为我们看到太多的这种事情了，就大量的资本也好，人也好，进来团队，然后开始。

Speaker 0

搞这件事情，然后各种各样的声音、各种各样的想法啊，新的、老的、旧的，然后各种各样的这个掺、掺、掺杂在里头。

Speaker 0

然后其实很多时候大家只知道说这个事儿是个很好的事儿，但是其实分辨不出、分辨不出这些里面这些这个百魔大战，大家的这个说的这个事情谁说的是对的，或者说谁说的是更接近真相的，谁说的是吹了一个故事，谁是吹了一个泡泡。

Speaker 0

分辨不清的，今天看能分清吗？

Speaker 0

我觉得肯定有一天能分清。

Speaker 0

那现在还没有分清，我觉得还有一些很难分清的东西。

Speaker 0

哦，这这就是它的魅力所在。

Speaker 0

但是它越来越聚焦，或者说收敛到它的真实性问题上啊，不再有那么多的泡沫或者说假象的东西在里头。

Speaker 1

现在回望二三年。

Speaker 0

好神奇啊！

Speaker 0

对，非常神奇。

Speaker 0

我也在很感慨，哎呦，二三年怎么过来的？

Speaker 0

我印象当中……纷纷扰扰，二三年就过去了。

Speaker 1

很快。

Speaker 0

我唯一比较深刻的印象就是二三年我们去GM上线，八月份上线。

Speaker 0

然后还有一个印象是呃，那一年的WIC在上海开，WIC我去转了一圈那个展馆。

Speaker 0

呃，有人后来数过，但是我没数过。

Speaker 0

呃，有人数过整个展馆里面跑完之后，基本上所有展台上因为是人工智能的嘛。

Speaker 0

所有的展台上都有大模型三个字，各种各样的大模型三个字。

Speaker 0

把它把所有的那个拍下来，贴在一起，巨长笔每这么一条列这么长。

Speaker 0

嗯，挺好玩的。

Speaker 0

我也去转了一圈，我就发现大模型绝对就是。

Speaker 0

但大家讲的故事或者说的事情就千奇百怪。

Speaker 1

各种各样的事情。

Speaker 1

你觉得很离谱的是什么呢？

Speaker 0

我倒没觉得有什么特别离谱的。

Speaker 0

我当时也看到很多很新奇，有些东西我没想到的，因为自己也吸收到很多的东西。

Speaker 0

其实那个时候，我觉得是二三年。

Speaker 0

大家最在大模型本身这件事情上争论的事情，不再说大模型本身有没有用，而在于争论一个事情叫垂直模型、通用模型和垂直模型。

Speaker 0

对，这是二三年。

Speaker 1

大家经常会聊的。

Speaker 0

对，每逢我去跟大家聊什么事情的时候，会参加什么会，大家都会问的问题。

Speaker 0

嗯。

Speaker 0

但你到今天来看这个事情，就你会发现当时聊的这个问题，它其实就是个伪命题。

Speaker 0

嗯，到今天来看，嗯，所谓的垂直模型根本就在市面上没有什么声音。

Speaker 0

嗯，不管是研究也好，还是呃产业应用也好，其实都没什么声音。

Speaker 0

他就证明那个时候所谓垂直模型这个事情，它里边被人加了一些佐料。

Speaker 0

佐料对出现的东西。

Speaker 1

当时二三年我印象很深的是几个事儿，就是老王发了一个英雄帖。

Speaker 0

然后那个投资圈和那个大模型圈里边还是非常有名的一件事情。

Speaker 1

对，然后包括王小川也入局了。

Speaker 1

小川对你当时看到这些就是非常成功的企业家二次创业，然后来抢你们，就是本来已经深耕就做了好几年的这个事儿的时候，你当时在想什么呀？

Speaker 1

你会担心在商业上竞争不过他们吗？

Speaker 0

我倒没觉得这个事情。

Speaker 0

因为首先，第一个我们做了这么长时间，对这个事儿认知还是比较深的。

Speaker 0

虽然CHATGPT火了，但其实我是觉得它要走的路还挺长，没那么快，没那么容易。

Speaker 0

其实我是欢迎像小南师兄还有慧慧这些慧慧也是师兄啊，他就比我们稍微大一点啊。

Speaker 0

对，呃，欢迎这些有实力、有成功过的人或者有经验的人。

Speaker 0

入这个局来一起做这个事情，因为我一直也相信。

Speaker 0

首先第一，这个事情还没到那么快见终局。

Speaker 1

大家那个时候有点预期过于乐观。

Speaker 1

对你当时觉得要多久能见终局？

Speaker 0

我不知道，当时我确实也不知道多久能见这个终局。

Speaker 0

我的直觉告诉我说这个事情没那么容易，没那么快能见这个终局。

Speaker 0

嗯。

Speaker 0

还需要时间，因为这个技术研究了之后，你会发现里面其实还有很多问题你没有解掉、没有解决掉。

Speaker 1

那时候最棘手的是什么？

Speaker 1

二三年。

Speaker 0

二三年的时候，你说技术上吗？

Speaker 0

嗯，其实技术上我觉得还是模型的能力还是不太够，就它只能当一个CHATBOT，但显然光当CHATBOT是不行的呀。

Speaker 0

对不对？

Speaker 0

很简单，我们原来能做的就是比如说像情报的这种分析这种事情，它需要你预测、需要你做逻辑分析、需要你循证，需要很多东西。

Speaker 0

这些东西都没解啊，都没解啊。

Speaker 0

你除了聊聊聊天，你还能干嘛？

Speaker 0

你敢问他说我今天哪哪哪不舒服，你你给我推个药，你敢吗？

关于 Bayt 播客

Bayt 提供中文+原文双语音频和字幕，帮助你打破语言障碍，轻松听懂全球优质播客。

继续浏览更多播客

浏览全部播客

进入全部播客页面

真誠presents　大久保佳代子・森本晋太郎のどうぞご自由に

在你我的花园里｜In our garden: Feldenkrais and holistic freedom

知行小酒馆｜关注投资理财，更关注怎样更好地生活

129. 全球大模型第一股的上市访谈，和智谱CEO张鹏聊：敢问路在何方？

本集简介

双语字幕

关于 Bayt 播客

继续浏览更多播客