
中国经济大讲堂视频截图
大家好,我是王坚,非常高兴来到中国经济大讲堂。
Token是区分数据和信息的分水岭
我们讲信息讲了很久了,后来就开始讲数据。可是在很长时间里面,我们事实上是没有把信息和数据很好地把它区分出来。无论是过去讲的比特也好,字节也好,其实它都是过去信息的一个非常好的度量。在很长时间我们也有同样的度量来计算数据的这一次数据本身的度量有了一个非常明确的一个说法,叫词元。这是把数据和信息区分出来一个非常重要的分水岭。一般情况下我们用两个字节去表达一个汉字。所以大家可以设想一下,我们过去在信息领域怎么表达我喜欢你,其实就是每一个字用两个字节加起来四个字就是八个字节。这就是我们讲的,在字节时代就是这么看的。Token这个概念出来,就提了一个大家都觉得不是问题的问题,就是我怎么把“我喜欢你”这四个字拆成最小的单元。我们过去直觉就是“我”是一个最小的单元,“喜欢”是一个最小单元,“你”是最小单元。但是token不这么看,token他会认为也有可能“我喜欢”是一个单元。就是说token的话它可能也是“我喜欢”三个字跟你就变成token了。但在很多场合,它跟我们平时的经验不是一一对应的。所以这个时候句子里面的词就分成了最小的单元,那个单元就叫token。所以为什么在一定意义上叫词元,也是有道理,也是这个原因。Token第一个它只是一个计量单位。如果从这个角度讲的话,token这个概念更多的是我们平时讲的几斤几两可能比较合适一点。最后你这个几斤几两也是要花钱去把它买回来的。非常像我们平时看到东西,可能一斤肉就会比一斤菜贵一点。不同的token它也有这样的特质,有的地方它会贵一点,有地方会便宜一点,跟这样是也是有关系的。Token它是个计量单位,但是token也代表了他背后所表达的东西。如果这个表达的东西比较复杂,它本身也比较有价值,可能这个token就会贵一点。它不能简单地等同于货币,它只不过是来表达我们的数据。
OpenClaw为何突然引爆token话题
在过去几年人工智能热的时候,它背后都已经是token了。像传统意义上的豆包或者千问的话,他其实token的消费量没有那么大。背后就意味着算力什么,它的消费量都没有大,所以可以免费。如果从这个角度讲的话,你可以讲这是人工智能应用的初级阶段。因为没有那么多的token的消费。但是等到像这个OpenClaw,就是所谓小龙虾的应用出来的时候,你就会发现其实当人工智能发展到一定水平,它对数据的需求是被大大地增加。为什么这次小龙虾或者OpenClaw出现会引爆token这件事情呢?是因为这个OpenClaw消费掉的token的量,大大地超出了原来的这些人工智能的应用。所以使得大家突然会发现那么多的token的量,花掉我那么多钱,好像没帮我干点什么事儿。所以事实上是把token这个东西浮到了水面上,原因也是你付的账单更多了,也从另外一个角度也表明了要完成这些工作之间,这个数据要求互相交换的量,或者我们数据流通的量比原来大大增加了。所以我觉得小龙虾本质上是跟过去是一样的。只不过因为这样以后,它的调用量特别大的时候,突然我们的账单付不起了,所以这个问题就可以暴露出来。所以大家对成本什么突然就敏感起来,所以这是火爆的非常重要的原因。现在人工智能模型里面有一个很简单,它叫思维链。也可能他中间的推理过程也会消耗掉很多的算力。但是哪怕推理的时候,要操作的最小单元还是这个token,也就是词元。我们现在看到的算力就是两个东西的结合。如果你内容很多,它也会消耗掉算力。同时你想的足够复杂,它也会消耗掉很多。这是两个东西的最终的结果。这也是大家看到为什么每个token的成本会不一样。是因为它后面处理这个token的方法也会不一样,所以它也会带来成本的不一样。
Token是人工智能时代的标尺
软件时代大家都会数你这个软件有多少行代码。基本上这个软件的多少行代码就是你这个软件的价值,甚至它的复杂度。今天我们不能笼统地讲数据,也不能笼统地讲算力。只讲数据和算力并不反映你人工智能发展跟使用的水平。而用token来表达人工智能今天使用的水平的话,我个人觉得是一个非常好的一个指标。token这个计量是综合反映了数据的价值,以及你模型的好坏,以及你算力的多少。当用模型的时候也是有token的流动的。这个流动既代表了原来训练模型的时候,它所消耗掉的算力所带来的价值,同时它本身也要消耗掉很多的算力。今天我个人觉得token的消费量大,代表了我们人工智能应用到了一个新的水平。你就想早期的时候,我们家里就点了一个灯泡,其实只用一点点电。后来我们突然有了冰箱,有了洗衣机,后来有了空调,我们的电就上去了。其实是代表了我们生活水平的提高,也代表了电对我们的生活甚至经济的影响。今天token的增加也代表了我们就是从点一盏电灯,可能就已经到了有冰箱,有洗衣机,可能还没有到空调的这个程度。我觉得这是一个非常大的变化。
Token如何影响百姓日常生活
应该讲token本身不会影响生活。因为真正对比说你的社交生活影响的话,还是应该基于像小龙虾这样的应用。所以大家可以设想一下,就像我再回到“电”这件事情?事实上是霓虹灯改变了我们的夜生活,但是你在背后一定是离不开电,因为霓虹灯就是电来驱动的对吧?所以我想将来会有更多的,甚至比小龙虾还要不一样的应用。就像我们家里点的灯跟霓虹灯是完全不一样的。这些形态出现以后,会改变我们的生活,但是这背后支撑还是一个技术。所以我想token这个词它的关系可能就会这样的一个关系里边存在。因为任何的token它都会跟一个人工智能的应用会联系在一起的。只不过到最后就是不同的应用,token的收费方法不一样,可能代表着他为做这个应用,每消耗掉token的他所付出的代价不一样。所以token本身是非常的固定,也非常的稳定的。但是应用是可以不断的创新的,本质上,对老百姓而言,token就是一个简单的收费方式。所有的这些流程的事情都在产品里面体验,所以他没有感知。但是老百姓什么时候最有感的,就像电一样,你说今天老百姓电有感还是无感?大家只要每个月付电费账单的时候他就有感。但是你这个插头、冰箱插在墙上的时候,老百姓是无感的。但我相信token在很长时间,甚至我个人觉得就是被人工智能今天的模型被固化下来的收费方式。所以老百姓只要涉及到收费,他就不会完全无感。
人工智能商业化处在什么阶段?
早期软件也是很长时间里面不知道怎么挣钱。所以事实上在微软了不起的地方是,微软是第一次明确地提出来软件是挣钱,而且挣到钱。在微软之前,所有人做软件都觉得软件挣不到钱,软件的价值都是硬件价值的附庸。所以在很长时间软件产业是没有发展起来。所以我想当我们讲这件事情的时候,不能用静态的方式来看,说今天有还是没有。因为这是一次变革性的产业,所以我觉得就像当年没有软件产业,变成有软件产业也是因为这个原因。所以从这个角度讲,微软是第一次可能也是最重要的一个从软件里面挣到钱的这样的一个企业。那可能我们后面人工智能,token还会出现。这样慢慢的你创业者也好,企业也好,可能这个数据怎么跑,怎么流动,你的所有的组织形式都会发生变化。所以为什么我说他只要觉得token挣钱。很有机会,那个人会在大厂还没有挣到钱的时候,你挣到钱了。大家可以设想一下,看我过去几年大家对人工智能模型那么热,对吧?到今天为止,人工智能模型还是所有东西的基础,没有人工智能就不会有那么多数据的消费量,也没有那么多数据的产出量。所以从技术角度还是人工智能。但是这个人工智能在各行各业产生影响,就是这个数据要流动,那么token就变成很关键了。所以我想,而人工智能的变革是远远超出电商或者其它的变革了。这是一个要我自己的表达的话,这是自人类电发明以后最大的一次变革了。大家可以设想一下,电发明以后产生了多少产业,多少不同的工业,对不对?我自己觉得人工智能也会的,所以这次机会是要抓住的。所以我想电产生的时候不只是有灯泡,现在灯泡可能都不是个大的产业了,对不对?所以我想比这个大的东西要多得多。OpenClaw这个小玩家出来以后,也不能完全说用一人公司来代表它。本质上是我们的工作发生了一次很大的变化。以前我们经常讲会提高工作效率,对吧?或者最多讲我们改变工作方式。事实上以小龙虾为代表的,我先说智能体的出现,事实上是改变了工作本身,它都不是提高了工作效率,也不是简单的改变了工作方式,它就是改变了工作本身。所以我们回过头来再回到小龙虾这件事情角度来看这件事情,你就会发现,事实上我们所有的工作都会被改变。就以前你觉得是工作,他就会重新定义的。所以今天没有人说得清楚小龙虾到底做了一件什么事情,没有人说得清楚到底是什么事情。所以大家最好的一个表达就是把你的助理,把你的秘书替代掉了。
Token爆发如何重塑产业与商业逻辑
我经常会讲到人工智能不是一次工具的革命,而是一次革命的工具。所以我想大厂的这些超常规的反应反映了这件事情的颠覆性。不能简单地理解他们要多做一个业务,这种颠覆性可能都会颠覆他原来的业务的。
比较有意思的事情。大家都知道token这件事情的出现,使得这个现象放到了水面上来。过去大家讲模型的时候,大家以为只是在技术上的竞争,后面东西都是可能性。但是我刚才讲了,token的出现反映了数据要素市场真正的开始。大家都知道这样的一个市场,它的机遇是远远大过我们讲到的某一个业务。可以看到它的颠覆性以及它的战略性。所以我觉得其实这件事情对所有企业都面临一个问题。也就是说当我们国家是认真地在讲数据要素市场的。大家可以设想一下,如果大家认这件事情,数据要素市场只要它是个要素。大家知道我们过去要素有土地、有资金、有劳动力,还有别的东西。如果大家真相信这是一个数据要素市场的开始的形成,那就意味着没有一个企业可以不跟这个要素上打交道。也就是它会涉及到每一个企业,无论你是传统还是不传统,无论你是大还是小。所以我想为什么我反复讲,当token这个词热的时候,大家一定要放到一个数据要素市场背景下来理解。而这个时候已经不能简单地放到一个人工智能背景下来理解了。所以这是我们所有人都是重新要思考的,我今天也没有结论。但是在一个新的要素市场出现的时候,是没有一个人可以回避的。但是倒过来讲,我觉得你今天看政府工作报告也好,我个人觉得这个新的要素市场出现,对创新型企业,对中小企业,对今天的初创企业可能会更友好。因为原来这些大的企业,他们享受了传统要素市场的好处,他们要么资金,要么在其他的要素上。对一个新的要素的话,我觉得他们有他们的惰性。所以我想这是一个企业创新发展的最好的一个时机。所以我觉得我们还是需要更深层次来想这个问题。也就是说它比我们任何以前的市场都应该是一个整体性的市场,是一个一体化的市场。你反过来讲,就是大家看到这个OpenClaw的时候,甚至在之前一个很明显的表达就是,我们不会像过去那样在手机里面装那么多的APP。它本质上是这中间的数据都会被很好地整合掉,应用都会被很好地整合掉,市场是变得越来越统一了。表面上看的是一个OpenClaw,其实做了你过去十几个二十几个APP做的事情。本质上是数据要素市场在起这个作用,所以我不需要那些东西了。
Token爆发下,人工智能安全挑战如何破局
安全也是一个非常关键的问题,没有安全的东西肯定是没有任何用处的。但是大家认真想一下看啊,比如说过去我们拿人民币,拿纸币的时候,它也有安全问题。但这个安全没有像我们用电子货币的时候要大。但是如果我们用纸币的时候,它效率就低,在手机上做支付的效率就高,但是它安全就变成问题。但我们都要用手机支付的时候,大家都担心安全问题。但是慢慢我们就把这个安全问题给解决了。事实上在纸币和手机中间,还有一次跟钱有关系的都是信用卡。其实最早大家都知道信用卡也不安全。同样的作为要素市场,token的出现也是一样。因为它的重要性,因为它背后的价值,所以它会比我们传统意义上在手机上用个APP,在手机上用一次支付,它的安全问题肯定会大得多。但是反过来讲,因为它价值也很大。所以我想,就像我们过去解决那些安全问题一样的,我们也一定会慢慢解决人工智能在今后应用中的那些安全问题。当然我觉得会更挑战。从这个意义上,它会催生一个新的产业出来的。它的安全问题也不是传统的安全问题。我想这也是任何一个技术从发现到发展到应用中,必须要走的这么一个过程。其实OpenClaw刚刚出来的时候,安全是它最大的问题。过了几天就会有人在安全的框架上就给它做了很多事情。所以我想整个的技术它就是为了这样迭代中发展。同样你汽车不跑到80公里的时候,大家不知道它多危险。如果你天天在5公里的汽车,大家都不会重视它的安全问题。但是当汽车跑到80公里的时候,怎么做这个座椅,怎么来做安全气囊、保险杠,怎么来吸收这个碰撞,就很多问题都会出来。我想只有跑到这个时候,你才能真正认识到这个安全问题到底是什么。不然你在车只能跑5公里、10公里的时候,你是不知道这个安全问题到底究竟在哪里。所以我觉得这个过程都是这么一步步走过来的。我还是要对技术的发展有足够的乐观和信心。
结 语
非常高兴,今天能很好地说一下关于这个token。我想它不但对我们的人工智能的理解非常重要,其实它对我们数据的理解,以及数据和人工智能模型之间的关系,到最后人们怎么用这个人工智能,到这个数据要素市场的形成,我觉得都是非常重要的一个关键的一个概念。所以我想把这个token理解好,无论是从技术还是商业,最后到应用,我觉得都是非常关键的。也希望大家能够对token的理解,用好我们今天手里有着非常重要的宝贵的资源,就是数据资源。好,谢谢大家。
(资料来源:央视频、之江实验室 内容有删减,小标题为编者所加)

Copyright © 2012 zgmscmpm.com All rights reserved. 美术拍卖网版权所有
浙ICP备17013067号-2
扫一扫,下载APP
扫一扫,关注微信公众号