张一鸣在演讲中
人民网11月17日电 (温静)11月17日,第三届世界互联网大会“移动互联网论坛”在乌镇举行。论坛以“人工智能开启互联网新未来”为议题。今日头条创始人、首席执行官张一鸣为嘉宾带来《信息平台的智能浪潮》主题演讲,以下为全文内容:
大家上午好!人工智能浪潮在中国的互联网领域非常汹涌,现在各家公司纷纷转向使用人工智能推荐信息,今天前面几位分享了很多技术和AI的应用。我想着重和大家说一下信息平台的人工智能浪潮。
我认为人工智能首先是从信息开始的,在信息平台上也是最容易取得成果的,开始之前请大家看一个视频,来解释一下什么叫智能的信息平台。(观看视频)视频介绍了一个头条利用信息平台,利用精准的定位技术,在寻人上的一个尝试。大家想想之前我们找一个失踪的人怎么发布信息的,我们可能发布信息在报纸中缝,报纸中缝上发布寻人信息很难找到人,过去头版头条非常珍贵,不能把寻人启示放在头版头条上,今日头条用人工智能技术能够精准定位谁最可能找到这个人,我就这两千个人的头条手机屏幕上显示寻人启示,实际上我们只是消耗了很好的阅读量,现在我们已经是中国找人速度最快、最多的平台了,每一百个寻人信息,我们能够找到13.75个人,现在已经累计达到500个人了。从这样一个小小的例子,可以看出人工智能在信息领域的应用。
所以有很多人问我,头条是不是一个媒体,你们公司为什么要招这么多人工智能工程师,我要解释一下。我们公司是最早把算法结合在一个具体的应用上,我们把算法工程产品应用结合做了一个很好的推荐引擎应用,在推荐引擎上首先推荐文字,文字不仅包括资讯也包括各种直播、图片、寻人等等各种各样的信息,所以我们更愿意把我们称为一个智能化的信息平台。到了上个月底,我们已经累计有66亿的激活用户,每天每个用户使用76分钟,1.4亿活跃用户,这个数字在中国所有app当中,按人均时长来算,应该可以算前三名,和所有同类和资讯类对比时长长一倍以上,这也体现了AI技术在产品上的体现,没有人维护编辑信息,但是我们的产品使用时长远超于同行。
很多人一说今日头条,就说你们是个性化推荐引擎,其实人工智能不仅是个性化,不仅用在个性化推荐方面,至少包括四个领域的应用,信息内容的创作、分发、讨论和审核,在奥运期间这个机器人累计发了四百多篇新闻,阅读量超过一百万,只有2秒钟的写作时间,点击率超过了人写的文章,在奥运期间也有报道,我们的机器人写作不是仅仅把数字填充到模板上,但是可以看到列表当中还会配图片,机器人会自动从图库当中选择适合这篇报道的图片。我们可以想象一下机器在财经、气象等等领域,未来都有可能机器进行创作,因为机器最快最准确,这些相对标准化适时化的内容很有可能让机器替代创作,这是一个很好的案例,人工智能介入创作。
我们再来看分发阶段,头条在把人工智能用在分发上,可能业界比较了解,但是业界经常以为我们仅仅是个性化推荐。我举个例子,这个屏幕是我去年去波士顿遇到一个哈佛的学生,他和我说为什么我在波士顿能看到长沙的新闻,虽然我是一个长沙人,他是怎么知道的,我就问他,你在过去两三年的春节有没有回家呢?他说回家了。我和他说大概率是因为我们的机器猜到你春节回家了,你可能是一个长沙人,但是他说我又看不到很多的长沙新闻,为什么长沙市政府引进人才的新闻我们可以看到呢?我和他说我们确实不是因为你是长沙人就把长沙的新闻推荐给你,我们现在只是把在长沙的留学人才可能喜欢看的新闻推荐给你。他又问我,为什么长沙在外留学的人喜欢看这条新闻呢?我说并不是因为你看了这条新闻,因为其他长沙在外留学的人,他们点击了这篇新闻,你和这些人类似,所以你会看到这篇新闻。这也是个性化推荐,其次体现了泛化,他并没有看过这条长沙吸引高端人才回流的新闻,而是和他类似的人看过新闻,泛化就是我们在利用人之间的共同特征,把一个模式应用到其他的人身上,不仅是你为自己推荐内容,而是人人为人人推荐内容。
数据积累方面,我们发现推荐系统具备这样一个特点,首先是一个人用,一个人用的越久越好用,因为我知道你阅读的数据,这是个性化。第二个是越多人用越好用,越多人用可以找到类似的人群。第三个是数据的积累,我们看一下数据的积累,到目前为止我们有八百个算法方面的工程师,有两万台处理器,有151条训练样本,每天用户请求60亿次,这个请求在人工智能应用当中已经是非常大的,有两万台机器昼夜不停计算各种概率。
除了创作分发,在互动方面人工智能参与非常多,我们经常想问一个问题,但是我不知道这个问题问谁,不知道大家是否有这样的经历,我有一个问题,不知道谁知道这个问题,我们可以在朋友圈问一下,如果有人懂这个方面,可能就会回答。我们分析问题领域,我们在所有的用户当中找到这个领域感兴趣的人,这个人看过这个领域很多的文章,我们将把你的问题推荐给可能的回答者,我们判断他有可能回答出高质量的答案,把问题推荐给他,如果把问题回答出来以后,我们再判断还有什么人对这个答案感兴趣,再推荐给读者,所以提问、回答、阅读,这个匹配过程也是可以让机器发挥非常重要的作用,很可能你感兴趣的问题,我们不仅用问答的匹配,我们也在尝试结构化信息化的内容,机器直接计算出答案,这就是基于计算的自动问答。
接下来就是审核方面,大家知道目前互联网信息的爆炸有非常非常多内容产生,很多内容良莠不齐,我们需要把符合法律法规不符合公众社会道德的内容去除掉,现在头条的内容一个人看的话需要150天才能看完,如果两个人看他们之间的准确率只有75%,但是有机器处理准确率可以达到87%,25分钟就可以阅读完,机器人可以比人更快的阅读,找出其中的错误的部分,所以人工智能也用于审核。我觉得头条是一个中国原创但是全球领先的,人工智能在信息领域的应用,我们现在也在努力把这项技术这项产品推向全世界,谢谢大家!