清华大学人工智能“泰斗”张钹:ChatGPT出现后 建立人工智能理论有了可能性
本篇内容主要来自于清华大学人工智能研究院名誉院长、中国科学院院士张钹7月6日下午在世界人工智能大会昇腾人工智能产业高峰论坛上的演讲,演讲全文经作者编辑,做了不改变原意的整理),内容略有删改。
张钹院士是中国人工智能领域泰斗级专家,早在40多年前,张钹就开始投身人工智能领域研究,发表了中国第一篇人工智能领域的学术论文、获得中国在人工智能领域的第一个国际重要奖项、领衔成立国内首个智能机器人实验室、培养了本土第一位人工智能领域博士毕业生,组建中国第一个人工智能国家重点实验室……这些“第一”树立了中国人工智能发展的一个个里程碑,推动中国在此领域大踏步前进。
【资料图】
作为中国人工智能主要奠基者和发展推动者,40多年来,张钹矢志不渝致力于中国人工智能领域的创新,发表或共同发表了数百篇学术论文,出版系列专著。他获得了诸多奖项,其中包括ICL欧洲人工智能奖、国家自然科学三等奖、国家科技进步三等奖、国家教委科技进步一、二等奖、电子工业部科技进步一等奖以及国防科工委科技进步一等奖。
一年前,中国科学院院士、清华大学人工智能研究院名誉院长张钹询问了还处于实验室阶段的ChatGPT一个简单的问题:清华大学校歌歌词是什么?
ChatGPT没有回答正确,反而开始胡说八道,张钹当场指正并输入了正确的校歌歌词。但退出后再度进入,ChatGPT的答案依旧是错的,此后张钹数度询问,ChatGPT依旧无法给出清华大学校歌的正确回答。
他通过这个案例,指出了ChatGPT三个不可避免的缺点,他认为,这些情况说明Chat GPT的输出往往不会符合我们道德、伦理、政治的要求。所以ChatGPT出现以后,人工智能的治理不可避免。
他在2023世界人工智能大会上表示,只有彻底把以ChatGPT为代表的大模型与生成式人工智能的内部工作原理搞清楚,才能找到人工智能发展的“金钥匙”。
1.ChatGPT向通用人工智能迈出了一步
为什么说ChatGPT的出现是一个关键节点?目前行业有观点认为,ChatGPT是通用人工智能,也有相反的观点指出ChatGPT不是通用人工智能。张院士认为这两个说法都不全面,他比较赞同微软提出的,ChatGPT是通用人工智能的火花。
张钹认为,最恰当的评价是,ChatGPT向通用人工智能迈出了一步。
ChatGPT具有通用人工智能的两个特征,第一个特征是,在对话和聊天这个领域,它达到了人工智能的目标,或者是达到了行为主义主张的人工智能的目标,即使得机器的行为跟人类的行为相似,与ChatGPT 对话和人类的对话很相近;
第二个特征,ChatGPT 是开领域、多任务的,在对话这个问题里跟领域无关,这是一个重大的突破。大家知道人工智能经历过第一代知识驱动,第二代数据驱动,都只能在限定领域里面完成单个任务。所以ChatGPT就变成开领域, 走向通用。
基于“达到人类水平”、“突破限定领域”这两个通用人工智能最重要的特征,所以可以说它是通用人工智能。但因为它只是在对话,或者讲得宽一点,是在语言处理这个领域里面达到这个目标, 所以还不能把它称作通用人工智能,因为在别的智能领域里面,它能否通用现在还说不清楚。
2.ChatGPT达到现在的水平背后经过了行业六七十年的努力
为什么ChatGPT 为什么能够达到现在这样的水平,张钹解释,主要由于人工智能经过六七十年的努力实现了三个关键技术的突破。
第一个技术,基于词嵌入的文本语意表示。
第二个技术,是基于注意机制的转换器,就是刚刚高院士谈的大模型,我们现在说的大模型就是大转换器。
第三个技术,是基于预测下一个词的自监督学习。
他认为,ChatGPT 是经过人工智能领域或其他领域大量科学家和工程师六七十年共同努力的结果,以上三个问题的突破,使得机器在处理文本上起到了本质的变化。
过去我们在处理文本的时候,往往把它称作处理数据,到现在为止,大家还是用的这个词,但是这个词在ChatGPT不成立,因为ChatGPT是在我们找到了文本语意表示这个条件下再处理文本,所以它处理的不是文本的形式,不是把文本当成数据来处理,而是把文本当成知识来处理。
所以他认为,ChatGPT成功并不是仅仅归功于三个要素,也就是数据、算力和算法,我觉得应该强调四个要素,分别是知识、数据、算法和算力。“也就是说,我们有三个关键技术的突破,就使得我们能够从大量的文本这里我们叫做数据,从大量的数据中间可以获取到知识,只有出现这个转变才有现在的ChatGPT,不然我们还是停留在那个认识上肯定是错的。”
3.人工智能发展到ChatGPT以前不能说是科学
张钹判断,这个突破可能带来三件事情是不可阻挡的:
第一件事就是必然带来科技的革命,首先会带来人工智能本身的革命。
张钹解释称,人工智能发展到ChatGPT以前,不能说它是一个科学,因为它没有理论。
人工智能为什么理论建立不起来?非常重要的原因是,第一代人工智能做的知识驱动也好,第二代人工智能做的数据驱动也好,都是在限定领域中完成单个任务,而在单领域单任务里面不可能建立一个通用理论,ChatGPT扫除了这个障碍,至少在自然语言处理上扫除了这个障碍,因为它跟领域无关。一旦跟领域脱钩了,才有可能建立起来它的通用理论。
所以,现在去建立人工智能理论是有可能的,在ChatGPT没出现以前,这种可能性不存在。
“所以这对我们来讲是一个激励,突破口就是ChatGPT,如果我们没有把ChatGPT内部的工作原理搞清楚,我们就找不到进入人工智能理论的钥匙。”
ChatGPT里面很多现象,我们说不清楚,但是一方面它能够生成一个非常出人意料非常好的结果,它同时又会胡说八道。为什么会出现这个现象根本不清楚。
所以头一个必然会迎来的科技的革命,首先这个革命会从 AI 本身开始。
第二个事情,就是产业的变革。首先是人工智能产业本身的产业变革。
人工智能产业的发展跟信息技术的产业发展是非常不一 样的,信息科技的发展,我们可以用 4 个字来形容“高速持续”,但是人工智能产业的发展是“缓慢曲折”。
什么原因呢?一个最重要的原因就是信息科技从一开始理论就建立起来了,计算机的理论是 1936 年建立的,通讯理论是 1948 年建立的,所以它在理论指导下,技术和它的产业发展都非常顺利。
而人工智能只有算法和模型,而且这些算法和模型都是领域限定和任务限定的, 所以你开发出来的所有人工智能的硬件或软件全是专用的,跟信息产业完全不同,
信息产业的所有硬件和软件全是通用的,市场非常之大,而信息产业的硬件或软 件通常是专用的,都是跟领域紧密结合的,信息产业不跟领域结合根本不可能有 这个产业,但是拿计算机来讲,完全不跟应用结合,它生产出来的计算机什么地方都能用。
但是有了ChatGPT之后,人工智能有可能建立一个跟领域无关的模型和算法,只有这个算法和模型摆脱了领域的限制,将来生产出来的硬件和软件才会是通用的,或者是一定范围里头通用的,才有很大的市场。这就是今后信息产业革命的一个方向。
第三个事情,人工智能治理。
回到“清华校歌”这个例子,他认为,这些情况说明ChatGPT的输出往往不会符合我们道德、伦理、政治的要求。所以ChatGPT出现以后,人工智能的治理是不可避免的。
张钹主张要发展第三代人工智能。
一是要建立可解释鲁棒的人工智能理论。ChatGPT出现以后建立这个理论才成为可能,过去实际上是不可能建立的。
第二个内容,发展安全、可信、可控、可靠、可拓展的人工智能技术,只有建立了这个理论之后,我们才有可能得到一个安全的人工智能技术。
“换句话说, 现在的人工智能技术是不安全的,不可靠的,也是不可信的。特别是利用大数据的机器学习,结果一定是这样的。”
我们必须建立人工智能的理论,这才能开发出可信、可靠、可信及可扩展的人工智能技术,最后,才能推动产业化的创新应用和产业发展。
以下为演讲全文:
各位专家、各位嘉宾、大家好!非常高兴被聘请为昇腾 AI 的荣誉顾 问,这可能是对人工智能工作者的一种鼓励。我觉得人工智能工作者需要鼓励, 因为人工智能是闯无人区非常艰难,大家不要认为人工智能取得的每一个进步都是那么容易的,都是非常困难的。
首先我想谈一个问题,怎么评估ChatGPT?现在有两种说法,一种说法是,ChatGPT是通用人工智能,还有一种说法,它不是通用人工智能,我的观点是,这两个说法都不对,也都对。
我认为最恰当的是说法是,ChatGPT向通用人工智能迈出了一步。按照微软的说法,ChatGPT是通用人工智能的火花,我赞成这种观点。
为什么呢? ChatGPT具有通用人工智能的两个特征,一个特征是,在对话或者聊天这个领域,它达到了人工智能的目标,或者达到了行为主义所主张的人工智能的目标。
行为主义人工智能现在是人工智能主流,它背后的哲学是唯物主义、实用主义的,其追求的人工智能目标是使得机器的行为跟人类的行为相似。
为什么说ChatGPT达到了这个指标,因为我们跟ChatGPT对话的时候,就和人类的对话很相近,因此它达到了头一个通用人工智能的特征。
第二个特征是,ChatGPT是开领域多任务,也就是说,在对话这个领域,问题跟领域无关,这是一个重大的突破。
大家知道,人工智能经历过第一代知识驱动,第二代数据驱动,都只能在限定领域里头完成单个任务,所以ChatGPT的出现变成一个开局,开始走向通用。
在通用人工智能最重要的两个特征上,达到人类水平,跟领域有关,所以我们可以说它是通用的。但是因为它只是在对话或者说只是在语言处理这个领域里达到这个目标,所以我们还不能把它称作通用人工智能。因为在别的智能领域是不是能通用,现在还说不清楚。
所以我觉得,这样的估计是非常恰当的,我们只有在这样的估计情况下才能讨论下面的问题。
首先一个问题,ChatGPT为什么能够达到现代质量水平?甚至很多地方使大家感到非常惊奇,这主要由于人工智能经过六七十年的努力,实现了三个关键技术的突破。
第一个技术,基于词嵌入的文本语意表示。
第二个技术,是基于注意机制的转换器,就是刚刚高院士谈的大模型,我们现在说的大模型就是大转换器。
第三个技术,是基于预测下一个词的自监督学习。
所以我们应该说,ChatGPT是经过人工智能领域里头或者其他领域里头大量的科学家和工程师,经过六七十年共同努力的结果,因为经过六七十年,这三个问题才得到成果。
这三个关键问题的突破,使得机器在处理文本上起了本质的变化。
过去我们在处理文本的时候,我们往往把它称作处理数据,到现在为止大家还是用的这个词儿,但是这个词儿在ChatGPT 里不成立,因为ChatGPT是在我们找到了文本语义考试条件下在处理文本,所以它处理的不是文本的形式,不是把文本当成数据来处理,而是把文本当成知识来做,所以ChatGPT的成功并不是归根于三个要素,我觉得应该强调4个要素,知识、数据、算法和算力。
也就是说我们有三个关键技术突破,就使得我们能够从大量的文本,我们把它叫做数据,从大量的数据中间能够获取到知识点,因为只有实现这个转变,才有现在的成绩,不染我们还是停留在那个认识上肯定是错的。
那么这个突破,可能带来三件事情是不可阻挡的,头一件事必然带来科技的革命,首先会带来人工智能本身的能力。
人工智能发展到ChatGPT以前,我们不能说它是一个科学,为什么?他没有理论。
人工智能为什么理论建立不起来?非常重要的原因是在历代人工智能做的知识驱动也好,第二代做的数据驱动也好,我们都是在限定领域里完成单个任务,在单领域单任务里头不可能来建立一个通用理论,ChatGPT扫除了这个障碍,至少在自然语言处理上扫除了这个障碍,因为它这个领域无关,一旦跟领域脱钩了,才有可能建立起来通用的理论。
所以现在去研究,去建立人工智能理论是有可能的,在ChatGPT没出现以前这种可能性不存在,所以这对我们来讲是一个激励。
什么是突破口?突破口就在ChatGPT,如果我们把ChatGPT内部的工作原理搞清楚,我们就能找到进入人工智能理论的钥匙。
ChatGPT里很多现象我们说不清楚,一方面它能够生成一个非常出人意料的结果,他同时又会产生所谓幻觉,胡说八道,为什么会出现这个现象,这个根本不清楚?
所以头一个必然会迎来一个科技的革命,首先这个革命会从 AI 本身开始。
第二个事情,大家讨论得非常多,就是产业的变革。首先是人工智能产业本身的产业变革。
人工智能产业的发展,跟信息科技产业发展是非常不一样的。信息科技的发展,我们可以用4个字来形容,高速持续,可是人工智能技术产业的发展缓慢曲折,什么原因?
一个最重要的原因,信息科技从一开始,理论就建立了起来,计算机的理论是1936年建立,通讯理论1948年建立,所以在理论指导下,它的技术、它的产业发展都非常顺利,
信息产业的所有硬件和软件全是通用,市场非常之大,信息产业不跟领域结合,根本就不可能有这个产业。而人工智能都是跟领域紧密结合,只有算法和模型,而且这些算法方面都是领域限定,任务限制的,开发出来的所有人工智能的硬件和软件全是专用,跟信息产业完全不同。
拿计算机来讲,完全不跟应用结合,它生产出来的计算机什么地方都没有用,但是有了ChatGPT之后就告诉大家,人工智能有可能建立一个跟领域无关的模型。
只有算法和模型摆脱了领域的限制,将来生产出来硬件和软件才会是通用,或者一定范围里头通用,你才有一个很大的市场,这就是今后信息产业革命的一个方向。
第三个事情,人工智能治理。ChatGPT 大家看正面得比较多,其实它反面也是很成问题的,因为我们用的方法是叫的预测下一个词,这种模式的学习,必然带来两个大问题:
首先,它的结果不确定,受提示词的影响极大,这就引起了ChatGPT输出有三个不可避免的缺点。
第一个缺点,错误是必然的,所以我们说胡说八道是必然的。
第二个它的输出,非常受输入的影响,受提示词的影响,我可以改变我的输入,问同样的问题,改变他的输入就会得到一个完全不同的问题。
第三个,他不知道自己错了,也改不了,必须依靠后面,刚才高文院士也提过了,AI对齐等等,为什么要靠我们来弄呢?他自己改不改?
我就举个非常简单例子,到现在为止,我问ChatGPT清华大学的校歌的歌词,他自己编了一套,我1年多以前就这么问他,到现在还是这样,我就告诉他说不对,清华大学校歌不是你说的,应该是西山苍苍东海茫茫,我把这歌词抄给他,他马上回对不起,我说错了,你应该跟清华大学歌词,我退出来再进去,问他清华大学校歌是什么,他又自己编了一套,就说明他不知道自己犯错了,而且是我告诉他错误,他也改不过来。
这些情况就说明ChatGPT的输出往往不会符合我们的要求,我们的道德要求,我们的伦理要求,我们政治的要求,所以人工智能的,这就是 ChatGPT出现以后,人工智能的治理是不可避免的,我是认为三个趋势一定是这样的。
那么我们怎么办?
我觉得我们主张,要发展第三代的人工智能,第三代人实际上是包含了三个内容,一个内容就是要建立可解释、鲁棒的人工智能理论。刚才我们提过千亿出现投资这种建立这个理论,才成为可能。过去实际上你不可能建立。
二是发展安全、可信、可控、可靠可扩展的人工智能技术。
也就是说只有建立了这个理论之后,我们才有可能得到一个安全的人工智能技术。换句话讲,现在的人工智能技术是不安全的,不可靠和不可信的,特别是利用大数据的机器学习,它的结果一定是这样的。我们必须建立人工智能的理论,这才能开发出可信、可靠、可信及可扩展的人工智能技术,从而推动产业化的产业创新应用和产业发展。
我相信,通过我们国家全国的规划,通过产学研的结合,我觉得我们这个目标一定会达到的,谢谢大家。
标签:

加快场景创新 科技部首批支持建设十个人工智能示范应用场景
2022-08-16

科技部公布《企业技术创新能力提升行动方案》 亮出10项行动内容
2022-08-16

进入了发展快车道 冷链行业市场规模正在快速膨胀
2022-03-21

行业正站在风口 数字化时代在为传统的自行车产业赋能
2022-03-21

以做强实体经济支撑为重点 成都单个项目年度计划投资同比提升
2022-03-21

拥有多个国际赛事的直播版权 广州游戏电竞企业业绩向好
2022-03-21

投诉量激增 直播带货存在这么多问题的主要原因是什么?
2022-03-21

工作专班深入到各企业 春寒料峭挡不住松原市施工热情
2022-03-21

引导企业向提供“产品+服务”转变 湖南加快智能农机服务化转型
2022-03-21

创新平台建设和科技成果转化 德州加大力度重奖创新
2022-03-21
科技部公布《企业技术创新能力提升行动方案》 亮出10项行动内容
进入了发展快车道 冷链行业市场规模正在快速膨胀
行业正站在风口 数字化时代在为传统的自行车产业赋能
以做强实体经济支撑为重点 成都单个项目年度计划投资同比提升
拥有多个国际赛事的直播版权 广州游戏电竞企业业绩向好
投诉量激增 直播带货存在这么多问题的主要原因是什么?
工作专班深入到各企业 春寒料峭挡不住松原市施工热情
引导企业向提供“产品+服务”转变 湖南加快智能农机服务化转型
创新平台建设和科技成果转化 德州加大力度重奖创新
潜在风险进一步放大 商品房现房销售已是大势所趋
有序复工复产 1—2月份工业经济发展新动能持续增强
多层次高频调度 1至2月河北省工业运行先行指标稳中有增
以车路协同为基础 智能交通推动城市交通绿色高质量发展
人才短板成为制约产业链高质量发展的关键节点
通过技术手段整合调配供给资源 家政行业不断提质扩容
强化产业链深层次合作 加强重大装备国产化“一条龙”模式构建
如何进一步提升纳税人缴费人的减税降费获得感?
探索建设大数据及网络安全示范试点城市有哪些积极意义?
对制造业中小微企业实施缓缴税费政策有哪些积极意义?
进一步增强自我保护意识 消费者需注意辨别谨慎消费
将“走出去”变“请进来” 西安贸易产业转移承接作用不断得到增强
厦门应如何融入“数字中国”的重大战略发展大局?
江苏省如何不断满足老人日益增长的养老服务需求?
建设一体化的职业健康信息管理平台 天津职业人群保障加强
潜力持续释放 1—2月乡村消费品市场恢复略好于城镇
直接对接社会化服务 楼宇调解室将整体提升青岛劳动争议水平
成功化解纠纷11.47万件 银保监会服务质量日趋提高
春雷响百虫出 惊蛰文化在其他方面有了进一步发展
青绿山水画在古代山水画发展史上有着怎样的影响与地位?


- 开播即爆款 “文化类节目收视率低”这一固有印象被推翻
- 涵盖了109件真迹作品 凯斯·哈林展览将持续至6月13日
- 带有一点自信的自嘲 “隔路”是另一种味道的“凡尔赛”
- 与文渊阁前后呼应 “何以中国”特展隆重致敬文化大成
- 严重者可造成暂时性失明 享受冰雪运动要注意眼睛的健康防护
- 种类繁多让人眼花缭乱 选购牛奶时需要重点关注什么?
- 网课让孩子感到不安焦虑怎么办?八问八答回应广大家长关切
- 循环系统很容易受到刺激 “倒春寒”期间老人该如何做?
- 青少年患者睡眠问题日趋增加 9条建议为孩子助眠
- 我国肥胖人群正逐年递增 不良饮食习惯是重要诱因
- 如何减少噪声对听力的损伤?这份耳部和听力保健小贴士请收好
- 强化住房限购措施 西安限购限售范围进一步扩大
- 多种方式增加供给 进一步降低新市民和青年人的居住成本
- 预计9月下旬海口可实现安居房申请网上办理
- 政策调控力度持续升级 8月百城二手房市场均价止涨转跌
- 8月中国新房找房热度依然保持平稳 环比微涨0.2%
- 进一步加强商品房销售价格备案管理 今年全国楼市调控刷新历史纪录
- 西安第二批集中供地中28宗为现场拍卖方式出让
- 细分化需求得到释放 房屋居住的属性越发凸显
- 佛山顺德龙江近日挂牌商住地起拍价约19.88亿元
- 青岛市4宗地竞品质抽签结果出炉 地溢价均约15%
- 坚持政策支持、多方参与 浙江版保障性租赁住房明确新增比例目标
- 简化审批流程 武汉将实现房源申请配租全程网上办
- 哈尔滨新增本土确诊病例3例 活动轨迹公布
- 哈尔滨市公布3例新增本土新冠肺炎确诊病例活动轨迹
- 山东深耕文化资源 推动旅游业高质量发展
- 今年新增952件(套)!南京大屠杀再添新证
- 四川非遗传承人张雄志:巧手捏面塑 指尖传非遗
- 10月以来我国寒潮为何如此频繁?中国气象局回应
- 56位残疾人士登上黄山 互利互勉共建生活希望
- 安徽潜山两车相撞 已致8人死亡3人受伤
- 上海洋山海关首次在出口货运渠道查获夹带卷烟
- 山西忻州古城:一城风华延续千年历史文脉
- 呼伦贝尔新巴尔虎右旗公布1例无症状感染者行动轨迹
- 新增“53+1” 内蒙古累计本土确诊病例增至185例
- 昆明公安打击破坏生物多样性犯罪 抓获130名涉案嫌疑人
- 山西朔州“11·11”较大透水事故调查报告发布 对38人问责处理
- “海关国门小卫士”竞争上岗 淘汰率接近一半
- 深圳摧毁特大品牌化妆品走私网
- 28人被问责!山西石港煤业“3·25”事故调查报告公布
- 湖南韶山以河长制带动全民治水 让每一处水面“长治久清”
- 上海市奉贤区人大常委会原党组书记袁晓林被“双开”
- 民进会员谈反映社情民意信息工作:心怀大我 敢讲实情
- 80岁“留守”奶奶短视频诉孤独 千万网友心疼:我们陪您唠嗑
- 40年来为子弟兵送出1.3万余双布鞋和鞋垫的“布鞋奶奶”走了
- 当男幼师是什么体验?他们说:有委屈尴尬 但大部分是幸福
- 庐阳警方通报幼童坠亡事件:嫌疑人已被刑拘
- 内蒙古新增本土确诊病例53例、本土无症状感染者1例
- 哈尔滨市启动部分地区第一轮全员核酸检测
- 四川通江发生两车相撞事故 致3人死亡