复旦大学NLP实验室核心成员:我们低估了ChatGPT影响力

第一财经2023-02-22 07:54:16 听新闻

作者:刘晓洁    责编:李娜

时下科技领域最热的概念莫过于ChatGPT。

2月20日,复旦大学邱锡鹏团队推出中国版ChatGPT“MOSS”,这是国内第一个公布的对话式大型语言模型,热情的用户涌入一度导致其服务器被挤崩。

21日晚,第一财经连麦学界、法律界大V,共同探讨了ChatGPT的应用、误读以及其牵涉的法律风险和商业伦理问题。

复旦大学计算机科学技术学院教授张奇参与了本次讨论,他正是推出MOSS的复旦大学NLP实验室的核心成员之一,就当下所面临的一些争议,他表示MOSS并不代表国内最好的模型,团队只是想在学术上进行数据收集,进入更详细的探讨。

作为专业研究者,张奇复现了ChatGPT 推出背后所需要投入的资源,这是一个非常耗时、耗人且耗钱的一个过程。他表示,这不仅对于学术界来说是不小的投入,甚至对于互联网大厂来说,做这类研究都是一个不小的投入。

MOSS迈出第一步

相对于ChatGPT,MOSS仍然有非常大的差别,在直播中,张奇直言,“ChatGPT是千亿级的模型,我们只有百亿级。此外在指定微调的阶段ChatGPT并没有公开,但是能够看到的版本已经有1800种任务,团队只有数百种任务,规模上远远小于它。”

张奇所在的复旦团队从整体上复现了ChatGPT的步骤,他解释道,语言模型的最后一步需要人的参与,如果没有用户的真实数据,团队很难对模型进行提升,也很难再进行下一步的研究。这也是MOSS推出的背景。

推出当时团队并没有考虑太多,随后而来的热度和争议也是团队没有想到的,“我们低估了ChatGPT和MOSS的影响力。”

面临争议,2月21日,复旦团队在MOSS官网发布公告致歉,称模型还不成熟,距离ChatGPT还有很长的路需要走,“我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证 ChatGPT的技术路线,并且实现各种对话能力。”

对于ChatGPT 背后模型所拥有的1750亿的参数规模,张奇表示,学校这类机构很难去完成,目前百亿级的规模都已经非常困难。

按照ChatGPT目前开源的最简单的复现版本、最便宜的模式去计算,要做到1750亿的参数规模,需要大概6000万的硬件成本,同时运算3.5个月。这还是所有事情都做对的情况,如中间有参数调整,或者想加速训练过程,就需要更高规模的投资。

按ChatGPT的规模估算,张奇判断OpenAI大概为此耗费了十几亿的硬件投资,不包括顶级的算法研究人员的投资,以及后续对大量用户数据收集的投资。

“这其实是一个非常耗时、耗人且耗钱的一个过程。”不仅对于学术界来说是不小的投入,甚至对于互联网大厂来说都是一个不小的投入。

因此,在资金、算力的投入门槛下,面临应用场景和商业化的不确定性,团队和企业敢不敢去做这类研究,每一步都制约着在这个领域的进步。

尽管当下面临很多问题,张奇所在的实验室对于ChatGPT所带来的通用人工智能的可能性仍充满期待。

“实验室很多同学都已经是997,我们大概8点就已经到办公室,晚上10点才回家。这种状态就像我们看到了莱特兄弟的飞机飞10米的那个状态,然后我们想把它飞到100米,去实现那样的可能性。”

ChatGPT被过誉了吗

ChatGPT的能力到底如何?张奇团队对此做了一个针对ChatGPT的高考测试,发现其展现了很好的理解和推理能力。

以2022年的高考全国卷为例,在把一些复杂的问题排除掉后,ChatGPT可以达到76%的准确率和67%的得分率,在文科上能够达到78%的得分率。综合来看,ChatGPT在高考中可以获得500分左右的成绩,相当于是二本线的一个结果。

但就目前ChatGPT所引起的追捧来看,它是否被过誉了?上海大邦律师事务所高级合伙人游云庭提到,自己是国内较早使用ChatGPT的用户,但用了两天就失去兴趣,因为现有的互联网对他这类成熟网民来说仍然是更好的选择。

游云庭并不认为ChatGPT可以颠覆搜索,ChatGPT更多偏向于咨询,和搜索引擎是两类产品,且主流用户已经适应了搜索引擎,以目前ChatGPT所展现的能力还无法替代。

此外,ChatGPT还需要很长的时间去开发进行二次落地,“像VR、元宇宙这些概念提出来之时都很热,但现在都相对平静了,因为这些技术的开发实际上都需要很长的时间,这是误导性的问题。”游云庭表示。

复旦大学管理学院助理教授李文文还提到,目前大众的一个误区是对ChatGPT取代人类的工作的担忧,现在网上一些文章或者短视频,用一些或许比较夸张的标题营造了一些恐慌,对于不了解AI产品或是技术的人,甚至会对技术产生消极的情绪。

但实际上,就现阶段的ChatGPT而言,它仍然是一个对话型的AI产品,距离商业落地有比较长的路要走。在试用ChatGPT的时候也会发现它其实存在一些事实性的错误。

如果仅仅把ChatGPT当做娱乐向的产品,错误是可以接受的,但如果要将它应用在企业的业务,如医疗健康、法律领域,它会产生一些严重的后果。

基于此,李文文认为ChatGPT并不会对人类的工作造成太大威胁,未来可能更多是人工智能产品被引入到更多的行业,去辅助而不是取代我们的工作。

作为一名律师,游云庭也提到,作为一个工具,ChatGPT确实能够一定程度提高效率,但并不会对法律行业造成挑战。

“我试着用ChatGPT生成一份合同,给它设定一个任务,给了一些条件,这份合同出来之后我松了一口气,我的职业看起来是比较难取代的。”游云庭提到,在ChatGPT的合同中,有一些逻辑上的错误,前后仍然有一些矛盾,还需要很多的细调。但仅仅是这样的细调,在人工智能领域或许就需要耗时不短的时间,才能达到对于商业化的要求。

在诉讼方面,美国一家企业已经开发了一个人工智能律师,一定程度上的确可以取代律师的工作,但法律服务在所有国家都是有壁垒的,包括律师的牌照。而是否允许人工智能参与到法律服务中,还涉及到人工智能的伦理问题。

“在这些问题没有搞清楚之前,我相信任何一个国家的律师主管部门,都不会轻易给人工智能发牌照。从诉讼的角度来说类似ChatGPT的一些应用,要挑战律师饭碗也挺难。”游云庭说。

举报
文章作者
第一财经广告合作,请点击这里
此内容为第一财经原创,著作权归第一财经所有。未经第一财经书面授权,不得以任何方式加以使用,包括转载、摘编、复制或建立镜像。第一财经保留追究侵权者法律责任的权利。
如需获得授权请联系第一财经版权部:
021-22002972或021-22002335;banquan@yicai.com
分享
热度
意见反馈箱:yonghu@yicai.com
客服热线:400-6060101 Copyright 第一财经 ALL Rights Reserved