在我印象里,上一次席卷互联网的AI(人工智能)话题,似乎还是AI作画。不过由于我对绘画艺术了解很少,所以仅仅有所耳闻,并没有亲自作过尝试。 如果再往前,那可能就是AI围棋了。当时,我根本不相信AlphaGo可以在围棋这项最复杂的游戏上胜过人类的顶尖棋手,可人类与AI的三场比赛最终却以人类的全负告终。 如今,AI围棋不仅可以轻松战胜人类最强的围棋选手,甚至可以再让人类二到三子(每让一子意味着双方的水平差一个层次)。可以说,现在任何一位学习围棋的人都必须向AI请教,职业棋手也不例外。 不仅AI的算力在日益突飞猛进,而且它的表现形式也愈发多样化。或许在未来的某一天,我们已经很难找到一个没有AI涉足的行业了。 回到正文。这段时间最火的AI话题,无疑是去年底诞生的ChatGPT——这是OpenAI旗下的一个智能问答引擎。当你向ChatGPT提问后,它会整合网络上的相关信息并给出一个详尽的回答。 最初,人们只是尝试用ChatGPT来撰写邮件、检查代码或设计活动预案;但很快人们就发现,ChatGPT可以作出更长乃至超过万字的回答。 于是便出现了大学生利用ChatGPT写论文的新闻:美国北密歇根大学哲学教授奥曼(Antony Aumann)在其世界宗教课程上,宣读了一篇优秀论文——“该文用干净的段落、恰当的例子和严谨的论点探讨了罩袍禁令的道德性”。 然而,写出该论文的学生却对教授的提问支支吾吾,最终不得不承认:这篇被教授誉为“全班最好的论文”其实是ChatGPT所作。 再往后,欧洲和美国范围内的各个大学都开始禁止学生使用ChatGPT,多家知名学术刊物也作出了限制使用ChatGPT的声明。 一时间,在ChatGPT面前,学术界几乎“如临大敌”。 以上新闻确实勾起了我的好奇——ChatGPT真有如此强大的能力,以至于可以代替人类撰写学术论文而不被发现? 怀着惊讶与质疑的态度,我决定从偏学术性(尤其我有所了解的古典政治哲学)的方向出发,试探一下ChatGPT目前作出回答的能力究竟如何。 在测试的开始,我向ChatGPT提出了一个简单难度的问题:“古典政治哲学有什么意义?”为了研究ChatGPT处理中文提问的能力,我接着又用中文问了一遍。 无疑,ChatGPT可以轻松应对简单难度的问题。尽管这些信息人类也可以在网上找到,但将它们整合并写出来至少要花上数十分钟,但ChatGPT立刻就能给出答案。 此外,ChatGPT给出的答案很好地遵循了人类思维的逻辑——从what(是什么)到why(为什么)再到how(怎么样);同时,它这一过程中还会进行举例和总结。 最后,ChatGPT给出的中文和英文答案是完全一样的。看来,ChatGPT处理中文问题的方式是先将问题转为英文,然后再将英文答案翻译为中文。 但是这种做法也存在弊端:一方面ChatGPT给出答案的时间很慢(它需要进行翻译);另一方面,中文互联网上的大量信息也无法得到利用,这的确令人遗憾。 接下来,我准备升级一下提问难度,同样还是中文和英文各提问一次。 我之所以认为这个问题属于中等难度,是因为“高贵的谎言”是柏拉图在他的《王制》(即《理想国》)一书中提出的概念。想要准确回答这个问题,就要对柏拉图的这本书有所了解。 很快我就发现,在面对这个问题时,ChatGPT的中文检索出现了错误。 ChatGPT没有识别出中文语境下的“高贵的谎言”,而是将其定义为“善意的谎言”,由此造成了它给出的中文答案和正确答案的南辕北辙。 我猜测造成这一错误的原因是:在将中文提问转化为英文提问的过程中,ChatGPT可能进行了某种不准确的转译。因此,我决定从下一个问题开始放弃中文提问。 回到这个问题上。ChatGPT给出的英文答案总体上是准确的:它提到了柏拉图的《王制》(The Republic),也说明了“高贵的谎言”的文本含义,还从两个方面论述了这一概念的争议性并给出了总结。 然而,ChatGPT给出的答案明显地带有现代色彩,或者说它整合信息的出发点是现代社会。 在处理诸如邮件、编程、活动预案等问题时,这种出发点并没有什么问题,但在学术性的问题上这就很容易导致偏差和遗漏。 具体来说,ChatGPT的答案仅仅只是从现代社会的意义上探讨“高贵的谎言”,却没有考虑到柏拉图本人为什么要提出这一概念——ChatGPT完全没有考虑到这个概念在书中以及对于古代城邦的意义是什么。 因此,尽管ChatGPT的答案中没有错误,却不能让我这位学习古典政治哲学的学生感到满意。 由于刚才正好提到了柏拉图的《王制》(《理想国》),我便突发奇想打算让ChatGPT写一首关于这本书的中文诗歌,看看结果如何: 看来,ChatGPT还是对中文作诗不太擅长,因为这首诗显然是从英文的十四行诗转译而来的。不过它确实抓住了《王制》(《理想国》)的一些重要主题,如真理、正义、道德等,并巧妙地将这些主题词串联在一起。 现在,我决定再次升级一下难度,试试ChatGPT能否就就一个学术性很强的话题写出一篇足以应对课程任务的小论文。 这次我向ChatGPT的提问是:“什么是现代性,我们该如何评价它?” ChatGPT这次给出的答案是最长的,看来它可能也意识到这个问题的复杂性。从内容上看,ChatGPT的回答依然遵循从what(是什么)到why(为什么)再到how(怎么样)的逻辑顺序。 基本上,在ChatGPT关于“现代性”的回答中没有什么错误,用来应对一般的课堂提问应该不成问题。 可这番回答中却有一个我无法容忍的地方——ChatGPT没有提到任何与“现代性”相关的思想家或著作。 此外,我也尝试过要求ChatGPT给出超过8000 words的回答,但它依旧没有提供任何一个标准的学术引用。 在探讨学术性较强的话题时,学术引用既是重要的,也是必要的。如果一个人写了上万字的政治哲学论文,却在文中没有提及任何一位政治哲学的著作,那这简直和一个考上清华北大的人在初中考试里考了0分一样离谱。 最后,我打算试试终极难度的问题——这个问题与我的毕业论文相关——简言之,我询问ChatGPT色诺芬在《雅典的收入》中如何思考雅典的民主政制。 学界过去几乎很少探讨色诺芬的这篇短文,而且仅有的研究也主要集中在经济层面——正如这篇短文的标题所表明的那样,色诺芬关注的似乎只是如何提高雅典的收入。 同样,ChatGPT也认为该书“focuses on the Athenian economy and its sources of income, and does not specifically address Athenian democracy(主要关注雅典的经济及其收入来源,并没有特别提到雅典的民主政制)”。 ChatGPT并没有提出任何有突破性或创新性的内容,也没有谈到《雅典的收入》中任何可能隐含的关于雅典政制的思考。 这番回答并未出乎我的意料,也让我相信人工智能目前还无法真正撰写学术论文——它甚至不能给出一个有意义的选题。 总之,从当下的使用体验来看,我认为ChatGPT是一个更高级、更先进的搜索引擎,它最大的优势在于帮助人类节约时间,但它不能很好地处理非英文的问题,也无法给出有原创性的回答。 既然如此,那么为什么国外许多大学要限制学生使用ChatGPT呢?我觉得可能有两个原因。 其一是:ChatGPT或许可以胜任一些算术、编程或文字运用上的难题,这样一部分学生就不需要自己解决那些课程任务了。 其二是:有些教师在布置论文任务时并没有要求学生研读相关文献或从特别的角度去研究,因此后者可以用ChatGPT写出一篇逻辑通顺、结构完整的论文。 可反过来说,如果人文社科专业的教师布置的论文任务,既不需要任何思考也无需作任何深入的阅读,甚至教师自己都不能辨别符合其要求的论文是否为AI所写,这难道不意味着教师工作的失职吗? 从这个角度上说,其实我们应该欢迎ChatGPT的诞生——人们不再需要浪费时间去发掘和整理各种信息,也不必日复一日地应付流水线一样的枯燥任务。 当然,我不敢肯定ChatGPT等AI最终会不会进化到更高的智能层次,又会不会变得更有创造性并对人类的创新能力提出更大的挑战。 可我又不禁对此感到忧虑——如果真的到了那一天,是不是只有创新性的工作才会需要人类?但这种人毕竟不是多数,那么届时人类社会又将会走向什么方向呢? 北京丨2023年2月 公众号丨天义云天 |