名奢网 › 名表› 最新资讯 › 查看内容

阿里AI模型刷新世界纪录阅读了解才干测试全球抢先！

2023-3-3 18:55| 发布者: fuwanbiao| 查看: 168| 评论: 0

放大缩小

简介：近日，在斯坦福等院校和机构发起的“多轮对话型阅读了解评测”（QuAC）上，阿里巴巴人工智能模型“TransBERT”击败全球对手，不只拿下了评测的桂冠，更刷新了该项测试的世界纪录。这也意味着，以阿里巴巴AI为代表的 ...

[PConline资讯]近日，在斯坦福等院校和机构发起的“多轮对话型阅读了解评测”（QuAC）上，阿里巴巴人工智能模型“TransBERT”击败全球对手，不只拿下了评测的桂冠，更刷新了该项测试的世界纪录。这也意味着，以阿里巴巴AI为代表的机器阅读了解才干，又往前迈进了一步。

QuAC（多轮对话型阅读了解评测）由华盛顿大学、斯坦福大学和艾伦人工智能研讨院等研讨机构分离发起，与SQuAD（文本了解应战赛）、CoQA（对话型机器阅读了解应战赛）并称世界级阅读了解评测竞赛，吸收了全世界顶级科学家和技术团队参与。本次竞赛的难点在于，请求参赛的AI模型阅读篇幅更长的多轮对话，题目中还有“指代”和“省略”，以至还存在原文中没有对应对案的含糊问题，这就请求AI模型要有好像人类般“联络上下文”的才干，高度考验联想和推测才干。

阿里巴巴智能效劳事业部算法专家计峰引见说，此次测试中呈现了多次以“他”、“他们”中止的第三人称指代，需求机器中止上下文的主动联想，并作出综合判别；还有无法在原文中找到对应对案的开放式问题，测试的是AI模型在基于文本的阅读了解之外，调用日常贮藏数据库中止推想的才干，简直无限接近人类思索方式。

主办方也以为，多轮对话型阅读了解是目前人工智能对话范畴复杂性最高、最考验自然言语了解技术的，曾经接近人类日常交流的真实场景。

阿里AI模型刷新世界纪录阅读了解才干测试全球抢先！

图：评测案例接近人类日常交流的真实场景，高度考验AI模型的联想和推测才干

仰仗自主研发的“TransBERT”AI模型，阿里巴巴智能效劳事业部、计算平台事业部分离浙江大学人工智能研讨所，打败国内外竞争者，以三个指标总分144.1拔得头筹，刷新了此测试的最高纪录，其中两项指标大幅超越第二名。

阿里AI模型刷新世界纪录阅读了解才干测试全球抢先！

图：“TransBERT”AI模型以三个指标总分144.1拔得头筹，两项指标大幅超越第二名

AI技术面对多轮次对话，以及“指代”、“省略”、“含糊语义问题”等场景早已并非仅在测试环境中发作，在阿里巴巴平台的客服机器人“阿里小蜜”的日常应用中，此类较为复杂的阅读了解场景早已成为AI机器人发挥实质性作用的“赛场”。

在阿里巴巴早前发布的一段视频中，阿里小蜜曾经能够以文字和语音等方式，与消费者中止多轮次的复杂对话，问题掩盖售前售后效劳中，常见的打断、指代、省略、转换话题等理想状况。

这也是阿里巴巴AI技术显著区别于学界竞争者的最大不同之处，阿里AI模型在阿里小蜜系列产品的长期实践应用中得到完善和突破，其技术才干立足理想场景，注重与人类对话的真实互动体验，因而能够在QuAC这类测试中抵达接近人类对话的水平。

阿里AI模型刷新世界纪录阅读了解才干测试全球抢先！

图：阿里AI模型技术才干立足人工智能客服小蜜产品的理想效劳场景

这并非阿里巴巴AI技术初次在机器阅读范畴突破世界纪录。在斯坦福大学于2018年初发起的机器阅读范畴顶级赛事SQuAD（文本了解应战赛）上，阿里巴巴智能效劳事业部就曾分离阿里达摩院夺冠，完成了人工智能在阅读才干上初次对人类的超越。2019年初，阿里小蜜仰仗在物流、智能助理等功用方面的出色表示，入选《麻省理工科技评论》“全球十大突破性技术”榜单，被以为是有望引领AI助手完成庞大进化的代表。

在人工智能的驱动下，客服行业也正在阅历快速升级迭代。2018年，阿里小蜜全年对话轮次高达14亿次，效劳消费者约4.9亿人次。而基于实践场景不时完善的算法技术，也让以阿里小蜜为代表的智能客服正以史无前例的速度和智能才干处置消费者和商家的痛点，提升商业效率。