AI首次超越人类!腾讯、阿里的NLP模型,比你更懂中文

​在AI科技圈,「中文语言理解」一直是一个难以攻克的问题。因为在全世界所有的语言中——中文的难度系数是最高的。

图片

举例来讲,就下面这句简简单单20个字的句子,都绝对能让不少外国人深感崩溃。

下雨天,我骑车差点摔倒,好在一把把把把住了。​

图片

然而,在最新的中文语言理解领域权威榜单CLUE中,腾讯阿里的AI模型却先后超越了人类的成绩!实在让人不禁感慨:这年头,还有什么是AI做不了的吗?

图片

最新一期CLUE最新排名

CLUE的全称是Chinese Language Understanding Evaluation,即「中文语言理解测评基准」。

就像英语的GLUE和SuperGLUE,CLUE是一组评估机器能够像人类一样理解和响应中文文本的任务,上线于3年前,也是第一个大规模的中文语言评估基准,旨在推动NLP技术的不断进步和突破。

在CLUE的官网上,有语料库、排行榜、预训练模型和代表性的数据集等资料可供选择。包括文本相似度、分类、上下文推理、阅读理解在内的17项测评任务,其介绍在官网上都有很详尽的展示。

图片

今年11月22日,阿里巴巴的AI模型「AliceMind」获得了86.685的高分,稳居总排行榜首位的同时,也一举打破了由人类(HUMAN)在该系列测试中保持的纪录。

值得一提的是,这也是人工智能在该系列测试中——首次超越人类。

巧合的是,短短4天后,腾讯的「混元AI大模型」在测试中以86.918的高分再次刷新了纪录——这甚至比AliceMind的成绩还要高0.233分。

中国两大互联网巨头你方唱罢我登场,说明人工智能在不同领域和方面都有超越人类的能力。

上周五,阿里云计算部门也在一篇文章中表示,「这标志着中国对AI模型的理解,达到了一个新的水平」。

中国的大型科技公司正努力改进他们的自然语言处理 (NLP) 系统,这些系统被用于支持如阿里巴巴的语音激活虚拟助手,腾讯的小微和AliGenie,以及机器翻译和垃圾邮件检测等其他功能。

今年早些时候,由百度研发的AI模型「度晓晓」写出的作文,尽管错误地使用了不少互联网俚语和生僻词,但仍在高考得分中高于绝大多数学生。

此外在最新排行榜上,中国智能手机制造商OPPO和外卖巨头美团的人工智能模型,也分别排在第四和第五位。

尽管如此,一些研究人员表示:虽然机器在某些语言任务上可以比人类做得更好,但大多数人工智能模型在真正理解语言的复杂性之前,还有很长的路要走。

去年,由美国阿拉巴马州奥本大学和Adobe的研究部门联合研究发现,许多在某些理解任务上表现优于人类的AI,仍无法分辨出单词被随机打乱的句子。

参考资料:

https://www.cluebenchmarks.com/rank.html

https://www.scmp.com/tech/big-tech/article/3201294/tencent-and-alibabas-ai-models-understand-chinese-better-humans-new-rankings-show

https://www.techtimes.com/articles/284084/20221128/tencent-alibaba-ai-tech-tops-chinese-language-comprehension-humans-ranks.htm

https://english.newstracklive.com/news/ai-models-from-tencent-and-alibaba-are-superior-to-humans-at-understanding-chinese-sc71-nu355-ta355-1259160-1.html

以上就是AI首次超越人类!腾讯、阿里的NLP模型,比你更懂中文的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/1656706.html

(0)
上一篇 2025年2月18日 20:10:37
下一篇 2025年2月18日 20:10:51

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 如何使用异步操作提升PHP7性能

    异步操作提升 PHP7 性能的方法:识别并行任务使用并行处理(pcntl 扩展)使用非阻塞 I/O(stream_select 和 stream_socket_client 函数)管理并发监视性能 如何使用异步操作提升 PHP7 性能 异步…

    2025年2月23日
    100
  • PHP7的最佳实践有哪些,以提升性能

    通过实施最佳实践,如启用 Opcache、使用 Preloading、减少 Autoloading、优化数据库查询、避免使用过时的函数和扩展、利用 JIT 编译器、使用 Composer、启用严格模式、使用 Profilers 和考虑使用 …

    2025年2月23日
    100
  • PHP7如何声明变量类型?

    PHP 7 中使用 : 声明变量类型,例如 int $a,以强制变量为指定类型。严格模式(declare(strict_types=1);)可防止隐式类型转换,确保参数和返回值类型匹配,提高代码的可读性和可维护性。但是,类型声明只是辅助手段…

    2025年2月23日
    100
  • 光遇测试服资格申请方法 光遇测试服怎么申请资格

    获取sky光遇测试服资格的详细步骤: 打开光遇游戏,点击游戏设置。 选择“精灵”选项,进入精灵界面。 点击“客户服务”,提交您的申请。 在客户服务页面,输入“测试服申请”。符合资格的玩家将收到测试服邀请。 希望以上步骤能帮助您成功申请光遇测…

    2025年2月23日 游戏
    100
  • PHP7和PHP8新特性比较

    升级到PHP8值得考虑,它提供性能提升和现代化特性。但需谨慎规划以避免兼容性问题。逐步升级,在测试环境进行测试后,再逐步迁移到生产环境。关注社区动态,及时了解安全更新和最佳实践。 PHP7和PHP8:一场性能与现代化的较量 你可能会问,PH…

    2025年2月23日
    100
  • PHP7和PHP8的扩展兼容性

    PHP7 和 PHP8 扩展兼容性受内部 API 更改的影响。部分扩展需修改或放弃,类似于更新引擎后老配件可能无法使用。升级策略包括:检查扩展 PHP8 支持,如有则替换;修改源码适应 API 调整;考虑弃用维护不足或改动过大的扩展。最终,…

    2025年2月23日
    100
  • PHP7和PHP8的数组操作差异

    PHP8的数组操作引入性能优化、更简洁灵活的语法和新增特性,包括:遍历数组时内存访问次数减少,性能提升,尤其在处理大型数组时。str_contains()函数优雅地检查字符串是否包含子串,处理数组元素更方便。命名参数提高代码可读性,尤其当函…

    2025年2月23日
    100
  • PHP7和PHP8的代码示例对比

    升级 PHP 8 非常值得,因为它带来性能提升、代码优雅性和新特性。PHP 8 的联合类型、命名参数、属性和 Match 表达式等增强了代码表达性和可读性,同时保持高性能。然而,升级前需注意弃用特性和扩展库兼容性,并进行充分测试,以平稳过渡…

    2025年2月23日
    100
  • 暗影格斗3卡关怎么办 暗影格斗3闯关技巧有哪些

    暗影格斗3第七章通关技巧详解,助你轻松征服硬核格斗!第七章主线关卡敌人众多,等级提升依赖于击败相应对手。新手玩家常因装备或技巧不足卡关。本文将提供暗影格斗3通关技巧,助你玩转游戏! 一、BOSS攻略 以下针对各BOSS提供应对策略: 1级邓…

    2025年2月23日 游戏
    100
  • PHP7和PHP8的未来发展方向

    PHP7和PHP8的未来在于持续性能优化、更强大的类型系统、拥抱现代开发模式、扩展生态系统和社区建设。PHP7带来了性能飞跃,PHP8引入了命名参数、联合类型等现代特性。未来,PHP将专注于JIT编译器优化、加强类型检查、适应微服务架构、丰…

    2025年2月23日
    100

发表回复

登录后才能评论