百度ERNIE2.0强势发布

2019年3月,百度正式发布NLP模型ERNIE,其在中文任务中全面超越BERT一度引发业界广泛关注和探讨。

今天,经过短短几个月时间,百度ERNIE再升级。发布持续学习的语义理解框架ERNIE2.0,及基于此框架的ERNIE2.0预训练模型。继1.0后,ERNIE英文任务方面取得全新突破,在共计16个中英文任务上超越了BERT和XLNet,取得了SOTA效果。

目前,百度ERNIE2.0的Fine-tuning代码和英文预训练模型已开源。(Github项目地址:https://github.com/PaddlePaddle/ERNIE)

近两年,以BERT、XLNet为代表的无监督预训练技术在语言推断、语义相似度、命名实体识别、情感分析等多个自然语言处理任务上取得了技术突破。基于大规模数据的无监督预训练技术在自然语言处理领域变得至关重要。

百度发现,之前的工作主要通过词或句子的共现信号,构建语言模型任务进行模型预训练。例如,BERT通过掩码语言模型和下一句预测任务进行预训练。XLNet构建了全排列的语言模型,并通过自回归的方式进行预训练。

然而,除了语言共现信息之外,语料中还包含词法、语法、语义等更多有价值的信息。例如,人名、地名、机构名等词语概念知识,句子间顺序和距离关系等结构知识,文本语义相似度和语言逻辑关系等语义知识。设想如果能持续地学习各类任务,模型的效果能否进一步提升?

百度ERNIE2.0强势发布

▲ERNIE2.0:可持续学习语义理解框架

基于此,百度提出可持续学习语义理解框架ERNIE2.0。该框架支持增量引入词汇(lexical)、语法(syntactic)、语义(semantic)等3个层次的自定义预训练任务,能够全面捕捉训练语料中的词法、语法、语义等潜在信息。

这些任务通过多任务学习对模型进行训练更新,每当引入新任务时,该框架可在学习该任务的同时,不遗忘之前学到过的信息。这也意味着,该框架可以通过持续构建训练包含词法、句法、语义等预训练任务,持续提升模型效果。

百度ERNIE2.0强势发布

▲新发布的ERNIE2.0模型结构

依托该框架,百度充分借助飞桨PaddlePaddle多机分布式训练优势,利用79亿tokens训练数据(约1/4的XLNet数据)和64张V100(约1/8的XLNet硬件算力)训练的ERNIE2.0预训练模型不仅实现了SOTA效果,而且为开发人员定制自己的NLP模型提供了方案。目前,百度开源了ERNIE2.0的Fine-tuning代码和英文预训练模型。

百度研究团队分别比较了中英文环境上的模型效果。英文上,ERNIE2.0在自然语言理解数据集GLUE的7个任务上击败了BERT和XLNet。中文上,在包括阅读理解、情感分析、问答等不同类型的9个数据集上超越了BERT并刷新了SOTA。

百度ERNIE2.0强势发布

ERNIE的工作表明,在预训练过程中,通过构建各层面的无监督预训练任务,模型效果也会显著提升。未来,研究者们可沿着该思路构建更多的任务提升效果。

自2018年预训练语言模型BERT提出之后,预训练语言模型将自然语言处理的大部分任务水平提高了一个等级,这个领域的研究也掀起了热潮。如今可持续学习的特点亦将成为NLP领域发展里程中的关键。

来源:百度AI

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:卢松松,转转请注明出处:https://www.chuangxiangniao.com/p/1107561.html

(0)
上一篇 2025年1月14日 05:22:01
下一篇 2025年1月14日 05:22:22

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 360安全大模型免费

    万万没想到,360彻底把AI大模型拉下神坛,虽然别的大模型都在降价,但360的大模型直接改免费了。 在第12届互联网安全大会上,老板周鸿祎宣布:360安全大模型免费。后面他又说:对所有购买360标准产品的用户免费提供大模型标准能力,产品加量…

    2025年1月14日
    300
  • 吐槽3家知名的AI大模型指令(Prompt智能体)

    我花了2天时间,把松松最近1年的爆款文案+关键词+情绪+口头禅整理出来,4000多字的Prompt,都是一点点打出来的,再投喂到AI大模型里。使用的平台包括:通义千问、文心一言、智谱清言。 接下来我吐槽下这3家AI模型的创建指令(Promp…

    2025年1月14日
    200
  • 老美AI大模型不让我们用了

    老美AI大模型不让我们用了,连开源的也不让用了。就在昨天:美众议院推出了对涉AI模型实施出口管制法案,以后美国的人工智能AI大模型实施出口管制,用老美的话说就是:以免技术落入“外国不良行为者”之手。 若此法案通过,中国用户和企业可能将无法再…

    2025年1月14日
    300
  • 117个AI大模型备案了

    中国的AI到底有多强 ?看看AI备案的数量就知道了! 据不完全统计,国内正经的AI大模型已经有238个,一夜之间AI大模型遍地开花、百花齐放,中国已成为全球拥有大模型数量最多的国家。 而很多人不知道的是,AI模型也是需要备案的,就和APP、…

    2025年1月14日
    200
  • 解释一些关于大语言模型的常见误解

    01 误解一:「ChatGPT 中文表现不如英文,因为简中网络封闭/贫乏/语料太烂了。 我知道很多人喜欢这个论述,是因为可以借机吐槽简中网络的内容质量。但不管这个前提对不对,大语言模型的中枢并不是中文一套,英文一套,波兰文一套,韩文一套,孟…

    2025年1月14日
    200
  • 干爆ChatGPT,谷歌发布新大模型:Gemini

    谷歌昨天又发布了一个新的大模型,叫Gemini(双子座时代)。打开Google AI 就能看到。 据说非常强,然后是一大堆夸奖,大概是本月中旬的时候正式推出。标题明晃晃写着“最大”、“最强”,主打的就是一个干爆GPT-4。 我们先看一下参数…

    2025年1月14日 站长动态
    200
  • 毕业2年,4次辞职,这是我被虐千百遍后,总结出的工作选择模型

    2016年的4月初,工作一年不到,我把毕业后的第一份工作辞掉了。 我的职业是互联网产品经理。有无数前人都说过,毕业后的第一份工作很重要,要干两到三年,积累一定的经验,千万不要只干1年就走。然而我辞职很坚决。因为我觉得,我的工作内容没什么意义…

    2025年1月13日
    200
  • 浅谈网页搜索排序中的投票模型

    前些天读了一本《选举的困境》,其中有一章,从美国的选举制度说起,介绍美国选举制度的不足,然后针对其不足,提出种种改善,然而每种改善都有其各自的问题,其中的变化很有趣。 先说美国选举制度,美国的总统选举是一种“赢者通吃”的方式,每个州根据其人…

    好文分享 2025年1月13日
    200

发表回复

登录后才能评论

联系我们

156-6553-5169

在线咨询: QQ交谈

邮件:253000106@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

联系微信