1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

一夜之间,世界最强开源大模型Falcon 180B引爆全网!

1800亿参数,Falcon在3.5万亿token完成训练,直接登顶Hugging Face排行榜。

基准测试中,Falcon 180B在推理、编码、熟练度和知识测试各种任务中,一举击败Llama 2。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

甚至,Falcon 180B能够与谷歌PaLM 2不差上下,性能直逼GPT-4。

不过,英伟达高级科学家Jim Fan对此表示质疑,

– Falcon-180B的训练数据中,代码只占5%。

而代码是迄今为止对提高推理能力、掌握工具使用和增强AI智能体最有用的数据。事实上,GPT-3.5是在Codex的基础上进行微调的。

– 没有编码基准数据。

没有代码能力,就不能声称「优于GPT-3.5」或「接近GPT-4」。它本应是预训练配方中不可或缺的一部分,而不是事后的微调。

– 对于参数大于30B的语言模型,是时候采用混合专家系统(MoE)了。到目前为止,我们只看到OSS MoE LLM

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

一起来看看,Falcon 180B究竟是什么来头?

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

世界最强开源大模型

此前,Falcon已经推出了三种模型大小,分别是1.3B、7.5B、40B。

官方介绍,Falcon 180B是40B的升级版本,由阿布扎比的全球领先技术研究中心TII推出,可免费商用。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

这次,研究人员在基底模型上技术上进行了创新,比如利用Multi-Query Attention等来提高模型的可扩展性。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

对于训练过程,Falcon 180B基于亚马逊云机器学习平台Amazon SageMaker,在多达4096个GPU上完成了对3.5万亿token的训练。

总GPU计算时,大约7,000,000个。

Falcon 180B的参数规模是Llama 2(70B)的2.5倍,而训练所需的计算量是Llama 2的4倍。

具体训练数据中,Falcon 180B主要是RefinedWe数据集(大约占85%) 。

此外,它还在对话、技术论文,以及一小部分代码等经过整理的混合数据的基础上进行了训练。

这个预训练数据集足够大,即使是3.5万亿个token也只占不到一个epoch。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

官方自称,Falcon 180B是当前「最好」的开源大模型,具体表现如下:

在MMLU基准上,Falcon 180B的性能超过了Llama 2 70B和GPT-3.5。

在HellaSwag、LAMBADA、WebQuestions、Winogrande、PIQA、ARC、BoolQ、CB、COPA、RTE、WiC、WSC 及ReCoRD上,与谷歌的PaLM 2-Large不相上下。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

另外,它在Hugging Face开源大模型榜单上,是当前评分最高(68.74分)的开放式大模型,超越了LlaMA 2(67.35)。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

Falcon 180B上手可用

与此同时,研究人员还发布了聊天对话模型Falcon-180B-Chat。该模型在对话和指令数据集上进行了微调,数据集涵盖了Open-Platypus、UltraChat和Airoboros。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

现在,每个人都可以进行demo体验。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

地址:https://huggingface.co/tiiuae/falcon-180B-chat

Prompt 格式

基础模型没有Prompt格式,因为它并不是一个对话型大模型,也不是通过指令进行的训练,所以它并不会以对话形式回应。

预训练模型是微调的绝佳平台,但或许你不该直接使用。其对话模型则设有一个简单的对话模式。

System: Add an optional system prompt hereUser: This is the user inputFalcon: This is what the model generatesUser: This might be a second turn inputFalcon: and so on

登录后复制

Transformers

从Transfomers 4.33开始,Falcon 180B可以在Hugging Face生态中使用和下载。

确保已经登录Hugging Face账号,并安装了最新版本的transformers:

pip install --upgrade transformershuggingface-cli login

登录后复制

bfloat16

以下是如何在 bfloat16 中使用基础模型的方法。Falcon 180B是一个大模型,所以请注意它的硬件要求。

对此,硬件要求如下:

可以看出,若想对Falcon 180B进行全面微调,至少需要8X8X A100 80G,如果仅是推理的话,也得需要8XA100 80G的GPU。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

from transformers import AutoTokenizer, AutoModelForCausalLMimport transformersimport torchmodel_id = "tiiuae/falcon-180B"tokenizer = AutoTokenizer.from_pretrained(model_id)model = AutoModelForCausalLM.from_pretrained(model_id,torch_dtype=torch.bfloat16,device_map="auto",)prompt = "My name is Pedro, I live in"inputs = tokenizer(prompt, return_tensors="pt").to("cuda")output = model.generate(input_ids=inputs["input_ids"],attention_mask=inputs["attention_mask"],do_sample=True,temperature=0.6,top_p=0.9,max_new_tokens=50,)output = output[0].to("cpu")print(tokenizer.decode(output)

登录后复制

可能会产生如下输出结果:

My name is Pedro, I live in Portugal and I am 25 years old. I am a graphic designer, but I am also passionate about photography and video.I love to travel and I am always looking for new adventures. I love to meet new people and explore new places.

登录后复制

使用8位和4位的bitsandbytes

此外,Falcon 180B的8位和4位量化版本在评估方面与bfloat16几乎没有差别!

这对推理来说是个好消息,因为用户可以放心地使用量化版本来降低硬件要求。

注意,在8位版本进行推理要比4位版本快得多。要使用量化,你需要安装「bitsandbytes」库,并在加载模型时启用相应的标志:

model = AutoModelForCausalLM.from_pretrained(model_id,torch_dtype=torch.bfloat16,**load_in_8bit=True,**device_map="auto",)

登录后复制

对话模型

如上所述,为跟踪对话而微调的模型版本,使用了非常直接的训练模板。我们必须遵循同样的模式才能运行聊天式推理。

作为参考,你可以看看聊天演示中的 [format_prompt] 函数:

def format_prompt(message, history, system_prompt):prompt = ""if system_prompt:prompt += f"System: {system_prompt}"for user_prompt, bot_response in history:prompt += f"User: {user_prompt}"prompt += f"Falcon: {bot_response}"prompt += f"User: {message}Falcon:"return prompt

登录后复制

从上可见,用户的交互和模型的回应前面都有 User: 和 Falcon: 分隔符。我们将它们连接在一起,形成一个包含整个对话历史的提示。这样,就可以提供一个系统提示来调整生成风格。

网友热评

对于Falcon 180B的真正实力,许多网友对此展开热议。

绝对难以置信。它击败了GPT-3.5,与谷歌的PaLM-2 Large不相上下。这简直改变游戏规则!

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

一位创业公司的CEO表示,我测试了Falcon-180B对话机器人,它并不比Llama2-70B聊天系统好。HF OpenLLM排行榜也显示了好坏参半的结果。考虑到它的规模更大,训练集也更多,这种情况令人惊讶。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

举个栗子:

给出一些条目,让Falcon-180B和Llama2-70B分别回答,看看效果如何?

Falcon-180B误将马鞍算作动物。而Llama2-70B回答简洁,还给出了正确答案。

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4

以上就是1800亿参数,世界顶级开源大模型Falcon官宣!碾压LLaMA 2,性能直逼GPT-4的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/1888511.html

(0)
上一篇 2025年2月22日 12:47:22
下一篇 2025年2月22日 12:48:03

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 《荒野起源》官网地址分享

    《荒野起源》全球预约火热进行中!这款由北极光工作室打造的全新机械文明荒野生存游戏,近期震撼首发,快来官网预约领取丰厚奖励吧! 内容项目 链接/方法 奖励 官网地址https://www.php.cn/link/ab11f404829e4df…

    2025年2月23日 游戏
    100
  • 《荒野起源》游戏预约方法

    机械文明生存手游《荒野起源》全球预约正式开启!现在即可通过官网、taptap或b站参与预约,游戏上线后即可获得“拓荒家园建造套组”预约奖励! 内容 方法 奖励 《荒野起源》预约官网、TapTap、B站拓荒家园建造套组官网地址https://…

    2025年2月23日 游戏
    100
  • 炉石传说星舰贼卡组一览 炉石传说标准星舰贼最新11月

    炉石传说深暗领域版本强势来袭!想快速冲上传说?这份标准国服登顶星舰贼卡组攻略不容错过!助你轻松征服天梯! 11月国服登顶星舰贼卡组代码: AAECAaIHCIukBa3pBY6WBoqoBqfTBvbdBu3nBqrqBgv2nwT3nwT…

    2025年2月23日
    100
  • 崩坏星穹铁道角色定位作用大全

    崩坏星穹铁道角色定位是什么?崩坏星穹铁道角色作用有哪些?崩坏星穹铁道里面的话一些玩家在公测的时候看到角色那么多,但是每个角色的定位还不太清楚啊,这样我们在培养或者阵容的搭配的时候就会束手束脚的,需要提前来了解一下的,不会的话下面一起来看看吧…

    2025年2月23日
    100
  • 崩坏星穹铁道T2角色排行榜

    崩坏星穹铁道t2角色排行榜是什么?崩坏星穹铁道t2角色哪些值得培养?崩坏星穹铁道里面的话一些玩家呢都想要知道下t2角色了呢,这样我们在培养的时候也是有个选择的,今天就给大家带来t2角色强度的分析,这样会简单很多的,那么要是不会的话下面一起来…

    2025年2月23日
    100
  • 《炉石传说》最新版本虚灵巨人贼卡组代码分享

    炉石传说虚灵巨人贼卡组全新升级!本指南将提供最新版本的卡组代码及策略详解,助你轻松掌握这套高技巧卡组。 最新版本虚灵巨人贼卡组代码: AAECAZurBAjg0AWt6QXHpAaKqAazqQa2tQa9vgan0wYLkZ8E9p8E9…

    2025年2月23日
    100
  • 炉石传说虚灵贼怎么玩 虚灵贼卡组玩法解析

    炉石传说虚灵贼卡组攻略:制霸天梯的秘密武器 虚灵贼,凭借虚灵神谕者为核心构建的盗贼卡组,在当前版本称霸天梯,荣登T0级别。本文将深入解析虚灵贼的玩法,助你轻松掌握这套强力卡组。 一、卡组构成与代码 虚灵巨人贼,传说级卡组代码:AAECAaI…

    2025年2月23日
    100
  • Navicat 连接数据库错误代码及解决办法

    Navicat 连接数据库时常见的错误及解决方案:用户名或密码错误(Error 1045)防火墙阻止连接(Error 2003)连接超时(Error 10060)无法使用套接字连接(Error 1042)SSL 连接错误(Error 100…

    2025年2月23日
    100
  • Navicat 连接超时:如何解决

    Navicat连接超时原因:网络不稳定、数据库繁忙、防火墙阻拦、服务器配置问题、Navicat设置不当。解决步骤:检查网络连接、数据库状况、防火墙设置,调整服务器配置,检查Navicat设置,重启软件和服务器,联系管理员寻求帮助。 如何解决…

    2025年2月23日
    100
  • 异象回声盾卫怎么玩 盾卫减益/增益流玩法解析

    异象回声中,盾卫职业至关重要,但其玩法并非易事。本文将深入解析异象回声盾卫的减益/增益流派,助您玩转盾卫。 异象回声盾卫流派详解 盾卫拥有奥斯曼和塔拉斯克两大六星角色,分别代表减益和增益两种流派。 一、共通之处 无论减益或增益流派,盾卫都具…

    2025年2月23日
    100

发表回复

登录后才能评论