云端部署大模型的三个秘密

云端部署大模型的三个秘密

编译 | 星璇

出品 | 51CTO技术栈(微信号:blog51cto)

在过去的两年里,我更多地参与了使用大型语言模型(LLMs)的生成AI项目,而非传统的系统。我开始怀念无服务器云计算。它们的应用范围广泛,从增强对话AI到为各行各业提供复杂的分析解决方案,以及其他许多功能。许多企业将这些模型部署在云平台上,因为公共云提供商已经提供了现成的生态系统,而且这是阻力最小的路径。然而,这并不便宜。

云还提供了其他好处,如可扩展性、效率和高级计算能力(按需提供GPU)。在公共云平台上部署LLM的过程有一些鲜为人知的秘密,它们可能会对成功或失败产生重大影响。也许是因为处理LLMs的AI专家并不多,也因为我们在这方面还没太多经验,我们的知识体系中存在很多空白。

让我们探讨三个在云上部署LLM时鲜为人知的“技巧”,也许你的AI工程师们也不知道。考虑到这些工程师的年薪往往超过30万美元,也许现在是时候考虑他们做这些事情的细节了。我看到每个人都像头发发着火一样奔向生成为AI,但犯的错误比以往任何时候都多。

1.管理成本效益和可扩展性

云平台部署LLMs的主要吸引力之一是能够够按需扩展资源。我们不需要成为优秀的容量规划师,因为云平台拥有我们只需要点击鼠标或自动分配的资源。

然而,等待,我们即将犯下当初使用云计算时犯下的同样错误。在扩展的同时管理成本是一项技能,许多人需要在这方面获得帮助以进行有效导航。请注意,云服务通常根据消耗的计算资源收费;他们就像公共事业一样运作。处理得越多,付费就越多。考虑到GPU的成本更高(且耗电量更大),这是使用公共云提供商提供的LLMs时的核心关注点。

请确保您使用成本管理工具,包括云平台提供的工具和可靠的第三方成本治理和监控服务商(finops)提供的工具。例如,实施自动扩展和调度、选择合适的实例类型或使用抢占式实例来优化成本。此外,请记得持续监控部署情况,根据使用情况而不是仅根据预测负载调整资源。这意味着不惜一切代价避免过度配置(明白我这里的双关了吗?)。

2.多租户环境中的数据隐私

部署LLMs通常涉及处理大量数据和训练经过的知识模型,这些可能包含敏感或专有数据。使用公共云的风险在于,你的“邻居”是以处理实例的形式存在,它们在同一物理硬件上运行。因此,公共云确实存储在这样的风险:在数据存储和处理过程中,数据可能会被公共云数据中心中同一物理硬件上运行的其他虚拟机访问。为了解决这个问题,许多公共云提供商提供了面向企业的云安全选项。这些选项提供了物理硬件上运行的其他虚拟机访问你的数据的隔离和保护。另一个安全问题是数据在存储和处理过程中的传输。数据可能会通过公共云网络传输,这意味着在传输过程中可能会被截取或窃听。为了解决这个问题,公共云通常提供了加密和安全传输协议来保护数据在传输过程中的安全性。总的来说,部署LLMs

如果你询问公共云提供商有关此问题,他们会急忙拿出最新的PowerPoint演示文稿,展示这是不可能的。虽然这主要是真的,但并不完全准确。所有多租户系统都存在这种风险;你需要加以缓解。我发现,云提供商的规模越小,比如那些仅在单一国家运营的云提供商,这种问题出现的可能性就越大。这适用于数据存储和LLMs。

秘诀在于选择符合严格安全标准并能提供证明的云提供商:静止和传输中的数据加密、身份和访问管理(IAM)以及隔离策略。当然,更好的做法是你实施自己的安全策略和安全技术栈,以确保在云上使用多租户LLMs的风险较低。

3.处理有状态模型部署

大型语言模型(LLMs)大多数都是有状态的,这意味着它们会在一次交互到下一次交互之间保留信息。这个旧方法提供了新的好处:即在持续学习场景中提高效率的能力。然而,在云环境中管理这些模型的有状态性是有挑战性的,因为云环境中的实例可能是按设计短暂或无状态的。

支持有状态部署的编排工具(如 Kubernetes)是有帮助的。它们可以为大型语言模型利用持久性存储选项,并配置为跨会话维护和操作其状态。为了支持大型语言模型的连续性和性能,您需要这样做。

随着生成式人工智能的爆炸式增长,在云平台上部署大型语言模型已成定局。对于大多数企业来说,不使用云实在是太不方便了。我对接下来这股狂热的担忧是,我们会错过一些容易解决的问题,并会犯下巨大而昂贵的错误,而这些错误在最终大多是可以避免的。

想了解更多AIGC的内容,请访问:

51CTO AI.x社区

https://www.51cto.com/aigc/

以上就是云端部署大模型的三个秘密的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/1414109.html

(0)
上一篇 2025年2月17日 20:00:13
下一篇 2025年2月17日 20:00:19

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • PHP与FTP:安全传输文件的方法与技巧

    php与ftp:安全传输文件的方法与技巧 引言:在现代互联网时代,文件传输的需求越来越多。而FTP(File Transfer Protocol)作为一种常见而古老的文件传输协议,仍然被广泛使用。然而,由于FTP的特点,如明文传输、弱身份验…

    编程技术 2025年2月22日
    100
  • 实现更智能的AI:将推理和行为融合于语言模型中的ReAct技术

    今天我们要介绍一篇论文《react: 在语言模型中结合推理和行为》,这篇论文是由谷歌研究院和普林斯顿大学的研究人员合作完成的。他们在探索语言模型中结合推理和行为的潜力时,发布了这篇论文。虽然大型语言模型(llm)的推理能力和行动能力已经分别…

    2025年2月22日
    100
  • 什么是RGB协议?RGB协议的用例和意义,RGB生态项目

    作者:ash,bitcoin square;sawyer,echo,bihelix 引言 十多年来,比特币一直处于加密货币革命的最前沿,开创了去中心化数字货币和区块链技术的概念。尽管比特币具备突破性的创新,其核心功能主要集中在作为交换媒介和…

    2025年2月22日
    100
  • url由哪些部分组成

    url,也就是统一资源定位符,看似简单,其实包含着不少信息,能精确地告诉浏览器要去哪里找东西。 它就像一封寄往互联网的信,地址写得越详细,信才能越快、越准确地送到目的地。 我曾经因为一个错字,导致一个重要的项目文件无法访问,整整花了一个小时…

    2025年2月22日
    100
  • 区块链必备哪些技术

    区块链技术的六大关键要素包括:分布式账本、共识机制、密码学、智能合约、网络层和用户界面,它们共同确保数据不可篡改、透明度高和安全性强。 区块链技术的关键组成要素 区块链是一种分布式账本技术,具有数据不可篡改、透明度高、安全性强等特点,其核心…

    2025年2月22日
    100
  • Vitalik预言的技术新风暴:FHE崛起重塑加密世界

    引言 全同态加密的优势:相较于传统加密算法,其独特的特性在于第三方能够在不解密的情况下,对加密数据进行任意次数的计算和操作,为隐私计算提供全新的可能性。 FHE的定义 全同态加密(Homomorphic Encryption,简称 FHE)…

    2025年2月22日
    100
  • 如何利用ChatGPT PHP开发基于语言模型的聊天应用

    如何利用ChatGPT PHP开发基于语言模型的聊天应用 一、介绍ChatGPTChatGPT是由OpenAI开发的一款基于语言模型的聊天系统,可以生成自然流畅的文本回复。我们可以利用ChatGPT PHP开发一个基于语言模型的聊天应用,实…

    2025年2月21日
    100
  • 数据安全的措施有哪些

    数据安全措施涵盖诸多方面,并非单一方法所能解决。有效的安全策略需要多层次、多角度的防护。 确保数据安全,最基础的是建立强密码策略。这不仅仅是设置一个复杂的密码那么简单。我曾经见过不少人使用生日、宠物名字等容易猜测的密码,结果数据泄露后追悔莫…

    2025年2月21日
    100
  • PHP 401 响应:解析 Unauthorized 错误并增强安全性

    在 web 开发中,401 未经授权错误表示客户端未被授权访问特定资源。php 提供了多种处理方法:1. 使用 401 http 状态代码;2. 输出 json 响应;3. 重定向到登录页面。为了增强安全性,可以采取如下措施:1. 使用 h…

    2025年2月20日
    100
  • 大模型知识Out该怎么办?浙大团队探索大模型参数更新的方法—模型编辑

    夕小瑶科技说 原创 作者 | 小戏、python 大模型在其巨大体量背后蕴藏着一个直观的问题:“大模型应该怎么更新?” 在大模型极其巨大的计算开销下,大模型知识的更新并不是一件简单的“学习任务”,理想情况下,随着世界各种形势的纷繁复杂的变换…

    2025年2月20日 AI智能
    100

发表回复

登录后才能评论