字节跳动副总裁杨震原分享抖音的机器学习实践
基于字节系的算力资源和生态能力,火山引擎所提供的大模型基础设施,在运算效率和性价比方面更有优势。
以火山引擎的合作客户MiniMax为例,这是一家已经推出自研大模型产品的独角兽公司,其与火山引擎合作建立的超大规模推理平台,拥有万卡级算力池,支撑单日过亿次调用。
再比如抖音的推荐系统,在火山引擎的算力支持下,工程师用15个月的样本训练某个模型,5小时就能完成训练,成本只有5000元。
“火爆全网的抖音’AI绘画’特效,从启动到上线只用一周多,模型由一名算法工程师完成训练。”杨震原介绍说。
杨震原还认为,业务创新需要试错,试错要大胆、敏捷,但试错也一定要控制成本。
效率更优、算力资源丰富、成本可控的大模型训练与迭代方式,往往是初创型科技公司最为看重的模式,也是火山引擎努力实现的目标。
谭待指出,火山引擎要服务好那些立志做好大模型的公司,为其提供基础算力支持和技术平台。“如何在工程上帮它们优化,提高效率,稳定性,都是我们关注的重点。”
当然,不同企业在不同应用场景下,对云服务和大模型的需求千差万别,火山引擎又如何做好个性化的企业级解决方案?
数据驱动,升级企业解决方案
从2020年成立至今,火山引擎基于内部业务的技术生态,已经向外开放机器翻译、视觉智能等能力,业务覆盖金融、汽车、消费、文娱等行业场景。
不过,事情正在起变化,“多云多模型”时代对云厂商提出更复杂的挑战。
一方面,企业加速搭建“多云架构”,以实现算力的快速增长;另一方面,多模型意味着多场景应用,企业在不同的业务场景中需要差异化的AI应用。
早在2022年,火山引擎就提出“体验创新、数据驱动、敏捷迭代”的云上增长三要素,基于企业不同的应用场景,利用数据驱动搭建云增长模型。
谭待认为,“过去很多企业花费了大量时间构建数据中台,但最后失败了,找不到数据应用的场景,价值也没有发挥出来。其本质在于,企业没有将数据驱动整个体系设计好。”
火山引擎总裁谭待宣布支持“多云多模型”的未来架构
火山引擎非常看重数据驱动为企业降本增效、技术升级所带来的作用,内部对数据使用的价值也有一个明确标准——“0987”,即零事故、满足90%的需求、80%的需求能够通过技术优化实现秒级调用、通过业务部门评价达到70分以上。
坚持以数据驱动为增长核心,火山引擎能在内容、营销等领域提供更多个性化的企业级应用,比如在内容领域通过算法和AI平台帮助创作更优质内容、在内部运营方面通过数据平台优化供应链和库存管理等。
如今,火山引擎的解决方案已经在各行各业落地,进一步带动产业的数字化升级。
2022年卡塔尔世界杯期间,火山引擎就用AI的方式做出窄带高清,一方面提升视频帧率,另外还能降低带宽。
同时,针对网络观众收看比赛最头疼的直播延时问题,火山引擎通过RTM超低时延直播技术,将直播画面的端到端延迟最低降到1s,电视观众和网络观众几乎都能“同频”观看赛事直播。
此外,在公益领域,火山引擎与字节跳动公益将联合推出公益版的电子票据服务与公有云服务,为符合条件的公益组织提供为期3年的免费服务。
据地歌网了解,字节跳动公益电子票据服务已于今年2月上线,目前中华社会救助基金会、中国听力医学发展基金会已申请使用该服务。
中华社会救助基金会相关负责人表示,该基金会2022年开票量超过1万张,电子开票可以节约0.5个财务人力成本。
从直播体验升级到公益票据服务,火山引擎通过数据驱动,努力在不同行业的不同业务场景中落地数字化应用。
火山引擎所处的云计算领域是大市场,专业机构估算,国内云计算市场规模预计在今年突破3000亿元。
但,“多云多模型”时代逐步变为现实,企业对云服务的差异化能力提出更高要求,并且需要将云计算与大模型赋能到实际业务中,带来整体业务升级。
行业正在起变化,云计算企业“不得不变”。
在海外,亚马逊AWS于日前为企业客户推出生成式 AI(AIGC)工具“全家桶”,包括用于生成文本、分类、开放式问答和信息提取等任务的生成式大语言模型等。
在国内,云计算领域竞争激烈,阿里云、华为云等均在行业内深耕多年,火山引擎作为“后发之人”,依托于字节生态“溢出”的2B能力,持续升级企业数字化解决方案。
当然,为适应“多云多模型”时代,为大模型客户提供AI基础设施,火山引擎有着“任重道远”的目标。好在,基于多年的资源储备和场景实践,火山引擎已经摸索出了一条自己的云增长道路。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。
发布者:SEO优化专员,转转请注明出处:https://www.chuangxiangniao.com/p/961801.html