大数据时代下,金山云CDN智能运维实践

近年来,短视频与直播业务的爆发,也让CDN行业迎来了新的发展机遇和挑战。这些挑战主要体现在运维上,可分为两方面:一是出现故障时的响应速度,这需要CDN服务商能够以最快的速度发现和处理故障。二是质量的提升,视频类客户的卡顿率往往是评判各家CDN厂商服务质量的首要标准,这要求服务方必须具备过硬的调优能力,因此,快速分析感知细微的质量变化、定位质量变化的原因就至关重要。

目前,金山视频云CDN的服务端天级日志量已近千亿条,数据量近百T级别,这些数据是解决运维效率、提升服务质量的关键。近日,在GOPS 2017全球运维大会上海站上,金山云大数据技术总监徐寅斐就如何利用数据进行CDN的智能运维这个话题,分享了金山云的做法和思考。

金山云大数据技术总监徐寅斐发表演讲

利用数据构建运维和服务质量支撑体系

工欲善其事,必先利其器。数据是解决运维效率、运维自动化甚至智能化的核心,而要想充分利用已有的数据资产,数据平台的支撑就显得至关重要。为了满足目前和未来的需求,首先需要对现有的数据和使用方式进行分类:

现有数据可以分为四类。包括基础监控数据、探测数据、服务端日志、客户端日志,这四类数据在接入难度、数据量级上各不相同,数据平台需要统筹考虑所有数据的接入、传输、计算和存储。

CDN数据分类及特点

运维对数据的使用,可以分为四个阶段:数据支撑、分析支撑、决策支撑和预测支撑,每个阶段对数据平台有着不同的需求:数据支撑要求平台能够满足对上述四类数据的计算和存储需求,确保运维人员能够及时获取准确的数据指标。分析支撑要求平台能够及时响应各类即席查询的需求,包括对原始日志的全链路分析,对于业务指标的多维分析等。决策支撑和预测支撑则要求平台具备数据的强大后处理能力,包括对已存储数据的建模、挖掘能力。

数据运维四个阶段

金山视频云大数据平台架构建设实践

先说大数据平台。基于以上数据需求,金山视频云大数据平台在实践中,通过不断演进,最终形成了目前以Hadoop和Spark生态产品为基础的架构。平台的数据传输采用的是Kafka,作为现今最主流的传输中间件,它出色的吞吐能力为第一层数据缓冲提供了保障。数据计算全部采用Spark,技术栈的精简能够保证开发效率和平台稳定性,而且Spark可提供足够丰富的数据挖掘和机器学习库保证数据的后处理。

在数据的前处理上,金山云采用的是实时流+离线流修补的经典架构,实时流在一定精度的前提下,保证了数据的及时性,离线流保证了数据的最终完整性。此外,平台还引入了边缘计算,作用是在充分利用CDN节点分布式天然优势的同时,可大大降低中心数据平台的压力,提升了平台的整体稳定性。

金山视频云大数据平台架构

对于一个数据平台来说,最复杂的是数据存储,不同的数据查询和获取需求决定了最终的存储选型:对于查询灵活性要求极大,数据量适中的数据,金山云使用ElasticSearch + Kibana提供灵活的数据存储与查询服务。对于查询模式相对固定、数据写入量巨大的数据,Druid是一个不错的选择。

CDN的全量原始日志,则会经过ETL后以列存储的方式存储在HDFS上,可以通过SQL、代码片段等多种方式对数据进行查询分析。此外,整个数据平台使用金山云自研的大数据产品KMR,它对金山云其他IaaS服务的天然支持提供了很多便利,如分布式对象存储KS3,可以作为平台存储空间的扩充,重要的数据以及长期不用的冷数据,都会定期自动备份到KS3中持久存储。

金山视频云大数据平台采用多种技术

大数据平台的运维实践

基于这个大数据平台,金山云开发了多套系统提升运维效率。第一个是报警系统,大数据平台承载了CDN所有业务报警数据的清洗、计算和决策生成,Spark对流式计算的支持保证了数据产生到报警整个过程能够在1分钟内完成,保证及时发现问题,系统本身良好的水平扩展能力,也能够满足视频云运维不断变化的业务需求。

CDN业务报警的特点是种类多、维度多、报警阈值因地区运营商而异。报警规则和报警阈值的管理工作很复杂,为此,金山云的报警平台中有一套专门用于阈值评估的离线分析系统,针对所有指标的历史数据、人为配置以及运维对报警的反馈信息,综合评估出不同区域运营商的合理阈值,极大地降低了报警管理的难度。

第二个系统是CDN服务质量的“观象台”——鹰眼平台,它提供了50+业务指标、5+维度的服务质量数据的查询能力,可满足日常运维和调优工作中80%以上的数据获取需求,并可场景化呈现故障处理、网络链路质量、大客户服务质量维护等多种常见运维工作。

鹰眼的数据需求繁杂,既提供全局服务质量信息,也需要满足不同域名、区域运营商、链路以及缓存状态的细粒度查询,甚至需要对这些维度进行任意组合。为了满足这样的查询需求,鹰眼的服务质量数据使用ElasticSearch作为底层存储,在中等规模数据的写入和聚合查询方面的速度都很理想,文档化的存储方式也能满足数据快速迭代更新的需求。同时,鹰眼数据的部分聚合被下放到节点上进行,这样可以降低平台的计算负载。

基于大数据平台和产生的数据,金山云CDN已能在包括调度、故障处理、质量调优在内的很多场景中实现自动化。除了大数据,接下来金山云还会在机器学习和人工智能领域进行运维智能化的探索。

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:SEO优化专员,转转请注明出处:https://www.chuangxiangniao.com/p/907650.html

(0)
上一篇 2025年1月4日 11:35:23
下一篇 2025年1月4日 11:35:55

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 星域CDN携手爱奇艺推动视频点播迈向新时代

    近日,迅雷与爱奇艺正式达成全面合作,爱奇艺视频点播业务正式接入星域CDN,双方将携手完善爱奇艺业已构建的庞大视频分发网络,推动互联网视频点播市场进入低成本、高体验的新时代。 星域强化竞争力 点播业务全面提速 截止至今年3月,爱奇艺移动端累积…

    CDN 2025年1月4日
    100
  • 星域CDN独家弱网加速技术:打造流媒体零卡顿世界

    很多出席过迅雷星域CDN发布会的媒体和企业都对这一幕印象深刻:发布会上,迅雷CTO陈磊现场演示星域CDN的弱网加速效果,同样的弱网环境下播放同一个视频,搭载了星域CDN的小米手机几乎无延迟无卡顿,而没搭载星域CDN的其他同级配置手机则反复缓…

    CDN 2025年1月4日
    100
  • 阻隔DDoS黑手 星域CDN打造安全下载的移动互联网环境

    提到DDoS,互联网企业无一不对之又恨又怕。依据今年DDoS防护服务市场领导者Black Lotus发布的最新报告,这只隐藏于互联网深处的黑手让全球61%的各类型服务提供商深受其攻击之苦,直接造成利润流失或隐私被窃。 移动互联网时代,DDo…

    CDN 2025年1月4日
    100
  • 开放四大核心技术 星域成就改变CDN行业之力

    眼下,随着云计算、大数据等新兴技术的飞速发展和互联网+时代的到来,互联网企业正在以新的技术开放方式服务于新时期的各行各业。其中,作为国内最早布局云计算的互联网公司,迅雷通过将核心技术打包做成专有服务,正式面向全社会开放。 在集中自家多年技术…

    CDN 2025年1月4日
    100
  • 70周年阅兵考验平台直播能力 星域CDN助力多平台内容分发

    9月3日的抗战胜利阅兵,不仅仅是一场对军队的检阅,也是中国视频行业自身直播实力的一次比拼。 此次阅兵意义重大,关注度极高,各大视频网站上的观看人数都爆表,如腾讯视频就有超过1500万人同时在线观看,此外,优酷土豆、爱奇艺、CNTV、小米视频…

    CDN 2025年1月4日
    100
  • 帝联CDN护航9.3大阅兵彰显辉煌

    2015年9月3日上午10点,为纪念中国人民抗日战争暨世界反*战争胜利70周年阅兵式在北京天安门广场隆重举行。 据悉,本次阅兵是新中国历史上第15次大阅兵,它彰显出中国坚定不移走和平发展道路,展现我军军姿军威,贯彻强军目标、推进现代化建设发…

    CDN 2025年1月4日
    100
  • 星域CDN众筹模式受认可 千余家企业提出接入申请

    来自迅雷星域CDN市场部的统计数据显示,从6月底正式推出至今,星域CDN官网在开启对外预约销售后短短两个月内,已收到来自千余家企业的接入申请。 由于星域CDN采用的是限量+100%满意销售服务模式,迅雷表示,星域CDN官方将分批次公布接入客…

    CDN 2025年1月4日
    100
  • 帝联观察:XcodeGhost爆发,CDN能为信息安全做什么?

    北京时间9月21日,XcodeGhost病毒的爆发导致许多iOS应用被感染病毒。事件起因在于黑客诱使开发者使用假冒的、经过修改的苹果应用开发程序Xcode开发软件,从而成功将恶意代码植入应用。中毒的应用会秘密上传软件包名、系统版本、语言等信…

    CDN 2025年1月4日
    100
  • 帝联观察:中秋国庆全民出行 CDN祝你一“路”畅通

    近年来,随着人们生活水平的提高,旅游业成为拉动经济增长的新金矿。调查显示,中秋国庆双节来临之际,旅游景点、交通地图和旅游攻略成为搜索重点,数据流量再次攀升至高点。此番现象不难看出,旅游产业需求量的大幅增长也拉动了互联网行业的整体热度。 针对…

    CDN 2025年1月4日
    100
  • 盘点国内外十大免费CDN网站加速服务

    CDN的全称是Content Delivery Network,即内容分发网络。将网站数据抓取至全国各地所布置的数据缓存节点上,客户访问时只需去当地缓存点读取相关数据,如此一来不但加快数据下载速度,也兼顾各通信运营商之间的瓶颈影响,实现了跨…

    CDN 2025年1月4日
    100

发表回复

登录后才能评论

联系我们

156-6553-5169

在线咨询: QQ交谈

邮件:253000106@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

联系微信