细说利用Splunk监控Kubernetes运行性能

PHP中文网 • 2025年2月25日 20:25:53 • 互联网 • 阅读 3

部署架构

下图是该方案的部署架构，主要包括：

利用Heapster收集K8s的性能数据，包含CPU，Memory，Network，File System等

利用Heapster的Statsd Sink，发送数据到Splunk的Metrics Store

利用Splunk的搜索命令和仪表盘功能对性能数据进行监控

前期准备

前期主要要准备好两件事：

编译最新的Heapster的镜像，并上传到某个公共的Docker镜像仓库，例如docker hub

在Splunk中配置Metrics Store和对应的网络输入（Network Input UDP／TCP）

这里主要要做的选择是Statsd的传输协议用UDP还是TCP。这里我推荐使用TCP。最新的Heapster代码支持不同的Backend，包含了log, influxdb, stackdriver, gcp monitoring, gcp logging, statsd, hawkular-metrics, wavefront, openTSDB, kafka, riemann, elasticsearch等等。因为Splunk的Metrics Store支持statsd协议，所以可以很容易的和Heapster集成。

首先我们需要利用最新的heapster代码，编译一个容器镜像，因为docker hub上的heapsterd的官方镜像的版本比较旧，并不支持statsd。所以需要自己编译。

mkdir myheapstermkdir myheapster/srcexport GOPATH=myheapstercd myheapster/srcgit clone https://github.com/kubernetes/heapster.gitcd heapstermake container

登录后复制

运行以上的命令来编译最新的heapster镜像。

注意，heapster缺省使用udp协议，如果想要使用tcp，需要修改代码

https://github.com/kubernetes/heapster/blob/master/metrics/sinks/statsd/statsd_client.go

func (client *statsdClientImpl) open() error {var err errorclient.conn, err = net.Dial("udp", client.host)if err != nil {glog.Errorf("Failed to open statsd client connection : %v", err)} else {glog.V(2).Infof("statsd client connection opened : %+v", client.conn)}return err}

登录后复制

把udp改成tcp。

我在docker hub上放了两个镜像，分别对应udp版本的tcp版本，大家可以直接使用

naughtytao/heapster-amd64:v1.5.0-beta.3 udp

naughtytao/heapster-amd64:v1.5.0-beta.4 tcp

然后需要在Splunk中配置Metrics Store，参考这个文档

安装配置Heapster

在K8s上部署heapster比较容易，创建对应的yaml配置文件，然后用kubectl命令行创建就好了。

以下是Deployment和Service的配置文件：

deployment.yaml

apiVersion: extensions/v1beta1kind: Deploymentmetadata:  name: heapster  namespace: kube-systemspec:  replicas: 1  template:    metadata:      labels:        task: monitoring        k8s-app: heapster        version: v6    spec:      containers:      - name: heapster        image: naughtytao/heapster-amd64:v1.5.0-beta.3        imagePullPolicy: Always        command:        - /heapster        - --source=kubernetes:https://kubernetes.default        - --sink=statsd:udp://ip:port?numMetricsPerMsg=1

登录后复制

service.yaml

apiVersion: v1kind: Servicemetadata:  labels:    task: monitoring    # For use as a Cluster add-on (https://github.com/kubernetes/kubernetes/tree/master/cluster/addons)    # If you are NOT using this as an addon, you should comment out this line.    kubernetes.io/cluster-service: 'true'    kubernetes.io/name: Heapster  name: heapster  namespace: kube-systemspec:  ports:  - port: 80    targetPort: 8082  selector:    k8s-app: heapster

登录后复制

注意这里deployment的–sink的配置，ip是Splunk的IP或者主机名，port的对应的Splunk的data input的端口号。当使用udp协议的时候，需要配置的numMetricsPerMsg的值比较小，当这个值比较大的时候，会出message too long的error。当使用tcp的时候可以配置较大的数值。

运行 kubectl apply -f *.yaml 来部署heapster

如果正常运行，对应的heapster pod的日志如下

I0117 18:10:56.054746       1 heapster.go:78] /heapster --source=kubernetes:https://kubernetes.default --sink=statsd:udp://ec2-34-203-25-154.compute-1.amazonaws.com:8124?numMetricsPerMsg=10I0117 18:10:56.054776       1 heapster.go:79] Heapster version v1.5.0-beta.4I0117 18:10:56.054963       1 configs.go:61] Using Kubernetes client with master "https://kubernetes.default" and version v1I0117 18:10:56.054978       1 configs.go:62] Using kubelet port 10255I0117 18:10:56.076200       1 driver.go:104] statsd metrics sink using configuration : {host:ec2-34-203-25-154.compute-1.amazonaws.com:8124 prefix: numMetricsPerMsg:10 protocolType:etsystatsd renameLabels:map[] allowedLabels:map[] customizeLabel:0x15fc8c0}I0117 18:10:56.076248       1 driver.go:104] statsd metrics sink using configuration : {host:ec2-34-203-25-154.compute-1.amazonaws.com:8124 prefix: numMetricsPerMsg:10 protocolType:etsystatsd renameLabels:map[] allowedLabels:map[] customizeLabel:0x15fc8c0}I0117 18:10:56.076272       1 heapster.go:202] Starting with StatsD SinkI0117 18:10:56.076281       1 heapster.go:202] Starting with Metric SinkI0117 18:10:56.090229       1 heapster.go:112] Starting heapster on port 8082

登录后复制在Splunk中进行监控

好了如果一切正常的化，heapster会用statsd的协议和格式发送metrics到Splunk的metrics store。

然后就可以用利用SPL的mstats和mcatalog命令来分析，监控metrics数据了。

以下搜索语句列出所有的Metrics

| mcatalog values(metric_name)

登录后复制

以下搜索语句列出整个cluster的CPU使用，我们可以用Area或者Line Chart来可视化搜索结果。

| mstats avg(_value) WHERE metric_name=cluster.cpu/usage_rate span=30m

登录后复制

kube-system namespace的对应内存使用情况

| mstats avg(_value) WHERE metric_name=namespace.kube-system.memory/usage span=30m

登录后复制

大家可以把自己感兴趣的分析结果放在Dashboard中，利用Realtime设置进行监控。

好了，更多的分析选项可以参考Splunk文档。

以上就是细说利用Splunk监控Kubernetes运行性能的详细内容，更多请关注【创想鸟】其它相关文章！

发布者：PHP中文网，转转请注明出处：https://www.chuangxiangniao.com/p/2195100.html

0 0

关于作者

PHP中文网签约作者

560.2K 文章

0 评论

1 粉丝

php中文网提供大量免费、原创、高清的php视频教程，并定期举行公益php培训！可边学习边在线修改示例代码，查看执行效果！php从入门到精通，一站式php自学平台！

SYN如何利用TCP协议发动攻击？

上一篇 2025年2月25日 20:25:47

修改密码的安全方法：避免交互的多种实现方式

下一篇 2025年2月25日 20:26:05

AI智能

Kimi-VL— 月之暗面开源的轻量级多模态视觉语言模型

Kimi-VL是什么 kimi-vl 是月之暗面开源的轻量级多模态视觉语言模型，基于轻量级moe模型moonlight（16b总参数，2.8b激活参数）和原生分辨率的moonvit视觉编码器（400m参数）。kimi-vl支持单图、多图、视…

PHP中文网
2025年4月27日
0000
AI智能

FantasyTalking— 阿里联合北邮推出静态肖像生成可控数字人的框架

FantasyTalking是什么 fantasytalking 是阿里巴巴 amap 团队和北京邮电大学联合提出的新型框架，用于从单张静态肖像生成逼真的可动画化虚拟形象。基于预训练的视频扩散变换器模型，采用双阶段视听对齐策略，第一阶段通过…

PHP中文网
2025年4月27日
0000
AI智能

ScholarCopilot— 滑铁卢与卡内基梅隆大学联合推出的AI学术写作助手

ScholarCopilot是什么 scholarcopilot 是加拿大滑铁卢大学与卡内基梅隆大学的研究团队开发的专为学术写作设计的人工智能工具，基于 qwen-2.5-7b 模型，通过动态检索引用和联合优化生成与引用的方式，能精准地生成…

PHP中文网
2025年4月27日
0000
AI智能

FlexIP— 腾讯推出的个性化图像生成编辑框架

FlexIP是什么 flexip 是腾讯提出的面向图像合成的灵活主体属性编辑框架，平衡图像生成中的身份保持和个性化编辑。框架采用双适配器架构，将身份保持与个性化编辑解耦，通过高层语义概念与低层空间细节确保身份完整性。动态权重门控机制支持用户…

PHP中文网
2025年4月27日
0000
AI智能

AgentPrune— 同济联合港中文等机构推出的多智能体通信优化框架

AgentPrune是什么 agentprune 是同济大学、香港中文大学等机构联合提出的针对大型语言模型（llm）驱动的多智能体系统通信优化框架，通过“剪枝”技术，剔除冗余或有害的通信内容，降低通信成本提升系统性能。agentprune …

PHP中文网
2025年4月27日
0000
AI智能

如何在项目中使用DeepSeek开源推理引擎？

使用 DeepSeek 开源推理引擎的步骤包括：1. 安装依赖，如 CUDA 和 Python 库；2. 从官方渠道下载引擎并安装配置；3. 获取或转换模型文件；4. 导入模块、配置引擎、加载模型并执行推理；5. 进行性能优化和错误调试，以…

PHP中文网
2025年4月27日
0000
AI智能

Seed-Thinking-v1.5— 字节跳动推出的最新思考模型

Seed-Thinking-v1.5是什么 seed-thinking-v1.5 是字节跳动推出的推理智能模型，采用混合专家（moe）架构，总参数量为 200b，每次激活 20b 参数。模型在多个基准测试中表现出色，如在 aime 2024…

PHP中文网
2025年4月27日
0000
AI智能

UNO— 字节跳动推出的创新AI图像生成框架

UNO是什么 uno是字节跳动推出创新的ai图像生成框架，突破传统模型在多主体生成中的局限。通过“少到多”的泛化方法，能高质量地生成单主体和多主体图像，解决了多主体场景下的一致性难题。uno基于扩散变换器生成高一致性的多主体数据，采用渐进式…

PHP中文网
2025年4月27日
0000
AI智能

HoloPart— 港大联合 VAST 开源生成完整可编辑部件的 3D 模型

HoloPart是什么 holopart 是香港大学、vast 团队推出的新型扩散模型，支持将 3d 物体分解为完整、可编辑的语义部件，即使部件被遮挡。holopar基于两阶段方法，用局部注意力和全局上下文注意力机制，确保零件的细节和整体形…

PHP中文网
2025年4月27日
0000
AI智能

Skywork-OR1— 昆仑万维开源的高性能系列推理模型

Skywork-OR1是什么 skywork-or1(open reasoner 1)是昆仑万维推出的开源高性能推理模型系列，模型突破大模型在逻辑推理和复杂任务求解方面的能力瓶颈。skywork-or1包含三款模型，skywork-or1-…

PHP中文网
2025年4月27日
0000