可观测性

AI SRE

告别盲目猜测,与代理式队友一起解决问题,以便更快排查问题。

免费版 免费获取最多 15 台主机的可观测性云。

如何工作

贯穿整个事件生命周期的嵌入式 AI 和代理式支持

代理式队友助您排查和解决问题

为您的系统增设监管机制,确保一切按计划运行。如果出现问题,AI SRE 会自动查找潜在的根本原因、制定计划,并提供分步指导,确保一切恢复正常运行。

随时随地满足您的需求

无论您是可观测性领域的新晋用户还是资深人士,我们内置的代理式 AI 功能都能助您缩短平均修复时间 (MTTR),并从初始阶段获取切实可行的洞察。

腾出时间做最重要的事

AI SRE 可助您减少解决问题的时间,并投入更多时间处理重要事务,从而专注制定后续计划。

适应业务拓展速度的代理式可观测性

浏览文档

AI驱动的检测

自动检测问题

预测系统故障、瓶颈和性能下降,并配置检测器以防发生影响客户的事件。

pd-o-ai-sre-features-automatically-detect

AI 故障排除代理

让我们的代理为您排除故障

AI 故障排除代理可自动筛选所有指标、日志和跟踪数据,识别应用程序或基础设施是否存在问题,并揭示潜在的根本原因——所有输出内容均以通俗易懂的语言显示,且可导入您的现有工作流。

pd-o-ai-sre-features-trouble-shooting-agent

修复计划

更快解决问题

无需在多个界面、选项卡和工具间切换上下文,也不必手动查看大量文档,即可随时随地按需获取潜在原因排名清单、清晰的影响分析和切实可行的建议。

pd-o-sre-agentic-teammate-ani

可观测性云中的 AI 助手

使用通俗易懂的语言获取洞察和答案

轻松从可观测性云中提取见解并使用自然语言加速调查。如果您需要更多帮助,直接向 AI 助手提问即可。

Splunk MCP 服务器与代理式 AI

在统一的 MCP 服务器中使用 Splunk 功能

利用安全接口,将本地 AI 代理、LLM、工具和数据与可观测性云数据相关联,构建自定义 AI 工作流并在生产环境中调试性能问题,而无需离开您的环境。

pd-o-ai-sre-features-mcp-agentic-ai

我们与出色的客户合作。

了解全球领先企业信赖 Splunk 的原因。

Repay customer story Repay customer story

客户案例

Repay 利用可观测性云中的 AI 助手,践行“回馈用户”的理念

面对种类繁多的系统和端点,想要洞悉全貌是一项不可能的任务。因此,这不仅关乎效率,更关乎识别未知异常情况,以及像主题专家一样从数据中获取洞察力

范沃尔夫, Repay 平台工程副总裁
50%
更快分类
30%
将事务延迟减少 30%
资源
了解来自 Splunk 的更多产品

揭穿 AI 和代理式 AI 的 5 大误区

区分 AI 领域的事实与虚幻。了解代理式 AI 如何重塑可观测性和安全体系,同时帮助团队实现智能、高效协作。

阅读电子书

AI SRE 常见问题

AI SRE 将 Splunk 可观测性云中的代理式 AI 和嵌入式 AI 相结合,提供涵盖整个事件响应生命周期(包括检测、故障排除和修复)的代理式 AI 体验。这是一种 AI 原生用户体验,包括可观测性云和 Splunk MCP 服务器中的 AI 助手,它能提供契合当下情境的洞察,确保团队能够专注处理重要事务并制定后续计划,而无需手动排除故障。

对于工程团队来说,排除故障一直是一场捉迷藏游戏,尤其是涉及在 Kubernetes 等复杂环境中运行的现代应用程序时。以往,DevOps 和站点可靠性工程师 (SRE) 必须在多个界面和工具中搜索仪表板、日志和指标,以精准定位故障或性能问题的原因。这正是 AI SRE 的“用武之地”。

  

AI SRE 就像一位站点可靠性工程 (SRE) 团队成员,通过自动筛选所有指标、日志和跟踪数据,识别应用程序或基础设施是否存在问题,并揭示潜在的根本原因——所有输出内容均以通俗易懂的语言显示,且可导入现有工作流。团队无需在多个界面、选项卡和工具间切换上下文,也不必手动查看大量文档,即可随时随地按需获取潜在原因排名清单、清晰的影响分析和切实可行的建议。

  

工程团队的真正价值在于,AI 故障排除代理可将数小时的人工调查转化为几分钟的洞察。当团队查看警报时,代理会分析近期部署、Kubernetes 事件和历史事件等多项内容,甚至重点显示以往修复中的模式。它不仅能识别问题的症结,还能提供简明扼要的根本原因分析 (RCA) 摘要,以便团队自信迅速地采取行动,减少停机时间,并保障服务顺利运行。在可观测性云 AI 技术的支持下,您的团队就能减少解决突发问题的时间,投入更多精力处理重要事务。

  

在审查疑似根本原因和故障排除代理提供的证据后,团队可以利用 Splunk 可观测性云中的 AI 修复计划。AI 修复计划可生成指导步骤,助您实施长期解决方案,从而减少或消除这些问题。团队可以在整个修复流程中按需完成或撤消步骤,并接收相关操作的摘要。完成后,团队可以将警报标记为“已解决”,如果结果不符合其预期,则可提供反馈。

AI SRE 的主要优势在于帮助团队减少当前需要手动完成的繁琐工作——即在客户受到影响之前查找和修复问题,这有助于团队大幅降低平均修复时间 (MTTR),确保其能够专注处理重要事务并制定后续计划。

相关功能

应用性能监控

通过立即检测新变化中的问题,自信地排除问题根源并优化服务性能,更快地解决单片和微服务中的问题。

探索 APM

基础设施监测

通过即时可见性和实时警报提高混合云性能。

了解基础设施监控

可观测性云中的 AI 助手

以通俗易懂的语言获取专家指导,更快识别并解决问题。

了解 AI 助手

人工智能可观测性

观测 AI 技术堆栈的性能、质量、安全性和成本。

探索 AI 可观测性
开始

免费体验可观测性云中的嵌入式 AI。

联系销售人员
免费试用