可觀測性

AI SRE

告別盲目猜測,讓代理團隊成員協助您加速解決問題。

免費版 免費取得 Observability Cloud,最多可用於 15 台主機。

運作方式

在整個事件生命週期中提供嵌入式 AI 和代理支援

一位能主動排解並修復問題的團隊成員

讓更多人監督您的系統,確保一切按計劃運行。如果發生問題,AI SRE 會自動找出可能的根本原因、建立計畫,並提供逐步指引,說明如何讓一切恢復正常運作。

貼近您的需求與狀況

無論您是剛接觸可觀測性的新手還是資深專家,我們內建的代理式 AI 功能都能助您縮短平均問題解決時間 (MTTR),第一天就掌握具體可行的見解。

騰出時間做最重要的事

AI SRE 可協助您減少處理緊急問題的時間,讓您將更多時間專注於最重要的事情,從而打造未來的發展。

自主代理可觀測性,與現代企業高效同行

探索文件

AI 驅動的偵測

自動偵測問題

提早預判系統故障、效能瓶頸與效能降級,並設定偵測機制,防止會影響客戶的事件發生。

pd-o-ai-sre-features-automatically-detect

AI 疑難排解代理程式

將疑難排解放心交給代理程式

AI 疑難排解代理程式會自動篩選所有指標、記錄檔和追蹤資料,判斷您的應用程式或基礎架構是否出現問題,並找出最可能的根本原因——全部以通俗易懂的語言,在您現有的工作流程中呈現。

pd-o-ai-sre-features-trouble-shooting-agent

修復計畫

更快解決問題

別再為了手動翻閱海量文件,而在多個畫面、分頁和工具之間瘋狂切換了!現在您可以隨時隨地直接取得依機率排序的潛在原因、清晰的影響分析以及具體可行的建議。

pd-o-sre-agentic-teammate-ani

Observability Cloud 的 AI 助理

以簡單易懂的方式取得見解和答案

從 Observability Cloud 輕鬆擷取深入分析資訊,運用自然語言加快調查速度。如需更多協助,只要直接詢問 AI 助理即可。

Splunk MCP 伺服器與代理式 AI

在統一的 MCP 伺服器中使用 Splunk 功能

透過安全的介面,將本地端 AI 代理程式、LLM、大型語言模型、工具及資料與 Observability Cloud 資料連接起來,以建立自訂 AI 工作流程,並直接在您的環境中對正式環境中的效能問題進行偵錯,無需切換至其他平台。

pd-o-ai-sre-features-mcp-agentic-ai

我們的客戶都是知名企業。

瞭解 Splunk 為何深受全世界首屈一指的組織信賴

Repay customer story Repay customer story

客戶案例

Repay 透過 Observability Cloud 的 AI 助理創造更大價值回饋

各種系統與端點數不勝數,要完全瞭解是不可能的。因此,這不僅關乎效率,更在於能識別未知異常,並像領域專家一樣從資料中取得見解。

Van Wolfe Repay 平台工程副總裁
50%
加速分級
30%
交易延遲減少 30%
資源
深入探索 Splunk

AI 與代理式 AI 的 5 大迷思

分辨 AI 事實與虛構。了解代理式 AI 如何重塑可觀測性與安全性,同時協助團隊以更智慧、更快速的方式完成工作。

閱讀電子書

AI SRE 常見問題解答

AI SRE 整合 Splunk Observability Cloud 中的代理式 AI 與嵌入式 AI,提供涵蓋整個事件回應生命週期的代理式 AI 體驗,包括偵測、疑難排解及修復。這項以 AI 為原生設計的使用者體驗整合 Observability Cloud 中的 AI 助理與 Splunk MCP Server,可提供情境見解,讓團隊擺脫繁瑣的手動疑難排解工作,專注於最重要的任務以及下一步的創新與開發。

對工程團隊而言,疑難排解向來像是一場捉迷藏,尤其是在 Kubernetes 等複雜環境中執行的現代化應用程式。過去 DevOps 與網站可靠性工程師 (SRE) 往往必須在多個儀表板、日誌和指標資料之間來回搜尋,甚至切換不同工具與畫面,才能找出服務中斷或效能問題的根本原因。AI SRE 正是為了解決這項挑戰而生。

AI SRE 的角色如同網站可靠性工程 (SRE) 團隊成員,能自動篩選並分析所有指標、日誌與追蹤資料,判斷您的應用程式或基礎架構是否出現問題,並找出最可能的根本原因——全部以通俗易懂的語言,在您現有的工作流程中呈現。相較於手動翻閱海量文件,在多個畫面、分頁和工具之間瘋狂切換,團隊可以隨時隨地直接取得依機率排序的潛在原因、清晰的影響分析以及具體可行的建議。

工程團隊的真正價值來自於 AI,故障排除代理將數小時的手動調查轉變為僅數分鐘的洞察的方式。當團隊查看警示時,代理程式會分析從近期部署、Kubernetes 事件到歷史事件紀錄等各項資訊,甚至能標示出過往修正案例中的相似模式。它不僅止於指出問題徵兆,更能提供精簡的根本原因分析 (RCA) 摘要,讓團隊能夠快速從容地採取行動,減少停機時間並維持服務穩定運作。借助 Observability Cloud 的 AI 協助,您的團隊能減少處理緊急問題的時間,把心力移到更重要的事物。

在檢視疑難排解代理程式所提供的疑似根本原因及相關佐證資訊後,團隊即可運用 Splunk Observability Cloud 中的 AI 修復計畫。AI 修復計畫會產生循序引導的處理步驟,協助團隊實施長期解決方案,降低甚至徹底消除未來再次發生類似問題的風險。團隊可在修復流程中依需求完成或撤銷步驟,並獲得相關行動的摘要。完成後,團隊可以將警報標記為已解決,若結果未達預期,則給予回饋。

AI SRE 的主要優勢在於,協助團隊減少為了在影響客戶前發現與修正問題所需的大量人工負擔,進而大幅降低平均問題解決時間 (MTTR),讓團隊能更專注於關鍵任務並推動未來創新。

相關功能

Application Performance Monitoring

立即偵測新變動帶來的問題、安心疑難排解問題根源並將服務效能最佳化,讓您更快解決單體架構和微服務的問題。

探索 APM

Infrastructure Monitoring

以立即可見度與即時警示,提升混合式雲端效能。

探索基礎架構監控

Observability Cloud 的 AI 助理

取得簡單易懂的專家指導,更快地發現和修正問題。

探索 AI 助理

AI 可觀測性

觀察您 AI 堆疊的效能、品質、安全性和成本。

探索 AI 可觀測性
開始使用

免費體驗 Observability Cloud 中嵌入的 AI。

聯絡業務代表
免費試用