KVS_AI_GUARD 平台簡介
KVS_AI_GUARD是一個智能運維管理系統,通過大語言模型(LLM)實現自動化操作。它可以自動監控網絡設備的狀態、執行配置管理、分析日誌並進行故障排除。用戶可以通過簡單的操作,實現複雜的網絡管理,提升效率,減少人工干預,快速修復問題,確保系統穩定運行。

圖/KVS_AI_GUARD平台架構
KVS_AI_GUARD 功能介紹
LLM(大語言模型)
核心作用:LLM作為系統的入口,接收用戶輸入(如查詢、配置請求等),並生成相應的指令。它決定了系統需要執行哪些操作,比如監控狀態、更新配置或者進行故障排查。
RAG(檢索增強生成)
- 作用:用於從本地或外部數據源中檢索信息,增強LLM的生成能力。RAG會查詢相關的知識庫或內部存儲,以補充LLM生成的內容。
- 本地知識(短期記憶):RAG連接到本地知識模塊,從現有的數據或記錄中檢索信息,提供即時反饋。
函數調用(Function-call) - 操作的執行中心
作用:函數調用模塊負責執行所有與系統交互的操作。LLM通過它與設備進行直接交互,控制系統執行具體任務。
集成的操作:
- 狀態(Status):通過函數調用,LLM可以查詢交換機或Meraki等設備的狀態,了解當前的運行情況,如連接、帶寬、錯誤率等。
- 配置(Configuration):LLM通過函數調用模塊發出配置更新指令,設備接收到這些指令後進行配置更改,如網絡配置的更新或啟用新功能。
- 日誌分析(Log analysis):LLM通過函數調用模塊觸發日誌分析功能,分析網絡設備的日誌記錄,從中提取系統故障或性能相關的信息。
故障排除(Troubleshooting) - 單獨的模塊
作用:這是一個獨立的自動化故障排除模塊,負責在日誌分析完成後執行具體的修復步驟。當系統檢測到問題時,故障排除模塊負責實施修復操作。
與日誌分析的關係:故障排除模塊依賴於日誌分析模塊提供的結果。日誌分析會給出具體的問題信息,比如設備錯誤、性能問題等,故障排除模塊根據這些信息採取適當的措施。
獨立操作:
- 自動執行修復任務,如重啟設備、調整配置等。
- 如果自動修復無法完成,還可以生成詳細的故障報告,供管理員進一步操作。
- 工作流程:當系統檢測到設備出現故障,LLM通過函數調用模塊發出日誌分析請求,日誌分析結果反饋後,故障排除模塊會單獨執行修復任務。這個模塊與LLM交互較少,更多是自動完成任務。
技術優勢
- 自動化操作:系統可以自動處理設備監控、配置管理和故障修復,減少了人工干預,節省人力成本。
- 故障快速修復:通過日誌分析和故障排除模塊,系統能夠快速識別並解決問題,縮短修復時間,提高系統的穩定性。
- 智能決策支持:系統通過數據檢索和分析,幫助運維人員提前發現潛在問題,優化日常維護流程。
- 降低運維成本:自動化和智能化減少了對專業運維人員的需求,降低了運維成本。
- 實時監控與透明性:客戶可以隨時查看設備狀態、配置情況和日誌分析結果,確保運維過程透明和高效。
典型應用場景
- 大型企業:管理的IT設備眾多,運維人員少;
- 高科技企業:需要通過前沿技術的手段配套來管理公司的IT運維;
- 數字化轉型企業:一些類似高校和數據驅動型企業面臨的數字化轉型,也需要與之配套的自動化運維平台。
服務模式
- 標準化平台:開箱即用的輕量化解決方案。
- 定制開發:根據業務需求深度適配。
- 聯合運營:提供平台+運維一體化服務。