近日,Gartner?發(fā)布了《中國(guó)AIOps市場(chǎng)指南》(Market Guide for AIOps, China, August 2023)。在該市場(chǎng)指南中,Gartner對(duì)中國(guó)的AIOps市場(chǎng)及代表廠商進(jìn)行了詳細(xì)分析,其中,深信服作為代表廠商入選該市場(chǎng)指南。
Gartner表示:
“中國(guó)對(duì)AIOps的興趣與日俱增。據(jù)Gartner研究《預(yù)測(cè):2021-2027年全球IT運(yùn)營(yíng)管理軟件》(Forecast: IT Operations Management Software, Worldwide, 2021-2027):中國(guó)AIOps市場(chǎng)預(yù)計(jì)在2023年至2025年間每年增長(zhǎng)46.9%,從3020萬(wàn)美元增至6490萬(wàn)美元。”
對(duì)于AIOps,Gartner則描述道:
“AIOps平臺(tái)通過(guò)將AI集成到事件管理流程中來(lái)增強(qiáng)、加速和自動(dòng)化對(duì)來(lái)自監(jiān)控和可觀察工具的信號(hào)的響應(yīng),從而增強(qiáng)IT運(yùn)營(yíng)管理。這涵蓋了異常檢測(cè)、事件關(guān)聯(lián)和減少、根本原因分析以及加速或自動(dòng)修復(fù)等領(lǐng)域。”
我們認(rèn)為,隨著中國(guó)經(jīng)濟(jì)的不斷發(fā)展、人工智能技術(shù)的日益普及,各行業(yè)用戶的數(shù)字化進(jìn)程都在加速,而網(wǎng)絡(luò)安全風(fēng)險(xiǎn)、IT基礎(chǔ)設(shè)施管理難度也日趨增大。AIOps的出現(xiàn),不僅幫助各行業(yè)用戶更快速準(zhǔn)確地處理龐大數(shù)據(jù),更可以幫助企業(yè)以更高的人效比完成復(fù)雜的運(yùn)維工作。
近年來(lái),深信服在AI、大數(shù)據(jù)等前沿技術(shù)上加大投入,并將研發(fā)成果落地到全線產(chǎn)品中。在該份市場(chǎng)報(bào)告中,深信服憑借著AIOps天工引擎入選為國(guó)內(nèi)AIOps技術(shù)領(lǐng)域的代表廠商。
由深信服創(chuàng)新研究院與信服云聯(lián)合打造的AIOps天工引擎,串聯(lián)海量數(shù)據(jù),聯(lián)動(dòng)50+人工智能算法,為用戶的IT基礎(chǔ)設(shè)施及云平臺(tái)提供全生命周期精細(xì)化運(yùn)營(yíng)和運(yùn)維能力,可覆蓋150+典型故障場(chǎng)景,7-30天提前預(yù)測(cè)、1分鐘發(fā)現(xiàn)、3分鐘快速定位,幫助用戶大幅提升運(yùn)維效率。
具體來(lái)說(shuō),深信服AIOps天工引擎構(gòu)筑了以下能力——
全棧資源監(jiān)控
向上覆蓋云主機(jī)、桌面應(yīng)用、數(shù)據(jù)庫(kù)、業(yè)務(wù)健康狀態(tài)、資源狀態(tài)等業(yè)務(wù)層監(jiān)控指標(biāo),向下覆蓋云平臺(tái)、底層服務(wù)器/存儲(chǔ)/CPU/內(nèi)存/RAID等硬件狀態(tài),形成全面監(jiān)控體系。同時(shí)建立統(tǒng)一數(shù)據(jù)采控體系,覆蓋800+監(jiān)控指標(biāo),可支撐上層監(jiān)控和告警場(chǎng)景,以便用戶快速對(duì)故障進(jìn)行感知、定位和修復(fù)。
硬件故障預(yù)測(cè)與檢測(cè)
提前預(yù)測(cè)磁盤/內(nèi)存的“亞健康”狀態(tài),主動(dòng)預(yù)測(cè)故障風(fēng)險(xiǎn),及時(shí)通知運(yùn)維人員對(duì)硬盤巡檢確認(rèn)并對(duì)業(yè)務(wù)進(jìn)行遷移,避免業(yè)務(wù)宕機(jī)、數(shù)據(jù)丟失等重大問(wèn)題的發(fā)生。
對(duì)主機(jī)內(nèi)存故障進(jìn)行預(yù)測(cè),及時(shí)提醒更換故障內(nèi)存條,減少內(nèi)存錯(cuò)誤引發(fā)的宕機(jī)對(duì)云主機(jī)造成的業(yè)務(wù)影響。
對(duì)主機(jī)硬盤故障進(jìn)行預(yù)測(cè),基于日志數(shù)據(jù)或指標(biāo)數(shù)據(jù)進(jìn)行分析推理和判斷,天工引擎可提前7-30天精準(zhǔn)預(yù)測(cè)故障,預(yù)測(cè)準(zhǔn)確度在90%以上。
資源預(yù)測(cè)與畫像
可提前預(yù)測(cè)主機(jī)、虛擬機(jī)資源需求趨勢(shì),預(yù)測(cè)準(zhǔn)確率達(dá)96.8%。運(yùn)維人員可以通過(guò)資源畫像了解資源的整體情況、細(xì)分情況。天工引擎可對(duì)過(guò)載資源容量進(jìn)行提前預(yù)警,根據(jù)歷史容量趨勢(shì)規(guī)律,指導(dǎo)當(dāng)前業(yè)務(wù)進(jìn)行合理擴(kuò)容,避免緊急擴(kuò)容導(dǎo)致的系統(tǒng)性風(fēng)險(xiǎn)。
告警收斂與根因分析
告警收斂可縮減90%以上重復(fù)告警規(guī)模,提高告警的精準(zhǔn)度和可讀性,在避免告警風(fēng)暴的同時(shí),助力運(yùn)維人員在海量信息與大量告警中快速定位并修復(fù)故障。
同時(shí),天工引擎基于AI算法+專家領(lǐng)域知識(shí),構(gòu)建全棧業(yè)務(wù)卡慢檢測(cè)與根因定位能力,實(shí)現(xiàn)自動(dòng)故障診斷,并提供閉環(huán)處置的建議。運(yùn)維效率提升30%,平均問(wèn)題定位時(shí)間(Mean Time to Identify,MTTI)降低50%。
網(wǎng)絡(luò)全鏈路質(zhì)量感知分析
全鏈路網(wǎng)絡(luò)分析技術(shù)通過(guò)全面感知、分析和預(yù)測(cè)網(wǎng)絡(luò),將不同的網(wǎng)絡(luò)平面進(jìn)行關(guān)聯(lián)映射,可識(shí)別典型網(wǎng)絡(luò)故障,減少70%的故障隱患,分鐘級(jí)定位50+種典型故障場(chǎng)景,解決鏈路拓?fù)潢P(guān)系割裂、連通性、可見性低的問(wèn)題,幫助用戶快速定位問(wèn)題所在。
基于運(yùn)維知識(shí)圖譜、深度學(xué)習(xí)、遷移學(xué)習(xí)、小樣本等核心技術(shù),AIOps天工引擎已廣泛用于深信服超融合、桌面云、托管云等產(chǎn)品。