“數(shù)智互聯(lián),瞰見未來”2023第六屆上海人工智能大會近日圓滿閉幕,必示科技作為智能運維行業(yè)代表企業(yè),受邀出席并分享題為《AI賦能金融運維領(lǐng)域的落地與應(yīng)用》的主題演講。
本屆上海人工智能大會由中國科學(xué)技術(shù)協(xié)會指導(dǎo),中國國際科技促進會,中國民營科技實業(yè)家協(xié)會專精特新專委會,長三角人工智能發(fā)展聯(lián)盟,長三角數(shù)字化轉(zhuǎn)型公共服務(wù)平臺主辦;上海市突出貢獻專家協(xié)會,上海市人工智能學(xué)會,上海市計算機學(xué)會,上海士研管理咨詢有限公司承辦;中小銀行互聯(lián)網(wǎng)金融(深圳)聯(lián)盟,“一帶一路”信息產(chǎn)業(yè)國際發(fā)展聯(lián)盟,上海大數(shù)據(jù)聯(lián)盟聯(lián)合主辦,是國內(nèi)人工智能領(lǐng)域產(chǎn)-學(xué)-研交融互動的年度盛會。必示科技作為智能運維企業(yè)代表,與現(xiàn)場的頂級學(xué)者和業(yè)內(nèi)著名技術(shù)大咖一道,共同探討人工智能的學(xué)術(shù)、人才、技術(shù)以及行業(yè)發(fā)展痛點,探討人工智能的發(fā)展路徑及未來愿景。
在“數(shù)字賦能”AI+金融科技主題論壇上,必示科技資深算法專家殷康璘在題為《AI賦能金融運維領(lǐng)域的落地與應(yīng)用》的演講中,分享了必示科技近幾年利用人工智能技術(shù)賦能金融運維領(lǐng)域的產(chǎn)品落地經(jīng)驗。
必示科技資深算法專家殷康璘博士
AIOps(智能運維)的本質(zhì)是將AI技術(shù)與傳統(tǒng)IT運維領(lǐng)域生態(tài)深度融合,利用AI技術(shù)實現(xiàn)運維數(shù)據(jù)服務(wù)和運維專屬AI服務(wù)。企業(yè)通過構(gòu)建智能運維平臺,加速智能運維場景落地,助力運維提質(zhì)增效,賦能行業(yè)數(shù)智化升級。
一方面,智能運維既隸屬于國家的戰(zhàn)略領(lǐng)域,也是在銀行、證券、保險等金融行業(yè)數(shù)字化轉(zhuǎn)型的大背景下運維行業(yè)的發(fā)展方向,同時銀保監(jiān)會、中國人民銀行等機構(gòu)近兩年也在金融科技、數(shù)字化轉(zhuǎn)型等方面對智能運維提出了實質(zhì)性的要求。另一方面,當(dāng)前新技術(shù)、新應(yīng)用導(dǎo)致IT系統(tǒng)環(huán)境管理規(guī)模、復(fù)雜性、要求迅速提升,傳統(tǒng)的“監(jiān)、管、控”工具需要調(diào)整以適應(yīng)混合架構(gòu)的管理要求,同時需要具備運維數(shù)據(jù)分析的能力,這些對傳統(tǒng)運維團隊都提出了從技術(shù)到管理的全面挑戰(zhàn)。
智能運維(AIOps)概念提出到實施落地已有多年,伴隨著業(yè)界一些AIOps項目的落地實施,業(yè)內(nèi)逐漸對智能運維的價值、效果和建設(shè)路徑等方面產(chǎn)生疑惑。作為深耕于金融行業(yè)智能運維產(chǎn)品研發(fā)與落地實施的國家高新技術(shù)企業(yè)-必示科技,通過服務(wù)60余家金融頭部企業(yè)的經(jīng)驗,經(jīng)過多年的技術(shù)探索和工業(yè)實踐,總結(jié)出了聚焦智能運維落地效果方面的方法論:即目標(biāo)明確、人機協(xié)同、多方協(xié)作、持續(xù)運營。
必示科技經(jīng)過持續(xù)的技術(shù)研發(fā)、工業(yè)實踐和產(chǎn)品迭代,推出了滿足AIOps事前、事中、事后階段均對“運維系統(tǒng)穩(wěn)定性”產(chǎn)生價值和效果的必示智能產(chǎn)品矩陣。
發(fā)生即發(fā)現(xiàn):智能監(jiān)控+智能事件管理平臺
必示智能監(jiān)控產(chǎn)品對實時數(shù)據(jù)流進行動態(tài)監(jiān)測。提前發(fā)現(xiàn)異常并生成故障預(yù)警,故障發(fā)現(xiàn)準確率95%以上。平均故障發(fā)現(xiàn)時間下降至5分鐘內(nèi),最快可達30秒。
告警管理是運維過程中不可或缺且耗時耗力的工作。傳統(tǒng)告警管理平臺,多數(shù)僅聚焦于告警的集中管控,缺乏對告警的分析及結(jié)論推薦。必示智能事件管理平臺,在實現(xiàn)告警全生命周期集中管控的基礎(chǔ)上,結(jié)合先進的告警分析算法,實現(xiàn)“關(guān)鍵告警一屏清”、“故障排查有方向”、“告警治理有保障”等運維目標(biāo)。
某銀行使用必示智能運維產(chǎn)品后,無論從系統(tǒng)覆蓋和監(jiān)控點的數(shù)量、分析維度均有較大幅度的提升,同時分析鏈路上也從調(diào)用鏈路分析升級到了全局交易鏈路分析。
必示智能監(jiān)控平臺通過無監(jiān)督學(xué)習(xí)算法,支持數(shù)十萬級指標(biāo)實時檢測。通過智能檢測實現(xiàn)動態(tài)閾值調(diào)整,以及曲線特征自動提取和選擇、聚類算法使用、自動敏感度調(diào)整等技術(shù)創(chuàng)新,使故障發(fā)現(xiàn)準確率95%以上,平均故障發(fā)現(xiàn)時間下降至5分鐘內(nèi),最快可達30秒。從源頭上減少告警數(shù)量,提升告警發(fā)生時告警發(fā)現(xiàn)和處理效率,
通過智能摘要分析實現(xiàn)多維度多視角的告警分析報告。從傳統(tǒng)的盯告警列表變成看摘要報告,幫助一線運維人員或者應(yīng)急值班經(jīng)理實現(xiàn)分鐘級的故障定界,加速故障排查和處置,特別適用于處理告警風(fēng)暴的場景。
在大規(guī)模故障發(fā)生時,通過針對重要業(yè)務(wù),構(gòu)建告警智能分析大屏,實現(xiàn)從告警風(fēng)暴識別、告警路徑分析到可疑應(yīng)用推薦的全棧能力。而在重保場景下對告警數(shù)據(jù)進行實時智能分析,從而保障業(yè)務(wù)的健康度和業(yè)務(wù)連續(xù)性。
發(fā)現(xiàn)即定位:故障定位分析
故障排查是運維人員最復(fù)雜且最心累的工作。目前故障排查基本通過多團隊協(xié)作,人工收集信息,并憑經(jīng)驗做決策判斷,整個過程效率低,時間長。必示智能故障分析平臺利用各種AI檢測技術(shù),自動化專家排障經(jīng)驗,實現(xiàn)對70%以上故障的分鐘級精準排查,降低故障恢復(fù)時間,減少業(yè)務(wù)損失。
傳統(tǒng)排障的典型場景是:凌晨3點20,一線值班人員接到oracle告警并電話通知二線值班工程師,二線要起床從賓館趕到ECC,登錄到Grafana查看具體原因。這個過程至少應(yīng)該10-15分鐘。而二線值班工程師排障過程更是根據(jù)經(jīng)驗判斷,需要多團隊寫作、人工收集信息,并憑借經(jīng)驗做判斷決策,排障時間也因故障程度和排障難度而不受控制。
必示故障分析平臺可以通過告警拓撲展現(xiàn)和自動根因推薦,提升排障效率,實現(xiàn)分鐘級排障。通過排障圖的方式固化排障經(jīng)驗,來沉淀運維專家經(jīng)驗。當(dāng)故障發(fā)生時可按照排障圖去自動摸排根因,像運維專家親臨現(xiàn)場。同時,通過自動識別CMDB數(shù)據(jù)的缺失、異常和錯誤,自動判斷關(guān)鍵告警缺失,為數(shù)據(jù)治理提供依據(jù)和方向。某銀行銀行使用智能故障分析系統(tǒng)快速發(fā)現(xiàn)故障后,在接到告警后的處置情況如下:
提前發(fā)現(xiàn)風(fēng)險:必示風(fēng)險感知平臺
70%以上運維生產(chǎn)事故是由變更引起,目前變更問題發(fā)現(xiàn)主要靠人工檢查和經(jīng)驗判斷的方式經(jīng)常出現(xiàn)錯查漏查的情況,必示智能變更風(fēng)險感知平臺通過人機協(xié)同的方式幫助運維人員減少90%的變更驗證時間并有效發(fā)現(xiàn)60-80%的變更風(fēng)險隱患。
某客戶在部署風(fēng)險感知平臺后,在某應(yīng)用系統(tǒng)夜間變更,風(fēng)險感知平臺在變更后10分鐘啟動變更風(fēng)險檢查,針對該系統(tǒng)和相關(guān)交易碼的業(yè)務(wù)指標(biāo)在變更前后的變化進行分析,發(fā)現(xiàn)變更后該系統(tǒng)業(yè)務(wù)指標(biāo)與多個易碼業(yè)務(wù)指標(biāo)均存在明顯異常,包括系統(tǒng)級風(fēng)險4項、交易碼風(fēng)險7項、主機風(fēng)險72項。提醒客戶關(guān)注變更異常問題。管理員和項目組確認問題后,及時進行了版本回退,避免了嚴重運行風(fēng)險的產(chǎn)生。
必示變更風(fēng)險感知平臺提供靈活的任務(wù)模板編排能力,基于運維專家對業(yè)務(wù)場景的理解和風(fēng)險檢查經(jīng)驗,內(nèi)置豐富的風(fēng)險檢查智能算子,能夠封裝不同領(lǐng)域?qū)ο蟆⒉煌愋椭笜?biāo),支持用戶根據(jù)自身業(yè)務(wù)特點、場景需求來積極探索人機協(xié)同模式下的更多個性化風(fēng)險感知場景,提升場景上線效率,加速場景落地。
總結(jié):
必示科技的智能運維產(chǎn)品矩陣,利用人工智能技術(shù)賦能金融行業(yè)的運維系統(tǒng),平臺產(chǎn)品包括:提前發(fā)現(xiàn)風(fēng)險-智能風(fēng)險感知平臺、事件發(fā)生即發(fā)現(xiàn)-智能監(jiān)控平臺&智能事件管理平臺、發(fā)現(xiàn)即定位-智能故障分析平臺,從事前預(yù)警和預(yù)防、事中快速發(fā)現(xiàn)和定位、事后經(jīng)驗知識沉淀三個方面助力企業(yè)提升智能運維平臺能力,降低MTTR,延長MTBF。
未來,必示科技進一步明確“具有清晰可度量的運維價值”的產(chǎn)品定位, 以人工智能技術(shù)和工匠精神,推動智能運維產(chǎn)品力和創(chuàng)新力的提升,助力金融企業(yè)系統(tǒng)運行風(fēng)險防范,加速必示智能運維矩陣,在金融行業(yè)高質(zhì)量落地,助力金融企業(yè)數(shù)智化轉(zhuǎn)型。
關(guān)鍵詞:
版權(quán)與免責(zé)聲明:
1 本網(wǎng)注明“來源:×××”(非商業(yè)周刊網(wǎng))的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
2 在本網(wǎng)的新聞頁面或BBS上進行跟帖或發(fā)表言論者,文責(zé)自負。
3 相關(guān)信息并未經(jīng)過本網(wǎng)站證實,不對您構(gòu)成任何投資建議,據(jù)此操作,風(fēng)險自擔(dān)。
4 如涉及作品內(nèi)容、版權(quán)等其它問題,請在30日內(nèi)同本網(wǎng)聯(lián)系。