創(chuàng )澤機器人 |
CHUANGZE ROBOT |
系統基于大模型的開(kāi)發(fā)訓練方法,完成大模型開(kāi)發(fā)訓練環(huán)境的搭建,并特別針對企業(yè)典型的云平臺運維需求,結合L域業(yè)務(wù)數據完成運維大模型的調試工作,實(shí)現了大模型在云平臺運維L域的應用。
1、技術(shù)路徑:基于大模型的云平臺智能運維系統以淵亭大模型開(kāi)發(fā)訓練平臺、大模型數據治理平臺為基礎,消納用戶(hù)已有的運維數據(日志、監控信息、應用信息等),結合淵亭科技的智能模型開(kāi)發(fā)和調優(yōu)經(jīng)驗,支撐云平臺多個(gè)應用方向的智能運維管理。
2.技術(shù)架構:基于大模型的云平臺智能運維系統從下至上,分為基礎設施層、資源支撐層、能力供給層、能力生成層和應用服務(wù)層。
基于大模型的云平臺智能運維系統典型應用場(chǎng)景有運維數據管理、異常告警管理、故障分析、故障預測等。
云平臺運維工作是一項繁瑣、G要求的工作,除了常規的日常運維服務(wù)之外,在當前海量數據場(chǎng)景下,自動(dòng)發(fā)現故障和自動(dòng)異常檢測的需求甚為迫切,如何能J大地簡(jiǎn)化研發(fā)策略配置成本,提G告警的準確率,減少告警風(fēng)暴和誤告,從而提G運維效率是運維工作面臨的重大挑戰之一。另外,如何解決當前海量數據場(chǎng)景下人工配置和運營(yíng)告警策略、告警風(fēng)暴和準確率不G等問(wèn)題也是運維工作的核心痛點(diǎn)。
本項目由淵亭科技針對同方有云重點(diǎn)運維業(yè)務(wù)的痛點(diǎn)進(jìn)行行業(yè)大模型建設。具體的,處理大量的云平臺運維數據(日志、監控信息、應用信息等),利用開(kāi)源大模型訓練運維基座模型,并結合業(yè)務(wù)需求,孵化面向不同場(chǎng)景的專(zhuān)業(yè)運維大模型,能夠進(jìn)行自動(dòng)發(fā)現故障和自動(dòng)異常檢測,探索了基于運維大模型的智能運營(yíng)。同時(shí),設計了數據回流機制,能夠在運維過(guò)程中從海量運維數據中不斷進(jìn)行處理加工和提煉,反哺專(zhuān)業(yè)運維大模型,形成數據飛輪。
基于大模型的云平臺智能運維系統以淵亭大模型開(kāi)發(fā)訓練平臺、大模型數據治理平臺為基礎,消納用戶(hù)已有的運維數據(日志、監控信息、應用信息等),結合淵亭科技的智能模型開(kāi)發(fā)和調優(yōu)經(jīng)驗,支撐云平臺多個(gè)應用方向的智能運維管理。
基于大模型的云平臺智能運維系統從下至上,分為基礎設施層、資源支撐層、能力供給層、能力生成層和應用服務(wù)層,如下突所示。
3.系統功能
(1)向量知識庫管理功能:提供一站式的向量庫建立手段,能夠導入知識圖譜、文檔等,快速進(jìn)行向量化,并對向量化細節提供細粒度的調整手段,能夠測試和預覽向量知識庫效果。
(2)向量知識庫應用功能:支持多樣化的編排模版,實(shí)現對話(huà)鏈、溯源等典型場(chǎng)景的快速構建。并能夠結合提示詞模版支撐G匹配度的L域問(wèn)答。
• 支持至少10GB級別的大規模數據集的接入,包括連接數據源、加載數據、解析數據、數據處理等能力;
• 支持加載多種精度(如float64、float16或int8等)的模型;
• 支持使用至少2種常見(jiàn)的微調算法開(kāi)展微調;
• 支持微調后模型保存時(shí)間為分鐘級;
5.應用場(chǎng)景
基于大模型的云平臺智能運維系統典型應用場(chǎng)景有運維數據管理、異常告警管理、故障分析、故障預測等。
(1)異常告警監控
通過(guò)對異常數據進(jìn)行打標、微調,能夠自動(dòng)發(fā)現IT系統中的異常行為,并提供及時(shí)的警報和響應。利用溯源功能、知識庫功能,快速定位異常點(diǎn),進(jìn)而完成海量數據準確匹配、時(shí)序類(lèi)別多樣性分析和實(shí)時(shí)處理等工作。
(2)運維故障分析 能夠快速分析處理多種類(lèi)型的海量數據,如Trace、Metric和Log等類(lèi)型,輔助進(jìn)行故障診斷和分析,形成推測的事件根因,供人工二次復核。結合運維系統其他功能,實(shí)現從異常檢測到根因定位、故障分類(lèi)、故障分析和修復建議的全流程自動(dòng)化處理,提G故障分析效率。
(3)故障預測
引入正常數據、異常數據,開(kāi)展運行數據的特征挖掘,聚焦其中的異常因素,形成模型基礎認知。在實(shí)際問(wèn)題即將發(fā)生前,大模型自主快速的進(jìn)行提示,通過(guò)人機結合的確認審核手段,預測未來(lái)事件,防止潛在的故障。
系統運維工作是一項繁瑣、G要求的工作,且對可靠性具有很G的要求,基于大模型的云平臺智能運維系統可以提G信息化系統運維效率,降低運維成本,增強預測性維護能力,并能實(shí)現運維個(gè)性化服務(wù)。
1.提G運維效率:系統引入運維大模型,自動(dòng)化處理海量運維數據,進(jìn)行快速、G質(zhì)量判斷,能夠代替運維人員進(jìn)行大量判斷,實(shí)現風(fēng)險的預防、發(fā)現、定位和處理,從而大幅提G運維工作的效率。
2.降低運維成本:隨著(zhù)系統復雜化,傳統的人工運維成本不斷上升。系統通過(guò)構建具備自適應性的功能大模型,減少人工維護工作量,進(jìn)而有效降低這部分成本,是降本增效的有效手段。
3.增強預測性維護:增強的預測性維護能力,使得設備的可靠性、生命周期得到大大的提升,系統的穩定性也得到增強。
![]() |
機器人底盤(pán) Disinfection Robot 消毒機器人 講解機器人 迎賓機器人 移動(dòng)機器人底盤(pán) 商用機器人 智能垃圾站 智能服務(wù)機器人 大屏機器人 霧化消毒機器人 紫外線(xiàn)消毒機器人 消毒機器人價(jià)格 展廳機器人 服務(wù)機器人底盤(pán) 核酸采樣機器人 機器人代工廠(chǎng) 智能配送機器人 噴霧消毒機器人 圖書(shū)館機器人 導引機器人 移動(dòng)消毒機器人 導診機器人 迎賓接待機器人 導覽機器人 |