本文摘要:摘要對電網(wǎng)核心業(yè)務(wù)系統(tǒng)的性能管理應(yīng)用與部署框架進(jìn)行研究,并將相關(guān)管理納入標(biāo)準(zhǔn)化運(yùn)維服務(wù)管理流程,提出了行業(yè)企業(yè)推進(jìn)應(yīng)用性能管理的推薦思路,在應(yīng)用性能監(jiān)控基礎(chǔ)上優(yōu)化整合相關(guān)的流程、人員和資源要素;并結(jié)合應(yīng)用性能管理在案例中的實(shí)際應(yīng)用,對電網(wǎng)環(huán)
摘 要對電網(wǎng)核心業(yè)務(wù)系統(tǒng)的性能管理應(yīng)用與部署框架進(jìn)行研究,并將相關(guān)管理納入標(biāo)準(zhǔn)化運(yùn)維服務(wù)管理流程,提出了行業(yè)企業(yè)推進(jìn)應(yīng)用性能管理的推薦思路,在應(yīng)用性能監(jiān)控基礎(chǔ)上優(yōu)化整合相關(guān)的流程、人員和資源要素;并結(jié)合應(yīng)用性能管理在案例中的實(shí)際應(yīng)用,對電網(wǎng)環(huán)境下利用性能監(jiān)控和性能管理提升業(yè)務(wù)系統(tǒng)管理水平的方法進(jìn)行詳細(xì)探討。
關(guān)鍵詞業(yè)務(wù)系統(tǒng)管理 應(yīng)用性能管理 應(yīng)用性能監(jiān)控 過程管理 數(shù)據(jù)分析 可用性管理
1引言
隨著電網(wǎng)改革的深入推進(jìn),支撐電網(wǎng)核心業(yè)務(wù)的應(yīng)用系統(tǒng)穩(wěn)定性和可預(yù)測性已經(jīng)受到電網(wǎng)企業(yè)越來越多的重視。但是對于電網(wǎng)來說,大批量應(yīng)用和工具開發(fā)軟件組建的應(yīng)用架構(gòu)可能會超出IT部門的應(yīng)用管理能力。從電網(wǎng)業(yè)務(wù)應(yīng)用的實(shí)踐來看,無論應(yīng)用軟件和IT管理實(shí)踐的現(xiàn)狀是什么,都有一個基本邏輯:沒有度量就沒有管理。核心問題在于缺少有價值的可視化能力,這個能力能夠?yàn)楣芾砣藛T可視化地呈現(xiàn)性能問題發(fā)生的性質(zhì)和原因。應(yīng)用性能管理(ApplicationPerformanceManagement,APM)包括了流程和技術(shù),讓管理人員能夠獲得所需的度量指標(biāo)。在軟件生命周期的每個階段實(shí)現(xiàn)性能問題可視化,是恢復(fù)管理能力和預(yù)判性的最佳方法。
2應(yīng)用性能管理的技術(shù)與業(yè)務(wù)架構(gòu)
2.1應(yīng)用性能管理
APM具有兩個含義,其中一個的核心是“應(yīng)用及支持流程(維護(hù)和改進(jìn)應(yīng)用及相關(guān)IT資源)的生命周期管理”,這個含義即完整意義上的應(yīng)用性能管理。而另一類APM其實(shí)我們應(yīng)該稱之為應(yīng)用性能監(jiān)測(ApplicationPerformanceMonitoring,APM),描述了一類軟件解決方案(工具),這類工具提供了有效管理軟件系統(tǒng)的途徑,利用軟件技術(shù)來呈現(xiàn)軟件組件、資源和用戶會話(交易)之間的關(guān)聯(lián)關(guān)系。事實(shí)上,這兩種管理邏輯都包含在應(yīng)用性能管理范疇內(nèi)。
(1)完整意義上的應(yīng)用性能管理通過監(jiān)控跨越應(yīng)用生命周期階段的應(yīng)用性能情況,幫助管理者建立應(yīng)用系統(tǒng)的管理決策。它會影響應(yīng)用(或是由2個以上應(yīng)用支持的服務(wù))的總體質(zhì)量或用戶體驗(yàn)。從根本上來說,用戶體驗(yàn)是由應(yīng)用的性能和穩(wěn)定性直接決定的,這是電網(wǎng)公司將應(yīng)用性能管理視角延伸到包括應(yīng)用生命周期和軟件質(zhì)量管理的根本原因。應(yīng)用生命周期包括:委托、資金、設(shè)計(jì)、建模、開發(fā)、測試、質(zhì)量保證、用戶驗(yàn)收、生產(chǎn)部署、應(yīng)用和用戶故障的分類,以及應(yīng)用生命終結(jié)等。
(2)應(yīng)用性能監(jiān)測包含了如下概念:軟件組件——通常位于一個應(yīng)用服務(wù)器內(nèi)部,并基于Java或是.NET技術(shù);資源——它們并不運(yùn)行于應(yīng)用服務(wù)器內(nèi)部,例如:數(shù)據(jù)庫、消息機(jī)制、交易處理、認(rèn)證和WEB服務(wù)等。資源常常被標(biāo)記為分布式(或者遠(yuǎn)程)的系統(tǒng),并且通過網(wǎng)絡(luò)能夠訪問到,APM能夠檢測到一個交易進(jìn)程在這些組件間執(zhí)行,被稱為組件級可視化,通常被稱為深度探查技術(shù)或調(diào)用棧技術(shù);用戶交易——由一個瀏覽器會話發(fā)起和顯示的交互動作,通過一個事務(wù)處理的角度進(jìn)行觀察,可以將交易映射回相互作用的組件或資源,以識別性能問題的根源。
2.2業(yè)務(wù)架構(gòu)
隨著互聯(lián)網(wǎng)的發(fā)展,基于中間件優(yōu)化的客戶-服務(wù)器計(jì)算架構(gòu)開始面臨額外壓力,需要應(yīng)對事務(wù)處理能力增長,還需要適應(yīng)業(yè)務(wù)應(yīng)用變化的速度。越來越多的高度分布式應(yīng)用程序體系結(jié)構(gòu)相對于傳統(tǒng)的應(yīng)用程序來說,在軟件維護(hù)及其需要的變化速度方面提出更高的要求。面向應(yīng)用生命周期的性能管理架構(gòu)。應(yīng)用性能管理應(yīng)當(dāng)覆蓋應(yīng)用軟件的生命周期。從應(yīng)用軟件開發(fā)到其生產(chǎn)運(yùn)營,應(yīng)用性能管理具備了全生命周期管理能力。
3應(yīng)用性能管理在案例中的應(yīng)用
3.1應(yīng)用目標(biāo)
(1)在電網(wǎng)營銷管理系統(tǒng)和資產(chǎn)管理系統(tǒng)部署應(yīng)用性能監(jiān)控和瀏覽器性能監(jiān)控系統(tǒng),實(shí)現(xiàn)對營銷管理系統(tǒng)和資產(chǎn)管理系統(tǒng)的性能監(jiān)控及分析;(2)建立最有效利用應(yīng)用性能監(jiān)控工具的程序化能力和相關(guān)管理文化。
3.2技術(shù)選型
3.2.1應(yīng)用性能監(jiān)控技術(shù)選型
今天的信息技術(shù)行業(yè)中,通過簡單網(wǎng)絡(luò)管理協(xié)議(SimpleNetworkManagementProtocol,SNMP)實(shí)現(xiàn)的可用性監(jiān)控應(yīng)用廣泛。除此之外,還有很多其他技術(shù)可能出現(xiàn)在APM解決方案。通常來說,這些技術(shù)可以被分別使用到五類主要的度量點(diǎn)。
●日志處理與分析技術(shù);●專用設(shè)備或應(yīng)用(通常是自制用于特定系統(tǒng));●綜合事務(wù)處理系統(tǒng);●實(shí)時會話處理系統(tǒng),通常被稱為探針(包括會話過濾或者模式匹配,協(xié)議數(shù)據(jù)捕獲和分析技術(shù));●應(yīng)用軟件探查技術(shù)(包括JMX/PMI或者其它度量指標(biāo)框架,字節(jié)碼探查技術(shù))。這些應(yīng)用性能監(jiān)測技術(shù)的實(shí)用性和可視化能力的比較。根據(jù)上述方案和技術(shù)比較,基于本次管理應(yīng)用的對象和目標(biāo),電網(wǎng)采用基于應(yīng)用軟件探查技術(shù)的APM系統(tǒng)平臺,作為當(dāng)前核心的應(yīng)用性能監(jiān)測解決方案。該系統(tǒng)平臺部署于中間件等應(yīng)用系統(tǒng)核心組件設(shè)備上,采用字節(jié)碼攔截技術(shù),獲取業(yè)務(wù)會話的詳細(xì)信息,通過指標(biāo)數(shù)據(jù)分析能夠?qū)I(yè)務(wù)應(yīng)用實(shí)施有效的管理,并提供最佳的指標(biāo)可視化能力。
3.2.2應(yīng)用性能管理技術(shù)選型
電網(wǎng)已具備應(yīng)用性能監(jiān)控并不代表所有的當(dāng)前應(yīng)用都將直接獲得優(yōu)化。APM技術(shù)探查基于WEB應(yīng)用的相關(guān)特性,這對于較早的應(yīng)用實(shí)現(xiàn)(通常采用C語言或其它非字節(jié)碼語言實(shí)現(xiàn))來說并不適用。
當(dāng)電網(wǎng)將目光擴(kuò)大到應(yīng)用性能管理時,發(fā)現(xiàn)了因流程改進(jìn)與協(xié)作帶來的很多價值,即使沒有被APM技術(shù)直接監(jiān)控的應(yīng)用實(shí)現(xiàn)也能夠同樣受益。遵循APM管理流程,特別是流程與運(yùn)行環(huán)境評估相關(guān)聯(lián),能夠幫助電網(wǎng)管理人員從APM計(jì)劃中真正獲益。傳統(tǒng)的信息技術(shù)管理能力主要集中在可用性管理領(lǐng)域,該領(lǐng)域是以告警為中心的模式。而應(yīng)用性能管理是以指標(biāo)為中心的模式。這意味著,重點(diǎn)在于并沒有所謂增強(qiáng)的可用性。可用性管理邏輯從來都不考慮利用額外的可見性能力實(shí)現(xiàn)增強(qiáng)管理;诖,要實(shí)現(xiàn)真正的增強(qiáng)管理,不僅需要增添管理技術(shù),而且需要改變使用技術(shù)的過程。這就是“可視化差距”問題。這個差距從表面來看是一堆新指標(biāo),而事實(shí)上從當(dāng)前的每一個供應(yīng)商獲得的幾乎是相同的指標(biāo)。
所以,指標(biāo)采樣頻度可能不同,但基礎(chǔ)信息基本上是相同的。真正的“可視化差距”反而是在部署應(yīng)用性能管理的信息技術(shù)管理組織身上,在于其一旦具備APM這種新型可視化能力后,組織對于所呈現(xiàn)的可視化管理細(xì)節(jié)的響應(yīng)能力。這種響應(yīng)能力恰恰與流程相關(guān),也就是電網(wǎng)如何使用這種可視化工具的問題,這與管理團(tuán)隊(duì)的程序化能力和部門文化密切相關(guān)。APM工具本身是無法為管理團(tuán)隊(duì)提供如何最有效利用它的流程,這是管理團(tuán)隊(duì)必須自己形成的能力。基于上述比較和認(rèn)知,電網(wǎng)的應(yīng)用系統(tǒng)管理和運(yùn)維團(tuán)隊(duì),最終決定在采用基于應(yīng)用軟件探查技術(shù)的應(yīng)用性能監(jiān)測系統(tǒng)平臺的基礎(chǔ)上,通過優(yōu)化整合核心業(yè)務(wù)系統(tǒng)性能管理相關(guān)流程、人員和技術(shù)資源要素,形成一套能夠有效支撐應(yīng)用系統(tǒng)全生命周期的性能管理業(yè)務(wù)流程和資源組織架構(gòu),從而構(gòu)建完整的應(yīng)用性能管理體系,實(shí)現(xiàn)對電網(wǎng)核心業(yè)務(wù)系統(tǒng)的管理能力。
3.3應(yīng)用成果
通過實(shí)現(xiàn)應(yīng)用性能監(jiān)測與應(yīng)用性能管理相整合的優(yōu)化管理體系,電網(wǎng)的應(yīng)用性能管理建設(shè)獲得了較好的成果。(1)對核心業(yè)務(wù)系統(tǒng)運(yùn)行狀態(tài)的可視化管理可視化手段呈現(xiàn)業(yè)務(wù)的吞吐量、數(shù)據(jù)庫的吞吐量、錯誤率、系統(tǒng)拓?fù)涞确从硺I(yè)務(wù)系統(tǒng)運(yùn)行狀態(tài)數(shù)據(jù),并依此判斷業(yè)務(wù)運(yùn)行狀態(tài)是否異常,進(jìn)而形成性能優(yōu)化方向。(2)系統(tǒng)性能故障可快速定位根據(jù)各節(jié)點(diǎn)、事務(wù)的響應(yīng)時間,判斷該節(jié)點(diǎn)、事務(wù)是否屬于異常(例如,EJB調(diào)用超過秒級,屬于異常),再深層次逐步分析節(jié)點(diǎn)、事務(wù)具體情況。
(3)建立了一套可持續(xù)的業(yè)務(wù)運(yùn)維體系對關(guān)鍵應(yīng)用系統(tǒng)進(jìn)行月度性能分析并出具性能分析報(bào)告,反饋給系統(tǒng)運(yùn)維及開發(fā)廠商分析并整改,建立了一套問題閉環(huán)的機(jī)制,對系統(tǒng)性能問題持續(xù)優(yōu)化提升。(4)正在形成軟件生命周期管理的概念試點(diǎn)將應(yīng)用性能管理能力前推到軟件開發(fā)的質(zhì)控階段,在軟件交維環(huán)節(jié)實(shí)現(xiàn)基于性能基線數(shù)據(jù)的交維接收規(guī)范,并將基于應(yīng)用性能管理的應(yīng)用審計(jì)作為軟件開發(fā)質(zhì)控流程的一個環(huán)節(jié)予以管理。
電網(wǎng)論文范例:智能電網(wǎng)下現(xiàn)代城市電網(wǎng)規(guī)劃探討
4結(jié)語
電網(wǎng)現(xiàn)有的IT環(huán)境大量采用虛擬化和云計(jì)算技術(shù),基礎(chǔ)架構(gòu)和應(yīng)用的對應(yīng)關(guān)系被打破,通過本次應(yīng)用性能管理體系建設(shè),從可視化能力上有效重構(gòu)了業(yè)務(wù)運(yùn)行過程中,基礎(chǔ)架構(gòu)與應(yīng)用的邏輯對應(yīng)關(guān)系,幫助運(yùn)維部門工作實(shí)現(xiàn)了從基礎(chǔ)運(yùn)維到業(yè)務(wù)運(yùn)維的跨越。經(jīng)過一段時間的應(yīng)用性能管理體系運(yùn)行,在電網(wǎng)核心業(yè)務(wù)系統(tǒng)運(yùn)行管理方面,建議應(yīng)用性能管理應(yīng)當(dāng)面向軟件系統(tǒng)的生命周期管理,在引入應(yīng)用性能管理工具基礎(chǔ)上,有必要建立相對應(yīng)的管理流程體系,將應(yīng)用性能管理的相關(guān)內(nèi)容嵌入開發(fā)、測試、質(zhì)量保證、用戶驗(yàn)收、生產(chǎn)部署、應(yīng)用和用戶故障處理,以及應(yīng)用生命終結(jié)等軟件生命周期管理環(huán)節(jié)中,形成基于應(yīng)用性能的核心業(yè)務(wù)系統(tǒng)生命周期管理,協(xié)助系統(tǒng)預(yù)判和快速定位故障,提升用戶體驗(yàn)。
作者:廖 臣 吳方權(quán) 舒 彧 李 洵 朱顯峰
轉(zhuǎn)載請注明來自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/25674.html