本文摘要:摘要對(duì)電網(wǎng)核心業(yè)務(wù)系統(tǒng)的性能管理應(yīng)用與部署框架進(jìn)行研究,并將相關(guān)管理納入標(biāo)準(zhǔn)化運(yùn)維服務(wù)管理流程,提出了行業(yè)企業(yè)推進(jìn)應(yīng)用性能管理的推薦思路,在應(yīng)用性能監(jiān)控基礎(chǔ)上優(yōu)化整合相關(guān)的流程、人員和資源要素;并結(jié)合應(yīng)用性能管理在案例中的實(shí)際應(yīng)用,對(duì)電網(wǎng)環(huán)
摘 要對(duì)電網(wǎng)核心業(yè)務(wù)系統(tǒng)的性能管理應(yīng)用與部署框架進(jìn)行研究,并將相關(guān)管理納入標(biāo)準(zhǔn)化運(yùn)維服務(wù)管理流程,提出了行業(yè)企業(yè)推進(jìn)應(yīng)用性能管理的推薦思路,在應(yīng)用性能監(jiān)控基礎(chǔ)上優(yōu)化整合相關(guān)的流程、人員和資源要素;并結(jié)合應(yīng)用性能管理在案例中的實(shí)際應(yīng)用,對(duì)電網(wǎng)環(huán)境下利用性能監(jiān)控和性能管理提升業(yè)務(wù)系統(tǒng)管理水平的方法進(jìn)行詳細(xì)探討。
關(guān)鍵詞業(yè)務(wù)系統(tǒng)管理 應(yīng)用性能管理 應(yīng)用性能監(jiān)控 過(guò)程管理 數(shù)據(jù)分析 可用性管理
1引言
隨著電網(wǎng)改革的深入推進(jìn),支撐電網(wǎng)核心業(yè)務(wù)的應(yīng)用系統(tǒng)穩(wěn)定性和可預(yù)測(cè)性已經(jīng)受到電網(wǎng)企業(yè)越來(lái)越多的重視。但是對(duì)于電網(wǎng)來(lái)說(shuō),大批量應(yīng)用和工具開(kāi)發(fā)軟件組建的應(yīng)用架構(gòu)可能會(huì)超出IT部門(mén)的應(yīng)用管理能力。從電網(wǎng)業(yè)務(wù)應(yīng)用的實(shí)踐來(lái)看,無(wú)論應(yīng)用軟件和IT管理實(shí)踐的現(xiàn)狀是什么,都有一個(gè)基本邏輯:沒(méi)有度量就沒(méi)有管理。核心問(wèn)題在于缺少有價(jià)值的可視化能力,這個(gè)能力能夠?yàn)楣芾砣藛T可視化地呈現(xiàn)性能問(wèn)題發(fā)生的性質(zhì)和原因。應(yīng)用性能管理(ApplicationPerformanceManagement,APM)包括了流程和技術(shù),讓管理人員能夠獲得所需的度量指標(biāo)。在軟件生命周期的每個(gè)階段實(shí)現(xiàn)性能問(wèn)題可視化,是恢復(fù)管理能力和預(yù)判性的最佳方法。
2應(yīng)用性能管理的技術(shù)與業(yè)務(wù)架構(gòu)
2.1應(yīng)用性能管理
APM具有兩個(gè)含義,其中一個(gè)的核心是“應(yīng)用及支持流程(維護(hù)和改進(jìn)應(yīng)用及相關(guān)IT資源)的生命周期管理”,這個(gè)含義即完整意義上的應(yīng)用性能管理。而另一類(lèi)APM其實(shí)我們應(yīng)該稱(chēng)之為應(yīng)用性能監(jiān)測(cè)(ApplicationPerformanceMonitoring,APM),描述了一類(lèi)軟件解決方案(工具),這類(lèi)工具提供了有效管理軟件系統(tǒng)的途徑,利用軟件技術(shù)來(lái)呈現(xiàn)軟件組件、資源和用戶(hù)會(huì)話(交易)之間的關(guān)聯(lián)關(guān)系。事實(shí)上,這兩種管理邏輯都包含在應(yīng)用性能管理范疇內(nèi)。
(1)完整意義上的應(yīng)用性能管理通過(guò)監(jiān)控跨越應(yīng)用生命周期階段的應(yīng)用性能情況,幫助管理者建立應(yīng)用系統(tǒng)的管理決策。它會(huì)影響應(yīng)用(或是由2個(gè)以上應(yīng)用支持的服務(wù))的總體質(zhì)量或用戶(hù)體驗(yàn)。從根本上來(lái)說(shuō),用戶(hù)體驗(yàn)是由應(yīng)用的性能和穩(wěn)定性直接決定的,這是電網(wǎng)公司將應(yīng)用性能管理視角延伸到包括應(yīng)用生命周期和軟件質(zhì)量管理的根本原因。應(yīng)用生命周期包括:委托、資金、設(shè)計(jì)、建模、開(kāi)發(fā)、測(cè)試、質(zhì)量保證、用戶(hù)驗(yàn)收、生產(chǎn)部署、應(yīng)用和用戶(hù)故障的分類(lèi),以及應(yīng)用生命終結(jié)等。
(2)應(yīng)用性能監(jiān)測(cè)包含了如下概念:軟件組件——通常位于一個(gè)應(yīng)用服務(wù)器內(nèi)部,并基于Java或是.NET技術(shù);資源——它們并不運(yùn)行于應(yīng)用服務(wù)器內(nèi)部,例如:數(shù)據(jù)庫(kù)、消息機(jī)制、交易處理、認(rèn)證和WEB服務(wù)等。資源常常被標(biāo)記為分布式(或者遠(yuǎn)程)的系統(tǒng),并且通過(guò)網(wǎng)絡(luò)能夠訪問(wèn)到,APM能夠檢測(cè)到一個(gè)交易進(jìn)程在這些組件間執(zhí)行,被稱(chēng)為組件級(jí)可視化,通常被稱(chēng)為深度探查技術(shù)或調(diào)用棧技術(shù);用戶(hù)交易——由一個(gè)瀏覽器會(huì)話發(fā)起和顯示的交互動(dòng)作,通過(guò)一個(gè)事務(wù)處理的角度進(jìn)行觀察,可以將交易映射回相互作用的組件或資源,以識(shí)別性能問(wèn)題的根源。
2.2業(yè)務(wù)架構(gòu)
隨著互聯(lián)網(wǎng)的發(fā)展,基于中間件優(yōu)化的客戶(hù)-服務(wù)器計(jì)算架構(gòu)開(kāi)始面臨額外壓力,需要應(yīng)對(duì)事務(wù)處理能力增長(zhǎng),還需要適應(yīng)業(yè)務(wù)應(yīng)用變化的速度。越來(lái)越多的高度分布式應(yīng)用程序體系結(jié)構(gòu)相對(duì)于傳統(tǒng)的應(yīng)用程序來(lái)說(shuō),在軟件維護(hù)及其需要的變化速度方面提出更高的要求。面向應(yīng)用生命周期的性能管理架構(gòu)。應(yīng)用性能管理應(yīng)當(dāng)覆蓋應(yīng)用軟件的生命周期。從應(yīng)用軟件開(kāi)發(fā)到其生產(chǎn)運(yùn)營(yíng),應(yīng)用性能管理具備了全生命周期管理能力。
3應(yīng)用性能管理在案例中的應(yīng)用
3.1應(yīng)用目標(biāo)
(1)在電網(wǎng)營(yíng)銷(xiāo)管理系統(tǒng)和資產(chǎn)管理系統(tǒng)部署應(yīng)用性能監(jiān)控和瀏覽器性能監(jiān)控系統(tǒng),實(shí)現(xiàn)對(duì)營(yíng)銷(xiāo)管理系統(tǒng)和資產(chǎn)管理系統(tǒng)的性能監(jiān)控及分析;(2)建立最有效利用應(yīng)用性能監(jiān)控工具的程序化能力和相關(guān)管理文化。
3.2技術(shù)選型
3.2.1應(yīng)用性能監(jiān)控技術(shù)選型
今天的信息技術(shù)行業(yè)中,通過(guò)簡(jiǎn)單網(wǎng)絡(luò)管理協(xié)議(SimpleNetworkManagementProtocol,SNMP)實(shí)現(xiàn)的可用性監(jiān)控應(yīng)用廣泛。除此之外,還有很多其他技術(shù)可能出現(xiàn)在APM解決方案。通常來(lái)說(shuō),這些技術(shù)可以被分別使用到五類(lèi)主要的度量點(diǎn)。
●日志處理與分析技術(shù);●專(zhuān)用設(shè)備或應(yīng)用(通常是自制用于特定系統(tǒng));●綜合事務(wù)處理系統(tǒng);●實(shí)時(shí)會(huì)話處理系統(tǒng),通常被稱(chēng)為探針(包括會(huì)話過(guò)濾或者模式匹配,協(xié)議數(shù)據(jù)捕獲和分析技術(shù));●應(yīng)用軟件探查技術(shù)(包括JMX/PMI或者其它度量指標(biāo)框架,字節(jié)碼探查技術(shù))。這些應(yīng)用性能監(jiān)測(cè)技術(shù)的實(shí)用性和可視化能力的比較。根據(jù)上述方案和技術(shù)比較,基于本次管理應(yīng)用的對(duì)象和目標(biāo),電網(wǎng)采用基于應(yīng)用軟件探查技術(shù)的APM系統(tǒng)平臺(tái),作為當(dāng)前核心的應(yīng)用性能監(jiān)測(cè)解決方案。該系統(tǒng)平臺(tái)部署于中間件等應(yīng)用系統(tǒng)核心組件設(shè)備上,采用字節(jié)碼攔截技術(shù),獲取業(yè)務(wù)會(huì)話的詳細(xì)信息,通過(guò)指標(biāo)數(shù)據(jù)分析能夠?qū)I(yè)務(wù)應(yīng)用實(shí)施有效的管理,并提供最佳的指標(biāo)可視化能力。
3.2.2應(yīng)用性能管理技術(shù)選型
電網(wǎng)已具備應(yīng)用性能監(jiān)控并不代表所有的當(dāng)前應(yīng)用都將直接獲得優(yōu)化。APM技術(shù)探查基于WEB應(yīng)用的相關(guān)特性,這對(duì)于較早的應(yīng)用實(shí)現(xiàn)(通常采用C語(yǔ)言或其它非字節(jié)碼語(yǔ)言實(shí)現(xiàn))來(lái)說(shuō)并不適用。
當(dāng)電網(wǎng)將目光擴(kuò)大到應(yīng)用性能管理時(shí),發(fā)現(xiàn)了因流程改進(jìn)與協(xié)作帶來(lái)的很多價(jià)值,即使沒(méi)有被APM技術(shù)直接監(jiān)控的應(yīng)用實(shí)現(xiàn)也能夠同樣受益。遵循APM管理流程,特別是流程與運(yùn)行環(huán)境評(píng)估相關(guān)聯(lián),能夠幫助電網(wǎng)管理人員從APM計(jì)劃中真正獲益。傳統(tǒng)的信息技術(shù)管理能力主要集中在可用性管理領(lǐng)域,該領(lǐng)域是以告警為中心的模式。而應(yīng)用性能管理是以指標(biāo)為中心的模式。這意味著,重點(diǎn)在于并沒(méi)有所謂增強(qiáng)的可用性?捎眯怨芾磉壿嫃膩(lái)都不考慮利用額外的可見(jiàn)性能力實(shí)現(xiàn)增強(qiáng)管理;诖,要實(shí)現(xiàn)真正的增強(qiáng)管理,不僅需要增添管理技術(shù),而且需要改變使用技術(shù)的過(guò)程。這就是“可視化差距”問(wèn)題。這個(gè)差距從表面來(lái)看是一堆新指標(biāo),而事實(shí)上從當(dāng)前的每一個(gè)供應(yīng)商獲得的幾乎是相同的指標(biāo)。
所以,指標(biāo)采樣頻度可能不同,但基礎(chǔ)信息基本上是相同的。真正的“可視化差距”反而是在部署應(yīng)用性能管理的信息技術(shù)管理組織身上,在于其一旦具備APM這種新型可視化能力后,組織對(duì)于所呈現(xiàn)的可視化管理細(xì)節(jié)的響應(yīng)能力。這種響應(yīng)能力恰恰與流程相關(guān),也就是電網(wǎng)如何使用這種可視化工具的問(wèn)題,這與管理團(tuán)隊(duì)的程序化能力和部門(mén)文化密切相關(guān)。APM工具本身是無(wú)法為管理團(tuán)隊(duì)提供如何最有效利用它的流程,這是管理團(tuán)隊(duì)必須自己形成的能力;谏鲜霰容^和認(rèn)知,電網(wǎng)的應(yīng)用系統(tǒng)管理和運(yùn)維團(tuán)隊(duì),最終決定在采用基于應(yīng)用軟件探查技術(shù)的應(yīng)用性能監(jiān)測(cè)系統(tǒng)平臺(tái)的基礎(chǔ)上,通過(guò)優(yōu)化整合核心業(yè)務(wù)系統(tǒng)性能管理相關(guān)流程、人員和技術(shù)資源要素,形成一套能夠有效支撐應(yīng)用系統(tǒng)全生命周期的性能管理業(yè)務(wù)流程和資源組織架構(gòu),從而構(gòu)建完整的應(yīng)用性能管理體系,實(shí)現(xiàn)對(duì)電網(wǎng)核心業(yè)務(wù)系統(tǒng)的管理能力。
3.3應(yīng)用成果
通過(guò)實(shí)現(xiàn)應(yīng)用性能監(jiān)測(cè)與應(yīng)用性能管理相整合的優(yōu)化管理體系,電網(wǎng)的應(yīng)用性能管理建設(shè)獲得了較好的成果。(1)對(duì)核心業(yè)務(wù)系統(tǒng)運(yùn)行狀態(tài)的可視化管理可視化手段呈現(xiàn)業(yè)務(wù)的吞吐量、數(shù)據(jù)庫(kù)的吞吐量、錯(cuò)誤率、系統(tǒng)拓?fù)涞确从硺I(yè)務(wù)系統(tǒng)運(yùn)行狀態(tài)數(shù)據(jù),并依此判斷業(yè)務(wù)運(yùn)行狀態(tài)是否異常,進(jìn)而形成性能優(yōu)化方向。(2)系統(tǒng)性能故障可快速定位根據(jù)各節(jié)點(diǎn)、事務(wù)的響應(yīng)時(shí)間,判斷該節(jié)點(diǎn)、事務(wù)是否屬于異常(例如,EJB調(diào)用超過(guò)秒級(jí),屬于異常),再深層次逐步分析節(jié)點(diǎn)、事務(wù)具體情況。
(3)建立了一套可持續(xù)的業(yè)務(wù)運(yùn)維體系對(duì)關(guān)鍵應(yīng)用系統(tǒng)進(jìn)行月度性能分析并出具性能分析報(bào)告,反饋給系統(tǒng)運(yùn)維及開(kāi)發(fā)廠商分析并整改,建立了一套問(wèn)題閉環(huán)的機(jī)制,對(duì)系統(tǒng)性能問(wèn)題持續(xù)優(yōu)化提升。(4)正在形成軟件生命周期管理的概念試點(diǎn)將應(yīng)用性能管理能力前推到軟件開(kāi)發(fā)的質(zhì)控階段,在軟件交維環(huán)節(jié)實(shí)現(xiàn)基于性能基線數(shù)據(jù)的交維接收規(guī)范,并將基于應(yīng)用性能管理的應(yīng)用審計(jì)作為軟件開(kāi)發(fā)質(zhì)控流程的一個(gè)環(huán)節(jié)予以管理。
電網(wǎng)論文范例:智能電網(wǎng)下現(xiàn)代城市電網(wǎng)規(guī)劃探討
4結(jié)語(yǔ)
電網(wǎng)現(xiàn)有的IT環(huán)境大量采用虛擬化和云計(jì)算技術(shù),基礎(chǔ)架構(gòu)和應(yīng)用的對(duì)應(yīng)關(guān)系被打破,通過(guò)本次應(yīng)用性能管理體系建設(shè),從可視化能力上有效重構(gòu)了業(yè)務(wù)運(yùn)行過(guò)程中,基礎(chǔ)架構(gòu)與應(yīng)用的邏輯對(duì)應(yīng)關(guān)系,幫助運(yùn)維部門(mén)工作實(shí)現(xiàn)了從基礎(chǔ)運(yùn)維到業(yè)務(wù)運(yùn)維的跨越。經(jīng)過(guò)一段時(shí)間的應(yīng)用性能管理體系運(yùn)行,在電網(wǎng)核心業(yè)務(wù)系統(tǒng)運(yùn)行管理方面,建議應(yīng)用性能管理應(yīng)當(dāng)面向軟件系統(tǒng)的生命周期管理,在引入應(yīng)用性能管理工具基礎(chǔ)上,有必要建立相對(duì)應(yīng)的管理流程體系,將應(yīng)用性能管理的相關(guān)內(nèi)容嵌入開(kāi)發(fā)、測(cè)試、質(zhì)量保證、用戶(hù)驗(yàn)收、生產(chǎn)部署、應(yīng)用和用戶(hù)故障處理,以及應(yīng)用生命終結(jié)等軟件生命周期管理環(huán)節(jié)中,形成基于應(yīng)用性能的核心業(yè)務(wù)系統(tǒng)生命周期管理,協(xié)助系統(tǒng)預(yù)判和快速定位故障,提升用戶(hù)體驗(yàn)。
作者:廖 臣 吳方權(quán) 舒 彧 李 洵 朱顯峰
轉(zhuǎn)載請(qǐng)注明來(lái)自發(fā)表學(xué)術(shù)論文網(wǎng):http:///dzlw/25674.html