本文摘要:摘要:受互聯(lián)網用戶推薦技術的啟發(fā),基于調度系統(tǒng)中運行人員的歷史操作記錄,結合數據分析與機器學習算法提出了一種有效的調度員操作行為模式挖掘與推薦技術。首先,該技術采集記錄調度員日常操作數據,并通過頁面類型劃分、會話識別、事務識別等過程實現數據預處理。
摘要:受互聯(lián)網用戶推薦技術的啟發(fā),基于調度系統(tǒng)中運行人員的歷史操作記錄,結合數據分析與機器學習算法提出了一種有效的調度員操作行為模式挖掘與推薦技術。首先,該技術采集記錄調度員日常操作數據,并通過頁面類型劃分、會話識別、事務識別等過程實現數據預處理。然后,利用模式分析和聚類分析完成調度員行為模式挖掘,并結合關聯(lián)規(guī)則將模式數據壓縮至頻繁模式樹(FP-tree)。最后,利用基于模式樹結構的實時推薦系統(tǒng)為調度員提供操作推薦服務。通過在實際調度系統(tǒng)上進行應用和驗證,結果表明所提技術能有效識別出調度員的操作行為模式并為調度員提供較為精準的操作推薦,進而提高調度員與調度系統(tǒng)的交互效率,減少調度員的工作量。
關鍵詞:電網調度;行為模式;操作日志;聚類挖掘;操作推薦
0引言
調度系統(tǒng)作為現代電網平穩(wěn)運行的基石,涵蓋了輸、配電等調度業(yè)務和對電網整體運行狀態(tài)的監(jiān)測、控制、管理等任務。而調度員作為調度系統(tǒng)的核心要素,通過調度系統(tǒng)來監(jiān)控電網運行狀況,分析電網故障信息,保障電網的安全與穩(wěn)定。
但隨著電網規(guī)模的不斷擴大,調度系統(tǒng)的迭代升級,操作程序的日趨復雜,調度員的工作量和工作負擔也逐漸加重,尤其是調度員在調控系統(tǒng)上進行斷面監(jiān)視、負荷控制、方式調整及故障分析等工作時,往往需要花費大量精力在多個系統(tǒng)頁面之間進行反復跳轉、查找,以獲取某個業(yè)務場景所需要指標,或在特定頁面上實施重復繁瑣的操作流程,嚴重影響了調度員的工作效率[1-4]。為此,如何優(yōu)化調度員的操作流程、簡化調度員操作任務,對于減少調度員工作負擔、提高調度工作效率具有重要意義,值得深入研究[5]。
隨著大數據的普及和發(fā)展,近年來基于用戶日志的數據挖掘和推薦技術日趨成熟,并在許多領域取得了成功應用。文獻[6-7]通過分析用戶在網站上的瀏覽路徑,對網站的頁面結構進行優(yōu)化,方便用戶快速到達他們感興趣的頁面。文獻[8-9]通過對用戶的瀏覽記錄進行聚類分類,實現對不同類型用戶推薦不同內容的功能。
文獻[10]根據期刊的推薦業(yè)務需求,設計了數字期刊推薦系統(tǒng)的框架,實現期刊內容資源與用戶需求的有效匹配。在電網調度領域,目前鮮有對調度操作行為模式挖掘和推薦的技術研究,更多的是基于調度規(guī)程和人工經驗的操作輔助決策。文獻[11]指出了當前電網調度的一些業(yè)務模式及相應規(guī)范準則,但不涉及調度員操作模式挖掘及效率提升。文獻[12]采用自然語言處理技術對線路跳閘的處理規(guī)程進行知識抽取,形成流程化的知識,用于協(xié)助調控人員完成故障處理。
文獻[13-14]提出通過構建調控領域的知識圖譜,支撐調度員在故障處置、倒閘操作、對話問答等業(yè)務場景的輔助決策,有效地降低人工處置風險。因此,受互聯(lián)網用戶個性化推薦思路的啟發(fā),本文基于調度員的歷史操作行為數據,采用機器學習技術與數據挖掘算法對調度員操作行為模式挖掘進行了深入研究,并在此基礎上實現了基于操作模式挖掘結果的調度智能推薦,有效簡化調度員的操作步驟,節(jié)省了操作時間,提升了工作效率。1整體框架基于機器學習的調度操作行為模式挖掘與操作推薦總體框架,主要包括:數據采集、模式挖掘、實時推薦、交互界面4個模塊。
1)數據采集模塊對不同用戶在系統(tǒng)界面中的操作動作進行記錄和管理。該模塊以內部埋點的方式跟蹤調度員的操作動作,并生成相應結構化操作日志。操作日志通過預設標簽標識用戶名、操作時間、圖形名稱、操作內容等信息。2)模式挖掘模塊負責對歷史操作記錄中的調度員瀏覽和操作模式進行挖掘。
其中,數據預處理用以將原始的調度員操作記錄處理成后續(xù)模型需要的用戶會話;聚類挖掘對用戶會話進行挖掘分析獲得相應的操作行為模式;關聯(lián)規(guī)則模塊以聚類分析出的模式為基礎,構造該模式FP-tree并挖掘出頻繁模式項作為后續(xù)推薦數據源。
3)實時推薦模塊通過實時跟蹤用戶頁面操作序列,在線匹配識別用戶所處操作行為模式,完成對后續(xù)操作的關聯(lián)推薦、統(tǒng)計推薦等智能操作推薦服務。4)交互界面負責操作推薦結果的實時展示與操作交互。提供即時推薦、熱點排行、定時任務等多種操作推薦方式,并可通過快捷操作的交互方式實現對推薦內容的一鍵操作。
2關鍵技術
行為模式挖掘與操作實時推薦是整個技術框架的核心內容,下面將介紹其涉及的關鍵技術。
2.1數據預處理
2.1.1頁面類型劃分
在電網調度系統(tǒng)中,有的類型頁面可以展示不同場站、設備的內容。例如所有的“XX變電站.fac”表示的是各具體廠站圖,而它們都是廠站類型的頁面。在操作模式挖掘中需將這樣的頁面進行歸一化處理,避免將具體場站、設備信息混雜在操作模式中,影響后續(xù)模式聚類效果。通常系統(tǒng)頁面可分為應用系統(tǒng)圖、廠站圖、曲線圖等不同類型。頁面類型劃分時,對于邏輯上具有唯一性的應用系統(tǒng)圖,采用不同頁面編號來劃分定義;而對于具有不同頁面實例的廠站圖(如XX變電站廠站圖)、曲線圖(如XX設備有功今日曲線)等頁面類型,按照其所屬頁面類型定義為相同的頁面編號。
2.1.2會話識別
調度員的操作行為記錄是時間上連續(xù)的一串頁面瀏覽序列,所謂會話就是按照不同調度業(yè)務從整串頁面瀏覽序列中截取出的子序列,調度員通過瀏覽子序列中的頁面完成某個任務。會話中的單個頁面及其停留時長構成相應的一個頁面實例。
本文采用時間窗口法進行會話識別[15]。時間窗口法認為兩個連續(xù)頁面之間的時間間隔大于某個閾值時,原會話截止,新的會話產生。在調度系統(tǒng)上,調度員連續(xù)操作頁面進行跳轉時,若某一頁面與其下一頁面的間隔時間大于設定閾值,則認為該頁面與其下一頁面分屬不同的會話,通常會話識別默認閾值為300s[16]。在電網調度系統(tǒng)中,調控人員為了監(jiān)視某些指標,經常在一些頁面長時間停留,遠超過300s,會話并未就此斷開。針對該特點,本文提出對于不同頁面通過分析其頁面實例停留時長的分布區(qū)間給出不同的會話識別閾值。具體地,定義頁面實例停留時長的中位數為頁面參考時長,當頁面的參考時長超過300s時,則其會話識別閾值調整為默認閥值的兩倍,即600s。
2.1.3事務識別
在頁面瀏覽序列中,根據用戶瀏覽性質可將頁面分為事務頁和導航頁。事務頁是具有訪問目的的、調控人員感興趣的頁面,如:電網負荷監(jiān)視頁,而導航頁是調控人員在瀏覽過程中跳轉性質的頁面,如:廠站目錄頁。所謂事務識別就是區(qū)分出頁面瀏覽序列中的事務頁。
頁面實例的停留時長超過設定閾值時,該頁面實例是事務頁;反之該頁面實例是導航頁[17]。其中,閾值的設定通過分析典型事務頁和導航頁的頁面停留時長分布狀況給出。其設定過程同會話識別類似,根據二八原則,定義80%頁面實例不超過的停留時長為事務參考值。
2.2聚類挖掘
經過上文數據預處理后,調度員的操作日志被分段逐條整理成經過編號的瀏覽序列,然后通過聚類算法將相似的瀏覽序列劃分為一類,從而識別出調度員的瀏覽行為模式。本文采用近鄰傳播(AP)聚類算法進行模式挖掘[18]。該算法無需預先指定聚類的簇數,輸入參數為兩兩會話之間的相似度,以解決多個會話向量維度無法統(tǒng)一的問題。
2.3關聯(lián)規(guī)則
實時推薦時需要對用戶操作序列和挖掘出的行為模式在線逐個匹配并計算置信度,因此,選取一種合適的數據結構緩存行為模式的相關信息對于提升匹配和推薦效率至關重要。
本文采用頻繁模式增長(FP-Growth)算法來建立FP-tree數據緩存結構并挖掘關聯(lián)規(guī)則[22]。FP-Growth算法通過對源數據進行兩次掃描,將數據信息存儲到FP-tree中,從而避免了產生候選項集的步驟,減少了數據匹配開銷。該算法由構建FP-tree和頻繁項集挖掘兩個步驟組成:FP-tree是一種擴展的前綴樹結構,由頻繁項頭指針表和項前綴樹構成,存儲關于頻繁模式次數的信息;頻繁項集挖掘是通過頭指針表生成條件模式基后,根據計數值判定該路徑集合是否為頻繁項,最后迭代重復上述步驟,遞歸地發(fā)現頻繁項、發(fā)現條件模式基,以及發(fā)現另外的條件樹。
其中,挖掘出的頻繁項集是用戶日常工作中的頁面關聯(lián)規(guī)則。在電網調控領域,用戶的頁面瀏覽順序和業(yè)務背景有密切關系,但該頻繁項集無法反應頁面的瀏覽順序。因此,本文參考歷史會話中的頁面瀏覽順序對關聯(lián)規(guī)則中的頁面進行重排序,篩選出包含關聯(lián)規(guī)則中所有頁面的最新歷史會話,以最新歷史會話中的頁面瀏覽順序作為該關聯(lián)規(guī)則的 頁面順序。
2.4實時推薦
實時推薦以挖掘出的調度員行為模式為基礎,結合調度員最近的操作行為序列推薦出后續(xù)操作,包括模式識別、關聯(lián)推薦等。
2.4.1模式識別
模式識別用于判斷當前用戶所處操作模式。首先通過在線跟蹤捕獲用戶在系統(tǒng)頁面上的操作,形成實時操作序列;然后通過在線預處理獲得調度員當前正在進行的會話事務序列;最后遍歷各行為模式的頻繁項集,進行模式匹配。若實時會話序列和判定行為模式的頻繁項存在交集,則該行為模式可能為當前實時會話序列的匹配模式,選取其中匹配度最高的若干行為模式作為模式識別的結果。
2.4.2關聯(lián)推薦
關聯(lián)推薦以模式識別生成的當下模式和FPtree為基礎進行,分析出當前用戶行為序列置信度最高的操作事務。首先通過比對模式識別結果,生成備選事務;然后對備選事務進行置信評估,獲得發(fā)生概率最高的若干備選事務。具體地,搜索FP-tree逐個計算備選推薦事務的置信度,選取置信度前N名的事務項作為頁面推薦內容。
3驗證與應用
本文采用某電力調度中心智能電網調度技術支持系統(tǒng)(D5000)中的調度員歷史操作數據進行推薦應用與算法驗證。
3.1算法驗證
3.1.1頁面瀏覽統(tǒng)計
本節(jié)以瀏覽行為模式挖掘為例介紹算法驗證情況。收集的數據時間范圍為2020年6月1日至6月30日。該時間段內共采集到操作記錄5932條,涉及頁面241個。
其中,行為模式2對應調度員日常工作中聯(lián)絡線守護的操作模式。在該業(yè)務場景中,調度員通過查看電網負荷監(jiān)視、聯(lián)絡線監(jiān)視曲線確定聯(lián)絡線是否運行在考核范圍內,如果超出范圍則需要查看AGC運行監(jiān)控確認是否有機組可進行反向調節(jié)[23]。行為模式8為故障發(fā)生后進行故障預演的操作模式。調度員一般通過斷面越限和獨立計算等功能預演出故障發(fā)生后的斷面狀態(tài)數據,作為后續(xù)決策的參考依據。行為模式12為調度員監(jiān)視新能源出力受阻情況的模式,經常在上午發(fā)生。
09:00—10:00處于新能源機組出力爬坡時段,此時調度員需要時常查看新能源受阻情況和新能源監(jiān)視等圖形監(jiān)控新能源機組的運行情況,確保新能源的消納能力[24]。行為模式14對應調度員進行調頻、調峰的模式。水電站是比較經濟高效的旋轉備用電源,當調度員需要進行一次調頻、深度調峰等操作時,通常需要查看直調水電站的水位曲線、出入庫流量等數據,以判斷水電站的調節(jié)能力邊界[25]。
3.2推薦應用
基于本文的行為模式挖掘與操作推薦技術研發(fā)的調度操作智能推薦軟件,為調度員的日常系統(tǒng)頁面瀏覽和操作提供個性化、智能化推薦。該系統(tǒng)以獨立插件的方式與D5000系統(tǒng)人機界面實現集成,在使用時調度員點擊調度系統(tǒng)頁面的懸浮圖標,推薦界面會以滑動窗口的方式從頁面右側顯示。
以行為模式2和14為例,說明智能操作推薦的效果。當調度員進入“電網負荷監(jiān)視圖”后,智能操作推薦軟件結合模式2自動推薦出調閱“AGC_運行監(jiān)視、聯(lián)絡線監(jiān)視曲線”等關聯(lián)界面,結合模式14自動推薦出龍羊峽等水電站水位曲線和“水情信息監(jiān)視”等關聯(lián)界面,點擊按鈕可以直接跳轉到相應頁面。
以此場景為例,簡單對比使用推薦軟件前后的操作效果差異。對于行為模式2原有系統(tǒng)從“電網負荷監(jiān)視圖”頁面至少需要經過六步操作才能完成上述關聯(lián)頁面的跳轉,分別為:①打開“系統(tǒng)首頁”;②打開“實時監(jiān)視”;③打開“AGC_運行監(jiān)視”;④返回“系統(tǒng)首頁”;⑤打開“聯(lián)絡線考核主界面”;⑥打開“聯(lián)絡線監(jiān)視曲線”。而使用智能推薦功能只需要一鍵直接打開“AGC_運行監(jiān)視”和“聯(lián)絡線監(jiān)視曲線”畫面,操作步驟由原來的6步簡化到了2步,操作效率提升了約70%。對于行為模式14原有系統(tǒng)至少需要經過5步操作才能完成上述操作。
分別為:①在龍羊峽水位數據上右鍵單擊;②在彈出的右鍵菜單上點擊“今日曲線”選項,打開“龍羊峽水位曲線”畫面;③返回“系統(tǒng)首頁”畫面;④打開“穩(wěn)態(tài)監(jiān)控”畫面;⑤點擊水情信息按鈕,打開“水情信息監(jiān)視”畫面。而使用智能推薦功能只需要一鍵直接打開“龍羊峽水位曲線”和“水情信息監(jiān)視”畫面,操作步驟由原來的5步簡化到了2步,操作效率提升了約60%。以上文的196個調度會話為例,分析使用推薦工具帶來的效率提升。未使用推薦工 具時完成會話需要的操作步數共1778步;使用推薦工具時完成會話需要的操作步數共1116步。通過統(tǒng)計分析,使用推薦工具時可以減少約37.2%的頁面跳轉流程,顯著提升了調度員在調度系統(tǒng)上的交互效率和便捷性。
此外,本軟件系統(tǒng)還可提供依據操作熱點統(tǒng)計的操作排行推薦、依據固定時段操作模式的定時操作推薦等多種操作推薦模式。例如對于行為模式12,推薦軟件會在09:00—10:00期間直接定時推薦出當下調度員需要執(zhí)行的打開“新能源監(jiān)視圖”、查看“新能源機組負荷曲線”等操作,無須頻繁跳轉到相關頁面進行操作,通過對定時操作的智能提醒與一鍵交互,可以高效輔助調度員完成操作任務。
4結語
本文主要闡述了基于調度員的歷史操作數據,結合機器學習、數據分析等方法對調度操作行為模式進行挖掘與推薦的技術。通過在實際調度系統(tǒng)上的驗證分析,結果表明挖掘出的調度員操作模式與實際電網調度業(yè)務具有高度一致性,驗證了該技術的有效性。此外,該技術采用了FP-tree數據結構存儲模式數據,并在此基礎上通過在線匹配、置信評估等方法為調度員提供了準確的推薦服務和便捷的操作方式。
總的來說,調度員操作行為模式挖掘與推薦技術在改善調度員與調度系統(tǒng)交互方式、減輕調度員工作量、提高調度員工作效率等方面有顯著的提升。但是本文提出的模式挖掘與操作推薦技術目前仍只適用于日常相對固化的流程性業(yè)務模式,在電網故障或異常等緊急場景下并不適用。當電網發(fā)生故障時,運行人員需結合電網運行數據、影響情況和處置經驗進行針對性處置,并且處置過程的部分操作不是通過系統(tǒng)而是通過電話或其他手段實施的,完整的處置記錄很難準確獲取。因此在上述緊急場景下,如何結合電網運行情況和調度業(yè)務數據的復雜場景進行操作推薦,是我們后續(xù)研究的方向。
參考文獻:
[1]胡彬,李蘇蘇.貴州電網調度優(yōu)化操作模式建議[J].貴州電力技術,2012,15(2):73-75.HUBin,LISusu.SuggestiononGuizhoupowergriddispatchingoptimizationmode[J].GuizhouElectricPowerTechnology,2012,15(2):73-75.
[2]王軼禹,王晶,馮長有,等.電網系統(tǒng)保護在線監(jiān)視研究及典型應用[J].電力工程技術,2019,38(5):63-70.WANGYiyu,WANGJing,FENGChangyou,etal.Onlinemonitoringforlargepowersystemprotectionanditsoptimizationstrategy[J].ElectricPowerEngineeringTechnology,2019,38(5):63-70.
[3]崔曉丹,李碧君,李威,等.設備月度檢修計劃給定下的電網運行方式優(yōu)化方法[J].電力系統(tǒng)保護與控制,2016,44(9):102-107.
作者:吳自博1,2,王波1,2,3,陳清1,2,郭耀松1,2,趙京虎1,2,閃鑫1,2,3
轉載請注明來自發(fā)表學術論文網:http:///wslw/29142.html