本文摘要:摘要:受互聯(lián)網(wǎng)用戶推薦技術(shù)的啟發(fā),基于調(diào)度系統(tǒng)中運行人員的歷史操作記錄,結(jié)合數(shù)據(jù)分析與機器學習算法提出了一種有效的調(diào)度員操作行為模式挖掘與推薦技術(shù)。首先,該技術(shù)采集記錄調(diào)度員日常操作數(shù)據(jù),并通過頁面類型劃分、會話識別、事務(wù)識別等過程實現(xiàn)數(shù)據(jù)預(yù)處理。
摘要:受互聯(lián)網(wǎng)用戶推薦技術(shù)的啟發(fā),基于調(diào)度系統(tǒng)中運行人員的歷史操作記錄,結(jié)合數(shù)據(jù)分析與機器學習算法提出了一種有效的調(diào)度員操作行為模式挖掘與推薦技術(shù)。首先,該技術(shù)采集記錄調(diào)度員日常操作數(shù)據(jù),并通過頁面類型劃分、會話識別、事務(wù)識別等過程實現(xiàn)數(shù)據(jù)預(yù)處理。然后,利用模式分析和聚類分析完成調(diào)度員行為模式挖掘,并結(jié)合關(guān)聯(lián)規(guī)則將模式數(shù)據(jù)壓縮至頻繁模式樹(FP-tree)。最后,利用基于模式樹結(jié)構(gòu)的實時推薦系統(tǒng)為調(diào)度員提供操作推薦服務(wù)。通過在實際調(diào)度系統(tǒng)上進行應(yīng)用和驗證,結(jié)果表明所提技術(shù)能有效識別出調(diào)度員的操作行為模式并為調(diào)度員提供較為精準的操作推薦,進而提高調(diào)度員與調(diào)度系統(tǒng)的交互效率,減少調(diào)度員的工作量。
關(guān)鍵詞:電網(wǎng)調(diào)度;行為模式;操作日志;聚類挖掘;操作推薦
0引言
調(diào)度系統(tǒng)作為現(xiàn)代電網(wǎng)平穩(wěn)運行的基石,涵蓋了輸、配電等調(diào)度業(yè)務(wù)和對電網(wǎng)整體運行狀態(tài)的監(jiān)測、控制、管理等任務(wù)。而調(diào)度員作為調(diào)度系統(tǒng)的核心要素,通過調(diào)度系統(tǒng)來監(jiān)控電網(wǎng)運行狀況,分析電網(wǎng)故障信息,保障電網(wǎng)的安全與穩(wěn)定。
但隨著電網(wǎng)規(guī)模的不斷擴大,調(diào)度系統(tǒng)的迭代升級,操作程序的日趨復(fù)雜,調(diào)度員的工作量和工作負擔也逐漸加重,尤其是調(diào)度員在調(diào)控系統(tǒng)上進行斷面監(jiān)視、負荷控制、方式調(diào)整及故障分析等工作時,往往需要花費大量精力在多個系統(tǒng)頁面之間進行反復(fù)跳轉(zhuǎn)、查找,以獲取某個業(yè)務(wù)場景所需要指標,或在特定頁面上實施重復(fù)繁瑣的操作流程,嚴重影響了調(diào)度員的工作效率[1-4]。為此,如何優(yōu)化調(diào)度員的操作流程、簡化調(diào)度員操作任務(wù),對于減少調(diào)度員工作負擔、提高調(diào)度工作效率具有重要意義,值得深入研究[5]。
隨著大數(shù)據(jù)的普及和發(fā)展,近年來基于用戶日志的數(shù)據(jù)挖掘和推薦技術(shù)日趨成熟,并在許多領(lǐng)域取得了成功應(yīng)用。文獻[6-7]通過分析用戶在網(wǎng)站上的瀏覽路徑,對網(wǎng)站的頁面結(jié)構(gòu)進行優(yōu)化,方便用戶快速到達他們感興趣的頁面。文獻[8-9]通過對用戶的瀏覽記錄進行聚類分類,實現(xiàn)對不同類型用戶推薦不同內(nèi)容的功能。
文獻[10]根據(jù)期刊的推薦業(yè)務(wù)需求,設(shè)計了數(shù)字期刊推薦系統(tǒng)的框架,實現(xiàn)期刊內(nèi)容資源與用戶需求的有效匹配。在電網(wǎng)調(diào)度領(lǐng)域,目前鮮有對調(diào)度操作行為模式挖掘和推薦的技術(shù)研究,更多的是基于調(diào)度規(guī)程和人工經(jīng)驗的操作輔助決策。文獻[11]指出了當前電網(wǎng)調(diào)度的一些業(yè)務(wù)模式及相應(yīng)規(guī)范準則,但不涉及調(diào)度員操作模式挖掘及效率提升。文獻[12]采用自然語言處理技術(shù)對線路跳閘的處理規(guī)程進行知識抽取,形成流程化的知識,用于協(xié)助調(diào)控人員完成故障處理。
文獻[13-14]提出通過構(gòu)建調(diào)控領(lǐng)域的知識圖譜,支撐調(diào)度員在故障處置、倒閘操作、對話問答等業(yè)務(wù)場景的輔助決策,有效地降低人工處置風險。因此,受互聯(lián)網(wǎng)用戶個性化推薦思路的啟發(fā),本文基于調(diào)度員的歷史操作行為數(shù)據(jù),采用機器學習技術(shù)與數(shù)據(jù)挖掘算法對調(diào)度員操作行為模式挖掘進行了深入研究,并在此基礎(chǔ)上實現(xiàn)了基于操作模式挖掘結(jié)果的調(diào)度智能推薦,有效簡化調(diào)度員的操作步驟,節(jié)省了操作時間,提升了工作效率。1整體框架基于機器學習的調(diào)度操作行為模式挖掘與操作推薦總體框架,主要包括:數(shù)據(jù)采集、模式挖掘、實時推薦、交互界面4個模塊。
1)數(shù)據(jù)采集模塊對不同用戶在系統(tǒng)界面中的操作動作進行記錄和管理。該模塊以內(nèi)部埋點的方式跟蹤調(diào)度員的操作動作,并生成相應(yīng)結(jié)構(gòu)化操作日志。操作日志通過預(yù)設(shè)標簽標識用戶名、操作時間、圖形名稱、操作內(nèi)容等信息。2)模式挖掘模塊負責對歷史操作記錄中的調(diào)度員瀏覽和操作模式進行挖掘。
其中,數(shù)據(jù)預(yù)處理用以將原始的調(diào)度員操作記錄處理成后續(xù)模型需要的用戶會話;聚類挖掘?qū)τ脩魰掃M行挖掘分析獲得相應(yīng)的操作行為模式;關(guān)聯(lián)規(guī)則模塊以聚類分析出的模式為基礎(chǔ),構(gòu)造該模式FP-tree并挖掘出頻繁模式項作為后續(xù)推薦數(shù)據(jù)源。
3)實時推薦模塊通過實時跟蹤用戶頁面操作序列,在線匹配識別用戶所處操作行為模式,完成對后續(xù)操作的關(guān)聯(lián)推薦、統(tǒng)計推薦等智能操作推薦服務(wù)。4)交互界面負責操作推薦結(jié)果的實時展示與操作交互。提供即時推薦、熱點排行、定時任務(wù)等多種操作推薦方式,并可通過快捷操作的交互方式實現(xiàn)對推薦內(nèi)容的一鍵操作。
2關(guān)鍵技術(shù)
行為模式挖掘與操作實時推薦是整個技術(shù)框架的核心內(nèi)容,下面將介紹其涉及的關(guān)鍵技術(shù)。
2.1數(shù)據(jù)預(yù)處理
2.1.1頁面類型劃分
在電網(wǎng)調(diào)度系統(tǒng)中,有的類型頁面可以展示不同場站、設(shè)備的內(nèi)容。例如所有的“XX變電站.fac”表示的是各具體廠站圖,而它們都是廠站類型的頁面。在操作模式挖掘中需將這樣的頁面進行歸一化處理,避免將具體場站、設(shè)備信息混雜在操作模式中,影響后續(xù)模式聚類效果。通常系統(tǒng)頁面可分為應(yīng)用系統(tǒng)圖、廠站圖、曲線圖等不同類型。頁面類型劃分時,對于邏輯上具有唯一性的應(yīng)用系統(tǒng)圖,采用不同頁面編號來劃分定義;而對于具有不同頁面實例的廠站圖(如XX變電站廠站圖)、曲線圖(如XX設(shè)備有功今日曲線)等頁面類型,按照其所屬頁面類型定義為相同的頁面編號。
2.1.2會話識別
調(diào)度員的操作行為記錄是時間上連續(xù)的一串頁面瀏覽序列,所謂會話就是按照不同調(diào)度業(yè)務(wù)從整串頁面瀏覽序列中截取出的子序列,調(diào)度員通過瀏覽子序列中的頁面完成某個任務(wù)。會話中的單個頁面及其停留時長構(gòu)成相應(yīng)的一個頁面實例。
本文采用時間窗口法進行會話識別[15]。時間窗口法認為兩個連續(xù)頁面之間的時間間隔大于某個閾值時,原會話截止,新的會話產(chǎn)生。在調(diào)度系統(tǒng)上,調(diào)度員連續(xù)操作頁面進行跳轉(zhuǎn)時,若某一頁面與其下一頁面的間隔時間大于設(shè)定閾值,則認為該頁面與其下一頁面分屬不同的會話,通常會話識別默認閾值為300s[16]。在電網(wǎng)調(diào)度系統(tǒng)中,調(diào)控人員為了監(jiān)視某些指標,經(jīng)常在一些頁面長時間停留,遠超過300s,會話并未就此斷開。針對該特點,本文提出對于不同頁面通過分析其頁面實例停留時長的分布區(qū)間給出不同的會話識別閾值。具體地,定義頁面實例停留時長的中位數(shù)為頁面參考時長,當頁面的參考時長超過300s時,則其會話識別閾值調(diào)整為默認閥值的兩倍,即600s。
2.1.3事務(wù)識別
在頁面瀏覽序列中,根據(jù)用戶瀏覽性質(zhì)可將頁面分為事務(wù)頁和導(dǎo)航頁。事務(wù)頁是具有訪問目的的、調(diào)控人員感興趣的頁面,如:電網(wǎng)負荷監(jiān)視頁,而導(dǎo)航頁是調(diào)控人員在瀏覽過程中跳轉(zhuǎn)性質(zhì)的頁面,如:廠站目錄頁。所謂事務(wù)識別就是區(qū)分出頁面瀏覽序列中的事務(wù)頁。
頁面實例的停留時長超過設(shè)定閾值時,該頁面實例是事務(wù)頁;反之該頁面實例是導(dǎo)航頁[17]。其中,閾值的設(shè)定通過分析典型事務(wù)頁和導(dǎo)航頁的頁面停留時長分布狀況給出。其設(shè)定過程同會話識別類似,根據(jù)二八原則,定義80%頁面實例不超過的停留時長為事務(wù)參考值。
2.2聚類挖掘
經(jīng)過上文數(shù)據(jù)預(yù)處理后,調(diào)度員的操作日志被分段逐條整理成經(jīng)過編號的瀏覽序列,然后通過聚類算法將相似的瀏覽序列劃分為一類,從而識別出調(diào)度員的瀏覽行為模式。本文采用近鄰傳播(AP)聚類算法進行模式挖掘[18]。該算法無需預(yù)先指定聚類的簇數(shù),輸入?yún)?shù)為兩兩會話之間的相似度,以解決多個會話向量維度無法統(tǒng)一的問題。
2.3關(guān)聯(lián)規(guī)則
實時推薦時需要對用戶操作序列和挖掘出的行為模式在線逐個匹配并計算置信度,因此,選取一種合適的數(shù)據(jù)結(jié)構(gòu)緩存行為模式的相關(guān)信息對于提升匹配和推薦效率至關(guān)重要。
本文采用頻繁模式增長(FP-Growth)算法來建立FP-tree數(shù)據(jù)緩存結(jié)構(gòu)并挖掘關(guān)聯(lián)規(guī)則[22]。FP-Growth算法通過對源數(shù)據(jù)進行兩次掃描,將數(shù)據(jù)信息存儲到FP-tree中,從而避免了產(chǎn)生候選項集的步驟,減少了數(shù)據(jù)匹配開銷。該算法由構(gòu)建FP-tree和頻繁項集挖掘兩個步驟組成:FP-tree是一種擴展的前綴樹結(jié)構(gòu),由頻繁項頭指針表和項前綴樹構(gòu)成,存儲關(guān)于頻繁模式次數(shù)的信息;頻繁項集挖掘是通過頭指針表生成條件模式基后,根據(jù)計數(shù)值判定該路徑集合是否為頻繁項,最后迭代重復(fù)上述步驟,遞歸地發(fā)現(xiàn)頻繁項、發(fā)現(xiàn)條件模式基,以及發(fā)現(xiàn)另外的條件樹。
其中,挖掘出的頻繁項集是用戶日常工作中的頁面關(guān)聯(lián)規(guī)則。在電網(wǎng)調(diào)控領(lǐng)域,用戶的頁面瀏覽順序和業(yè)務(wù)背景有密切關(guān)系,但該頻繁項集無法反應(yīng)頁面的瀏覽順序。因此,本文參考歷史會話中的頁面瀏覽順序?qū)﹃P(guān)聯(lián)規(guī)則中的頁面進行重排序,篩選出包含關(guān)聯(lián)規(guī)則中所有頁面的最新歷史會話,以最新歷史會話中的頁面瀏覽順序作為該關(guān)聯(lián)規(guī)則的 頁面順序。
2.4實時推薦
實時推薦以挖掘出的調(diào)度員行為模式為基礎(chǔ),結(jié)合調(diào)度員最近的操作行為序列推薦出后續(xù)操作,包括模式識別、關(guān)聯(lián)推薦等。
2.4.1模式識別
模式識別用于判斷當前用戶所處操作模式。首先通過在線跟蹤捕獲用戶在系統(tǒng)頁面上的操作,形成實時操作序列;然后通過在線預(yù)處理獲得調(diào)度員當前正在進行的會話事務(wù)序列;最后遍歷各行為模式的頻繁項集,進行模式匹配。若實時會話序列和判定行為模式的頻繁項存在交集,則該行為模式可能為當前實時會話序列的匹配模式,選取其中匹配度最高的若干行為模式作為模式識別的結(jié)果。
2.4.2關(guān)聯(lián)推薦
關(guān)聯(lián)推薦以模式識別生成的當下模式和FPtree為基礎(chǔ)進行,分析出當前用戶行為序列置信度最高的操作事務(wù)。首先通過比對模式識別結(jié)果,生成備選事務(wù);然后對備選事務(wù)進行置信評估,獲得發(fā)生概率最高的若干備選事務(wù)。具體地,搜索FP-tree逐個計算備選推薦事務(wù)的置信度,選取置信度前N名的事務(wù)項作為頁面推薦內(nèi)容。
3驗證與應(yīng)用
本文采用某電力調(diào)度中心智能電網(wǎng)調(diào)度技術(shù)支持系統(tǒng)(D5000)中的調(diào)度員歷史操作數(shù)據(jù)進行推薦應(yīng)用與算法驗證。
3.1算法驗證
3.1.1頁面瀏覽統(tǒng)計
本節(jié)以瀏覽行為模式挖掘為例介紹算法驗證情況。收集的數(shù)據(jù)時間范圍為2020年6月1日至6月30日。該時間段內(nèi)共采集到操作記錄5932條,涉及頁面241個。
其中,行為模式2對應(yīng)調(diào)度員日常工作中聯(lián)絡(luò)線守護的操作模式。在該業(yè)務(wù)場景中,調(diào)度員通過查看電網(wǎng)負荷監(jiān)視、聯(lián)絡(luò)線監(jiān)視曲線確定聯(lián)絡(luò)線是否運行在考核范圍內(nèi),如果超出范圍則需要查看AGC運行監(jiān)控確認是否有機組可進行反向調(diào)節(jié)[23]。行為模式8為故障發(fā)生后進行故障預(yù)演的操作模式。調(diào)度員一般通過斷面越限和獨立計算等功能預(yù)演出故障發(fā)生后的斷面狀態(tài)數(shù)據(jù),作為后續(xù)決策的參考依據(jù)。行為模式12為調(diào)度員監(jiān)視新能源出力受阻情況的模式,經(jīng)常在上午發(fā)生。
09:00—10:00處于新能源機組出力爬坡時段,此時調(diào)度員需要時常查看新能源受阻情況和新能源監(jiān)視等圖形監(jiān)控新能源機組的運行情況,確保新能源的消納能力[24]。行為模式14對應(yīng)調(diào)度員進行調(diào)頻、調(diào)峰的模式。水電站是比較經(jīng)濟高效的旋轉(zhuǎn)備用電源,當調(diào)度員需要進行一次調(diào)頻、深度調(diào)峰等操作時,通常需要查看直調(diào)水電站的水位曲線、出入庫流量等數(shù)據(jù),以判斷水電站的調(diào)節(jié)能力邊界[25]。
3.2推薦應(yīng)用
基于本文的行為模式挖掘與操作推薦技術(shù)研發(fā)的調(diào)度操作智能推薦軟件,為調(diào)度員的日常系統(tǒng)頁面瀏覽和操作提供個性化、智能化推薦。該系統(tǒng)以獨立插件的方式與D5000系統(tǒng)人機界面實現(xiàn)集成,在使用時調(diào)度員點擊調(diào)度系統(tǒng)頁面的懸浮圖標,推薦界面會以滑動窗口的方式從頁面右側(cè)顯示。
以行為模式2和14為例,說明智能操作推薦的效果。當調(diào)度員進入“電網(wǎng)負荷監(jiān)視圖”后,智能操作推薦軟件結(jié)合模式2自動推薦出調(diào)閱“AGC_運行監(jiān)視、聯(lián)絡(luò)線監(jiān)視曲線”等關(guān)聯(lián)界面,結(jié)合模式14自動推薦出龍羊峽等水電站水位曲線和“水情信息監(jiān)視”等關(guān)聯(lián)界面,點擊按鈕可以直接跳轉(zhuǎn)到相應(yīng)頁面。
以此場景為例,簡單對比使用推薦軟件前后的操作效果差異。對于行為模式2原有系統(tǒng)從“電網(wǎng)負荷監(jiān)視圖”頁面至少需要經(jīng)過六步操作才能完成上述關(guān)聯(lián)頁面的跳轉(zhuǎn),分別為:①打開“系統(tǒng)首頁”;②打開“實時監(jiān)視”;③打開“AGC_運行監(jiān)視”;④返回“系統(tǒng)首頁”;⑤打開“聯(lián)絡(luò)線考核主界面”;⑥打開“聯(lián)絡(luò)線監(jiān)視曲線”。而使用智能推薦功能只需要一鍵直接打開“AGC_運行監(jiān)視”和“聯(lián)絡(luò)線監(jiān)視曲線”畫面,操作步驟由原來的6步簡化到了2步,操作效率提升了約70%。對于行為模式14原有系統(tǒng)至少需要經(jīng)過5步操作才能完成上述操作。
分別為:①在龍羊峽水位數(shù)據(jù)上右鍵單擊;②在彈出的右鍵菜單上點擊“今日曲線”選項,打開“龍羊峽水位曲線”畫面;③返回“系統(tǒng)首頁”畫面;④打開“穩(wěn)態(tài)監(jiān)控”畫面;⑤點擊水情信息按鈕,打開“水情信息監(jiān)視”畫面。而使用智能推薦功能只需要一鍵直接打開“龍羊峽水位曲線”和“水情信息監(jiān)視”畫面,操作步驟由原來的5步簡化到了2步,操作效率提升了約60%。以上文的196個調(diào)度會話為例,分析使用推薦工具帶來的效率提升。未使用推薦工 具時完成會話需要的操作步數(shù)共1778步;使用推薦工具時完成會話需要的操作步數(shù)共1116步。通過統(tǒng)計分析,使用推薦工具時可以減少約37.2%的頁面跳轉(zhuǎn)流程,顯著提升了調(diào)度員在調(diào)度系統(tǒng)上的交互效率和便捷性。
此外,本軟件系統(tǒng)還可提供依據(jù)操作熱點統(tǒng)計的操作排行推薦、依據(jù)固定時段操作模式的定時操作推薦等多種操作推薦模式。例如對于行為模式12,推薦軟件會在09:00—10:00期間直接定時推薦出當下調(diào)度員需要執(zhí)行的打開“新能源監(jiān)視圖”、查看“新能源機組負荷曲線”等操作,無須頻繁跳轉(zhuǎn)到相關(guān)頁面進行操作,通過對定時操作的智能提醒與一鍵交互,可以高效輔助調(diào)度員完成操作任務(wù)。
4結(jié)語
本文主要闡述了基于調(diào)度員的歷史操作數(shù)據(jù),結(jié)合機器學習、數(shù)據(jù)分析等方法對調(diào)度操作行為模式進行挖掘與推薦的技術(shù)。通過在實際調(diào)度系統(tǒng)上的驗證分析,結(jié)果表明挖掘出的調(diào)度員操作模式與實際電網(wǎng)調(diào)度業(yè)務(wù)具有高度一致性,驗證了該技術(shù)的有效性。此外,該技術(shù)采用了FP-tree數(shù)據(jù)結(jié)構(gòu)存儲模式數(shù)據(jù),并在此基礎(chǔ)上通過在線匹配、置信評估等方法為調(diào)度員提供了準確的推薦服務(wù)和便捷的操作方式。
總的來說,調(diào)度員操作行為模式挖掘與推薦技術(shù)在改善調(diào)度員與調(diào)度系統(tǒng)交互方式、減輕調(diào)度員工作量、提高調(diào)度員工作效率等方面有顯著的提升。但是本文提出的模式挖掘與操作推薦技術(shù)目前仍只適用于日常相對固化的流程性業(yè)務(wù)模式,在電網(wǎng)故障或異常等緊急場景下并不適用。當電網(wǎng)發(fā)生故障時,運行人員需結(jié)合電網(wǎng)運行數(shù)據(jù)、影響情況和處置經(jīng)驗進行針對性處置,并且處置過程的部分操作不是通過系統(tǒng)而是通過電話或其他手段實施的,完整的處置記錄很難準確獲取。因此在上述緊急場景下,如何結(jié)合電網(wǎng)運行情況和調(diào)度業(yè)務(wù)數(shù)據(jù)的復(fù)雜場景進行操作推薦,是我們后續(xù)研究的方向。
參考文獻:
[1]胡彬,李蘇蘇.貴州電網(wǎng)調(diào)度優(yōu)化操作模式建議[J].貴州電力技術(shù),2012,15(2):73-75.HUBin,LISusu.SuggestiononGuizhoupowergriddispatchingoptimizationmode[J].GuizhouElectricPowerTechnology,2012,15(2):73-75.
[2]王軼禹,王晶,馮長有,等.電網(wǎng)系統(tǒng)保護在線監(jiān)視研究及典型應(yīng)用[J].電力工程技術(shù),2019,38(5):63-70.WANGYiyu,WANGJing,F(xiàn)ENGChangyou,etal.Onlinemonitoringforlargepowersystemprotectionanditsoptimizationstrategy[J].ElectricPowerEngineeringTechnology,2019,38(5):63-70.
[3]崔曉丹,李碧君,李威,等.設(shè)備月度檢修計劃給定下的電網(wǎng)運行方式優(yōu)化方法[J].電力系統(tǒng)保護與控制,2016,44(9):102-107.
作者:吳自博1,2,王波1,2,3,陳清1,2,郭耀松1,2,趙京虎1,2,閃鑫1,2,3
轉(zhuǎn)載請注明來自發(fā)表學術(shù)論文網(wǎng):http:///wslw/29142.html