發(fā)布時間:2019-04-09所屬分類:科技論文瀏覽:1次
摘 要: 摘要:相較過去大部分針對專變和公變的竊電檢測方法,文中針對群體數(shù)量龐大、竊電手段復雜多樣的低壓用戶進行竊電行為的檢測分析。首先建立特征工程,然后基于卷積神經(jīng)網(wǎng)絡LeNet-5模型對日用電量數(shù)據(jù)進行建模分析,篩選出異常用電模式,再采用雙層深度網(wǎng)絡對
摘要:相較過去大部分針對專變和公變的竊電檢測方法,文中針對群體數(shù)量龐大、竊電手段復雜多樣的低壓用戶進行竊電行為的檢測分析。首先建立特征工程,然后基于卷積神經(jīng)網(wǎng)絡LeNet-5模型對日用電量數(shù)據(jù)進行建模分析,篩選出異常用電模式,再采用雙層深度網(wǎng)絡對用戶信息、臺區(qū)線損、告警信息等數(shù)據(jù)進行綜合分析。通過比對模型輸出的分級竊電嫌疑清單,本文方法對各類竊電模式有很好的查準率,為精確抓獲竊電奠定了基礎。
關鍵詞:竊電行為檢測;深度學習;卷積神經(jīng)網(wǎng)絡;全連接網(wǎng)絡;竊電嫌疑
竊電問題一直困擾著供電部門。傳統(tǒng)竊電排查方法是由供電所防竊電人員人工觀察所轄區(qū)域的臺區(qū)線損、用戶電量等,根據(jù)行業(yè)經(jīng)驗和業(yè)務規(guī)則,確定竊電嫌疑清單,再結合現(xiàn)場摸排來捕捉竊電行為[1-2],有諸多局限性。此外,當前的竊電檢測方法主要是采用計量裝置防止竊電,缺乏實時監(jiān)控,檢測效果較差[3]。
結合業(yè)務規(guī)則和機器學習算法,通過對智能電表穿透采集得到的數(shù)據(jù)進行全面的分析,從中尋找出存在竊電嫌疑的行為模式,成為一種新的方法[4-8]。相較過去針對專變和公變的竊電檢測方法,本文主要針對群體數(shù)量龐大、竊電手段復雜多樣的低壓用戶,對與竊電相關的因子進行梳理,建立特征工程,對日用電量的時序數(shù)據(jù)建立5層卷積神經(jīng)網(wǎng)絡(CNN,ConvolutionalNeuralNetworks)模型,篩選出具有異常用電特征的模式,并輸出竊電嫌疑,再結合雙層全連接網(wǎng)絡對用戶檔案信息、臺區(qū)線損和異常告警信息進行綜合分析建模,按月度輸出竊電嫌疑清單[9]。
1特征工程
竊電分類模型以月度為周期,分析每個用戶當月的指標數(shù)據(jù),評估其竊電嫌疑。通過對業(yè)務規(guī)則和經(jīng)驗的梳理,將竊電指標分為以下四類:①用電量時序:日均電量、峰電量、谷電量;②用戶信息:行業(yè)分類(非居民用戶)、用電類別、城農(nóng)網(wǎng)標識、合同容量、臺區(qū)容量、用戶數(shù)、歷史竊電數(shù);③臺區(qū)線損:月均線損率、最低線損率、最高線損率、高損天數(shù)(線損率大于9%)、月均線損電量、最低線損電量、最高線損電量、線損采集成功率;④異常告警:電能表停走異常、電壓斷相異常、電流不平衡異常、電能表開蓋事件、反向電量異常。其中用電量時序特征數(shù)據(jù)為每天一項,一個月共31項,其余均為每月一項;位于相同臺區(qū)的用戶其臺區(qū)線損相同;異常告警是指當前月份過去三個月內的某類異常發(fā)生次數(shù);以上指標均為每個人月一條,最終合并為建模數(shù)據(jù)。
1.1黑白名單構造
實際竊電用戶在所有用戶中的占比極低,因此竊電行為數(shù)據(jù)為非平衡集。黑名單可從國網(wǎng)各個網(wǎng)省公司下屬的各地區(qū)分局獲得,其來源是現(xiàn)場人員通過摸排和取證確定的竊電用戶。將用戶被抓獲的當月數(shù)據(jù)截取為黑名單,其余月份數(shù)據(jù)則丟棄。這是因為用戶可能在被檢測到之前的很長時間就開始竊電,而開始竊電的時間在客觀上未知的。白名單則難以確認,因為在每次排查后沒有記錄未竊電的用戶,且有的竊電行為具有時效性,沒有檢測到很可能是用戶及時隱藏了竊電證據(jù)。因此,白名單只能通過設定一些標準來大致篩選出來,以使得其中的黑名單噪聲盡量降低。根據(jù)過去經(jīng)驗,線損長期保持高位的臺區(qū)更有可能存在竊電現(xiàn)象,反之線損健康的區(qū)域竊電則較少。參考國家電網(wǎng)對線損異常問題的考核標準,文中將單月每天線損率均小于9%的臺區(qū)中的用戶均劃定為白名單。
1.2用電量時序處理
線損指標雖然可以用來大致識別臺區(qū)的用電健康情況,但是仍然沒有辦法定位到具體的用戶。用電量(包括日峰谷電量)作為用戶用電合理或異常的直接指標,對于判斷任何方式的竊電都有指導性的作用。以日均用電量為指標觀察黑名單用戶的用電趨勢。在檢測竊電前后(受理時間),用電量呈現(xiàn)上升趨勢。這是因為在受理時間前后用戶從竊電狀態(tài)向正常用電狀態(tài)發(fā)生了轉換,用電量恢復了正常。而研究者希望模型能夠在竊電行為一發(fā)生就能夠檢測到異常,即從竊電狀態(tài)向正常狀態(tài)轉換的各種下降趨勢,這里的處理方式是將黑名單的用電時序進行翻轉。白名單不具有這種變化趨勢,則不需要進行翻轉。
2模型構建
2.1整體設計
本文將竊電特征分為兩部分,其中用電量時序共包含93個特征,其余部分包含20個特征。對于前者,采用卷積神經(jīng)網(wǎng)絡LeNet-5進行學習,輸出0到1之間的竊電嫌疑,然后將該中間值與第二部分的特征合并,再采用雙隱含層的全連接網(wǎng)絡進行訓練,輸出最終的竊電嫌疑系數(shù)[10]。受到采集終端或傳輸線路的限制,竊電指標數(shù)據(jù)中會存在一些漏采或錯誤的項。同時,白名單中也會不可避免混雜著竊電用戶。相比傳統(tǒng)機器學習算法,卷積神經(jīng)網(wǎng)絡具有自動提取特征的能力,且對噪聲的抗干擾能力也更強,因此對有海量數(shù)據(jù)的非線性問題具有更強的泛化能力[11]。
2.2卷積神經(jīng)網(wǎng)絡
將采集的電力數(shù)據(jù)轉換成CNN處理的格式。CNN是由美國神經(jīng)生物學家Hubel和Wiesel首先提出的模仿人類大腦視覺原理的前饋神經(jīng)網(wǎng)絡。它在圖像識別方面有著非常廣泛的應用,但通過配置,它也能在自然語言處理、時間序列預測方面發(fā)揮作用。CNN與普通的全連接網(wǎng)絡不同,引入了卷積層和池化層。卷積層用于提取特征,通過權值共享的方式工作,可大大減少全連接網(wǎng)絡的權值數(shù)量。
卷積層包括若干個卷積核,與輸入層局部連接,用于掃描圖像或時序,每個卷積核都能從輸入中識別出不同角度的特征。池化層相當于濾波器,可對輸入進行降采樣,保留數(shù)據(jù)顯著特征的同時降低了結果的維度。CNN大大降低了全連接網(wǎng)絡的復雜性,因此對于存在位移的高維度時序數(shù)據(jù)有很高的效率。LeNet-5是由YannLeCun在1998年提出的一種結構簡單的CNN,它具有2個卷積層、2個池化層和3個全連接層,可用于高效地解決維度較少的時序預測問題。CNN包括輸入層,卷積層,池化層,全連接層和輸出層。
3實驗與分析
3.1模型配置
本文采用深度學習框架DL4J(DeepLearningforJava)來實現(xiàn)深度學習模型。這是一套基于Java語言的深度學習工具包,可以高效地構建、訓練和部署各種深度網(wǎng)絡,同時支持GPU和Spark集成[12]。本文的DNN-2模型配置兩個隱含層,節(jié)點數(shù)分別為15和5。輸出層節(jié)點個數(shù)為2,輸出值為one-hot形式,兩個值分別代表樣本歸屬于正常和竊電類別的概率。LeNet-5的卷積核大小設置為3×1,通道數(shù)為3,分別對應日均電量、峰電量、谷電量三個時間序列。
3.2實驗結果與分析
實驗數(shù)據(jù)來源于福建省用電采集系統(tǒng),包括福建省2015-2017三年的用電、線損和告警數(shù)據(jù)。經(jīng)過清洗、篩選和歸一化后,共約90萬條。實驗一首先對樣本全集采用十折交叉驗證,訓練集和測試集比例為7∶3。實驗二以15、16年的樣本作為訓練集,17年的作為測試集,以驗證模型對未來數(shù)據(jù)的預測能力。最終模型輸出按照竊電嫌疑排序的分級清單,以及每級的竊電嫌疑下限,這樣方便業(yè)務人員根據(jù)不同竊電嫌疑級別采取不同的應對措施。
模型的查準率也在下降,說明模型對有把握的樣本有更好的預測準確率,兩組實驗的Top100竊電查準率分別達到78%和83%。從效益和成本考慮,線上查準率一般需要達到20%以上時比較適合去現(xiàn)場巡查。實驗一的前6級結果符合需求,共檢測出565條竊電樣本,占測試集竊電總數(shù)的38.18%(查全率),綜合查準率為43.46%;實驗二的前6級共檢測出473條竊電樣本,查全率為33.43%,綜合查準率為36.38%。
上述結果表明,本文方法對黑名單中30%~40%具有明顯竊電特征的樣本具有很好的判斷能力,但對于其它樣本的分析能力不強,這可能是由于黑名單訓練樣本不足以及白名單不可避免引入的噪聲,導致收集的竊電行為特征不夠豐富。實驗二與實驗一結果的差距較小,說明模型對跨年度數(shù)據(jù)仍然具有很強的泛化能力,排除了對相同年度數(shù)據(jù)過擬合的可能。
4結束語
本文針對低壓用戶的竊電行為,進行特征工程構建。結合兩種深度學習網(wǎng)絡,對用電量時序采用卷積網(wǎng)絡,對用戶信息、臺區(qū)線損、告警異常采用全連接網(wǎng)絡進行分別訓練。通過福建省三年歷史數(shù)據(jù)的實驗結果表明,模型精準定位了部分竊電用戶,相較傳統(tǒng)人為觀測或線下隨機摸排的方式,具有較大的改進。
參考文獻:
[1]王亞東,高巖,金鋒.智能電表數(shù)據(jù)分析及應用綜述研究[J].信息技術,2015,39(2):64-68.
[2]曹敏,鄒京希,魏齡,等.基于RBF神經(jīng)網(wǎng)絡的配電網(wǎng)竊電行為檢測[J].云南大學學報:自然科學版,2018,40(5):872-878.
[3]青志明,張宏艷,龍漪瀾,等.基于載波異常監(jiān)測的竊電行為判斷方法[J].科學技術與工程,2018,18(20):246-251.
[4]劉盛,朱翠艷.應用數(shù)據(jù)挖掘技術構建反竊電管理系統(tǒng)的研究[J].中國電力,2017,50(10):181-184.
[5]李端超,王松,黃太貴,等.基于大數(shù)據(jù)平臺的電網(wǎng)線損與竊電預警分析關鍵技術[J].電力系統(tǒng)保護與控制,2018,46(5):143-151.
[6]曹崢,楊鏡非,劉曉娜.BP神經(jīng)網(wǎng)絡在反竊電系統(tǒng)中的研究與應用[J].水電能源科學,2011,29(9):199-202.
[7]周文婷,顧楠,王濤,等.基于數(shù)據(jù)挖掘算法的用戶竊電嫌疑分析[J].河南科學,2015,33(10):1767-1772.
[8]張瑞.基于用電信息數(shù)據(jù)挖掘的智能反竊電研究與應用[J].價值工程,2016,35(35):51-54.
[9]周飛燕,金林鵬,董軍.卷積神經(jīng)網(wǎng)絡研究綜述[J].計算機學報,2017,40(6):1229-1251.
相關期刊推薦:《計算機學報》雜志級別:科技統(tǒng)計源核心 北大核心 CSCD,主辦單位:中國技術經(jīng)濟學會,周期:旬刊,國內統(tǒng)一刊號:11-4688/T,國際標準刊號:1671-1815。復合影響因子:2.906,綜合影響因子:1.528。
SCISSCIAHCI