本發明屬于城市供水領域,涉及一種基于圖神經網絡(graph?neural?network,gnn)的供水管網水質實時預測方法,尤其涉及一種基于雙流-圖卷積網絡的供水管網全域水質預測方法。該方法利用圖卷積網絡技術,對供水管網中未監測節點的水質進行精準預測,可應用于水質監測與調度優化等場景。
背景技術:
1、城市供水管網作為提供居民和工業用水的基礎設施,其供水水質(如余氯)直接關系到飲用水安全。監測和預測管網中各節點的水質濃度對于及時發現水質問題、防控微生物污染至關重要。然而,傳統的水力和水質模擬方法(如epanet軟件)需要大量精確的管道物理屬性參數(如粗糙度、節點需水量)進行標定,且管網運行條件隨時間變化,導致模型標定困難。此外,傳感器部署成本高昂,管網中實際監測點很少,無法獲取完備的時空數據。這些因素使得基于物理模型的水質預測在實際工程中難以保證精度和實時性。
2、近年來,機器學習方法,尤其是圖神經網絡(gnn),因能夠結合管網拓撲信息進行學習而受到關注。有gnn方法通過學習歷史監測數據和管網結構信息,在水力狀態估計和水質預測方面取得了一定進展。但是,大多數現有方法采用無向圖結構,默認信息雙向傳播,忽略了管網中水流的單向傳遞特性。同時,這些方法常聚焦空間相關性,對管網中水質隨時間衰減的過程關注不足;加之監測數據稀疏,模型對遠離傳感器區域的預測能力有限。因此,亟需一種能夠顯式利用上下游流向信息、并兼顧時空依賴關系的預測模型,以提高在稀疏監測條件下的水質預測精度。
技術實現思路
1、為克服上述技術缺陷,本發明提供了一種基于雙流-圖卷積網絡(dual-streamgraph?convolutional?network,dgcn)的供水管網水質實時預測方法。該方法構建有向圖的管網模型,分別提取上游和下游方向的信息流,通過并行圖卷積模塊進行特征學習,并在訓練時引入隨機掩碼機制以模擬傳感器缺失,從而實現對稀疏監測條件下水質濃度的準確預測。與現有無向或單向信息傳播的模型相比,本方法可顯著提高遠離傳感器節點的預測準確性。
2、為了實現上述目的,本發明采用的技術方案為:
3、一種基于雙流-圖卷積網絡的供水管網全域水質預測方法,所述供水管網全域水質預測方法包括以下步驟:
4、步驟(1),收集水質監測節點的水質數據;
5、在供水管網中,節點分為監測節點和非監測節點。由于成本限制,只能在較少的管網節點上布置傳感器,布置傳感器的節點作為監測節點,通過傳感器監測節點的水質信息,通過在供水管網中布設的有限數量傳感器,采集節點的水質濃度時間序列數據。期望利用布置傳感器的監測節點的歷史tc時間內監測的水質數據,預測下一時刻管網中所有節點(包括有傳感器布置的監測節點和沒有傳感器布置的非監測節點)的水質濃度。
6、對于布置傳感器的監測節點,利用歷史tc時間內監測的水質數據作為監測節點的節點屬性。對于沒有布置傳感器的非監測節點,可以用0來代替作為節點屬性特征(即水質濃度信息),定義包含了管網n個節點(包含監測節點和非監測節點)的nc個水質時序數據信息,tc表示所需的用于預測下一時刻水質信息所需的歷史水質數據時長,nc為tc時間內收集的水質數據(采樣頻率會影響同一時段采樣的數目)。根據本發明經驗,可以選擇過去兩小時的水質數據來預測下一時刻的水質信息。
7、步驟(2),構建管網有向圖;
8、步驟(2.1),對供水管網進行抽象表示,將管網節點視為圖節點,管道視為有向邊,有向邊的方向依據實際水流方向從上游指向下游。利用傳統的水力和水質模擬軟件epanet進行水力建模,收集管網的空間拓撲結構信息和水流向信息,構建有向圖的鄰接矩陣從而在有向圖中明確編碼水質傳播的因果關系。
9、所述的有向圖的鄰接矩陣的行列分別對應管網中的所有節點(包括監測節點和非監測節點,沒有特殊說明情況下,后續描述中節點均指代所有節點),其中aij是鄰接矩陣a中第i行、第j列的元素,表示節點i是否有水流流向節點j。當有水流從節點i流向節點j時,aij=1,否則,aij=0。同時,根據該鄰接矩陣a可得到其轉置矩陣at,用于提取下游節點對上游節點狀態的輔助信息。
10、步驟(2.2),為防止高度連接節點引入偏置,在鄰接矩陣中加入自環,并按入度、出度對鄰接矩陣進行歸一化處理,確保信息在圖上傳播時不會過度集中于網絡的主干節點,如公式(1)、(2)所示:
11、
12、其中,是歸一化后的上游鄰接矩陣;是歸一化后的下游鄰接矩陣;i是單位矩陣,表示自環的添加;din是節點入度的對角矩陣,其對角元素表示每個節點的入度(即水流流入該節點的管道數目);dout是節點出度的對角矩陣,起對角元素表示每個節點的出度(即從該節點流出的管道數目)。
13、步驟(3),構造雙流-圖卷積網絡。
14、設計一個雙流-圖卷積網絡(dgcn),對步驟(2)構建的有向圖進行特征提取。所述dgcn架構包含l個卷積層的雙流-圖卷積操作,每層對應一次信息的局部傳遞。理論上,l應能夠覆蓋所有節點到監測節點之間的最遠距離(“距離”指的是節點之間的最短路徑上的管道數量,而非物理長度),使得信息能夠由監測節點沿有向圖結構充分傳播。l的取值應滿足能夠覆蓋有向圖中所有節點到最近監測節點之間的最大最短路徑管道數。具體而言,首先計算管網中每一個節點到最近監測節點之間的最短路徑(以管道條數為單位,對于監測節點自身,其到最近監測節點的距離定義為0),然后取所有節點的最短路徑中的最大值作為l的取值,使最遠節點也能通過多層卷積獲得監測數據的間接影響。若l設置過小,遠端節點無法有效接收到全局信息;若l過大,則可能引入噪聲和過擬合風險。
15、步驟(3.1),初始時,輸入步驟(1)中收集的歷史水質濃度作為dgcn的節點特征,其中n是供水網絡中節點數量,nc對應輸入時間步數;這些節點特征通過第一層卷積層被投影到一個高維隱藏狀態空間η(1)∈rn×m中,其中m是隱藏狀態η的擴展維度。m影響網絡對復雜空間—時序特征的表達能力,通常在保證表達能力的前提下,兼顧計算效率和實際數據量。維度過小將限制模型表達力,過大則增加參數規模與計算復雜度。m可通過交叉驗證或經驗法則選擇,常見取值為64、128、256等。本發明中選擇m=128。后續卷積層保持該隱藏狀態維度,分別對上游和下游鄰接矩陣應用雙流-圖卷積,如公式(3)所示:
16、
17、其中,h(l)是第l層卷積網絡的隱藏狀態,和是分別用于上游和下游卷積的神經網絡學習參數,relu是非線性激活函數,h(l+1)是第l+1層卷積網絡的隱藏狀態。
18、該雙流-圖卷積網絡(dgcn)明確編碼了雙向的水力依賴關系,同時保持了流向的方向性:既保持了水流方向的單向性,又能夠捕獲上游對下游的因果影響和下游對上游的反饋信息(用于提高水質預測模型對稀疏區域的感知能力)。
19、步驟(3.2),多層卷積后,在最后一層卷積層之后串聯兩層全連接層,將隱藏狀態進一步降維映射到輸出維度,即輸出每個節點下一個時刻的水質濃度。
20、步驟(4)訓練基于雙流-圖卷積網絡的管網水質預測模型;
21、在實際供水管網中,監測節點(即安裝有傳感器的節點)數量有限,導致觀測數據存在稀疏性。為提高水質預測模型在監測數據稀疏條件下的泛化能力,本發明在模型訓練階段引入了隨機掩碼機制。
22、步驟(4.1),在實際供水管網中,監測節點(即安裝有傳感器的節點)數量有限,導致觀測數據存在稀疏性。為提高水質預測模型在監測數據稀疏條件下的泛化能力,本發明在模型訓練階段引入了隨機掩碼機制。
23、在每一個訓練批次中,針對所有監測節點(即所有安裝有傳感器并能提供觀測數據的節點),隨機選擇一部分監測節點作為“掩碼節點”。對于這些被選中的掩碼節點,將其輸入特征全部置零,等價于在本批次中模擬這些節點未觀測到數據的情況。未被掩碼的監測節點則正常輸入真實觀測數據。該掩碼操作在每一個訓練批次中動態變化,使模型能夠在多種不同的數據缺失模式下進行學習。
24、在模型訓練過程中,無論監測節點是掩碼節點還是未掩碼節點,其預測誤差均被納入損失函數計算。這樣能夠促使模型主動挖掘節點之間的相關性,實現對未監測節點的水質指標的有效預測。根據實驗結果,本發明采用50%的監測節點作為隨機掩碼節點,可以取得最佳的預測魯棒性和平衡效果。
25、步驟(4.2),利用步驟(4.1)中的訓練數據策略,并且采用平均絕對誤差(mae)作為損失函數,計算方式為所有監測節點的預測值與真實值差的絕對值平均,如公式(4)所示:
26、
27、其中,lprediction表示預測損失;是模型預測的監測節點s的水質濃度;ys表示為實際觀測的監測節點s的水質濃度;s是所有布置傳感器的監測節點的集合。
28、步驟(4.3),本水質預測模型采用一步預測模式:本發明提出的上述步驟4.2中訓練后的水質預測模型,利用步驟1中各監測節點過去tc時間內的水質濃度歷史數據,預測下一時刻管網中所有節點的水質濃度。
29、步驟(4.4),為了評估水質預測模型的預測準確性和可靠性,采用四項評價指標衡量模型性能:mae(平均絕對誤差)、mape(平均絕對百分比誤差)、nse(nash-sutcliffe效率系數)和corr(相關系數)。具體的,mae反映平均誤差量級,mape衡量相對誤差比重,nse評價預測值與觀測值方差的擬合優度(范圍[-∞,1],越接近1越好),corr反映預測序列和真實序列的線性相關性,公式如下:
30、
31、
32、其中,n是所有節點和時間步長的預測總數;和y是水質預測值和真實值;和是預測的水質平均值和真實的水質平均值。
33、本發明的有益效果包括:
34、(1)本發明提出的雙流-圖卷積水質預測模型,顯式建模了供水管網的上游與下游流向信息,僅需少量監測節點即可實現對全網所有節點水質濃度的準確預測。即使在遠離傳感器的區域,也能保持較高預測精度,顯著提升了水質預測模型在監測數據稀疏條件下的實用性和覆蓋能力。
35、(2)本發明采用雙流-圖卷積結構與動態掩碼訓練機制,提升了水質預測模型對不同監測節點布設方式的適應性和泛化能力,適用于多種規模與結構的供水系統,有效增強了對管網復雜性的魯棒性。
36、(3)本發明構建的水質預測模型具備響應速度快的特點,能夠結合歷史監測數據與網絡結構信息,實現水質的實時預測,適用于水質監測、異常預警和智能調控等多種場景,有助于提升供水系統的運行效率與管理水平。