通過為客戶解決一個又一個項目的挑戰,體驗了不同機型與主控版本下的復雜條件,也不斷優化著產品的可配置型性,模型的抗干擾性。一開始有的項目甚至要做耗時數月的“數據大掃除”,不斷提高數據的準確性和可靠性。業界領先的95%的數據合格率就是這樣一點一滴提升而來的。
遠景的很多客戶都曾建立數字化系統,最后卻發現系統用不起來,追查原因都出奇地一致——最基本的數據準確性問題沒有解決,最多只能算算電量。
“你說設備連接起來就是物聯網?真沒這么簡單。一會兒電量表數據跳變、一會兒無連接,怎么監控?很多風機狀態都不準,敢不敢遠程復位?總之,如果物聯網的邊緣計算不可靠,人還是撤不下來。”EnOS™大數據平臺架構師閆博士直言不諱,“物聯網的CAP實踐難度比互聯網高許多,遠端網絡容錯度成倍降低,系統的一致性和可用性就必須更精細的平衡設計。數據模型上,以前在互聯網做大數據,本質上是離散數據管理,一單就是一單,哪里像傳感器數據,是連續數據,成千上萬設備要做到近乎任意時間維度的查詢、分析,這需要大量的抗干擾算法、告警算法,才能保證數據質量、甚至說起碼的系統功能。”
遠景持續七年的投入,攻克了無數細節上的魔鬼,近100GW項目的產品化積累,才和客戶肩并肩基本解決了數據連接、采集、運算、質量控制等難題,這些是數字化的基礎。
在接下來的數據分析上,機器學習無疑是最佳技術,但是如何能夠將機器學習和大數據結合起來,長期解決業務挑戰,而不是做一兩個樣板項目,做一兩項原來物理模型方法沒有的發現,這需要在組織上進行創新。
遠景基于EnOS™能源物聯網平臺開發的Ensight產品,基于2PB高質量數據和機器學習算法包,訓練設備健康度模型,衡量發電性能和設備健康度,提供關鍵部件的健康度預警與狀態維護提示,從而實現預測維護。Ensight Wind基于海量數據與機器學習技術,不斷優化算法,實現風機發電性能與設備亞健康狀態識別告警,進行預測維護,減少大部件故障造成的非計劃性停機損失,使故障風機提升等效利用77小時。
遠景一直很清楚,機器學習并不是挖幾個算法大牛就可以實現的。“幾年前我們也認為招些數據算法專家就可以發掘數據里的價值,但實踐發現學習能源領域的垂直領域知識很關鍵,否則傳統機器學習所發現的一些規律,對垂直領域來說,不過是常識,精度能不能做到極致先不論,僅一個不可解釋性就讓你舉步維艱。”EnOS™大數據平臺架構師閆博士說。
他找到的解決方法是讓機器學習的專家和領域技術骨干相互學習,每兩周舉辦一次培訓,讓機器學習的人弄明白能源領域的理論知識,“不僅是文字表達的講懂,更要把里面的數學模型、物理模型公式都看懂”。反過來原來的領域專家則要學習python語言和算法包,還要參加軟件培訓,大家做真正的“跨界”人才,用閆博士的話說就是“讓大氣動力學的領域專家學神經網絡,讓神經網絡專家搞懂流體力學。”