在學(xué)習(xí)如何編程方面,我最喜歡的部分之一就是發(fā)現(xiàn)開源軟件的功能。奇怪的是,每當(dāng)您準(zhǔn)備進(jìn)入一個新項目,構(gòu)建一個新工具或進(jìn)行一些新分析時,就有人曾經(jīng)想到過該項目-或類似的東西。圍繞您的主題或選擇問題進(jìn)行清晰定義的Google搜索通常會產(chǎn)生大量有用的博客文章,軟件包和Github信息庫,這些信息由聰明的付費(fèi)人員創(chuàng)建。
開發(fā)開源項目最困難的部分是它們是公共物品,每個人都從中受益,但是創(chuàng)作者很少能從作品提供的全部價值中獲得補(bǔ)償。真正好的作品通常是某個學(xué)位的副產(chǎn)品,直接由一筆贈款提供資金,或者是由一家科技公司以善意的形式發(fā)布的,該公司可以負(fù)擔(dān)分享一些它認(rèn)為與醬汁無關(guān)的秘密(例如Apache Spark或Facebook的Prophet) )。
以我在可再生能源方面的背景,我對將數(shù)據(jù)科學(xué)應(yīng)用于能源轉(zhuǎn)換,或者更具體地說,是如何管理可再生能源發(fā)電并入電網(wǎng)特別感興趣。該領(lǐng)域中的一些常見問題包括電力負(fù)荷預(yù)測,太陽能和風(fēng)能發(fā)電預(yù)測,整體電力系統(tǒng)建模(以衡量整個電網(wǎng)的性能)和電池優(yōu)化模型(重要的是擁有智能系統(tǒng)來管理儲能解決方案以實現(xiàn)最大化可再生能源的好處)。在轉(zhuǎn)向數(shù)據(jù)科學(xué)的過程中,我偶然發(fā)現(xiàn)了其中一些項目,并希望分享一些。
電力基因組計劃
公用事業(yè),項目開發(fā)商,倡導(dǎo)組織和其他電網(wǎng)利益相關(guān)者在工作中強(qiáng)烈需要電力系統(tǒng)建模。隨著風(fēng)能和太陽能繼續(xù)搶占市場份額,我們需要了解如何規(guī)劃和運(yùn)營具有高比例的可變可再生能源的電網(wǎng)。這種初步分析稱為容量擴(kuò)展計劃,這對于某些利益相關(guān)者來說是一個巨大的障礙,因為它通常需要大量資源,復(fù)雜且耗時。顯然需要一種工具,以使資源受限的可再生能源倡導(dǎo)者能夠測試容量擴(kuò)展計劃并創(chuàng)建支持其觀點(diǎn)所需的數(shù)據(jù)。
專注于能源轉(zhuǎn)換對環(huán)境的影響的數(shù)據(jù)科學(xué)家Greg Schively正在使用贈款創(chuàng)建“電力基因組計劃”。這個開源項目將允許用戶在美國的特定區(qū)域進(jìn)行磨練,并考慮到各種基本變量,例如現(xiàn)有發(fā)電成本,傳輸限制,預(yù)計燃料成本,負(fù)載曲線等。它還允許用戶通過集群生成,根據(jù)其特定項目進(jìn)行修改,以調(diào)整各種粒度級別的設(shè)置。
該項目目前面向#EnergyTwitter明星Jesse Jenkins的GenX項目,但很快將變得更加廣泛,使可再生能源倡導(dǎo)者或需要電力系統(tǒng)建模的任何人都可以利用這些工具來支持能源轉(zhuǎn)型。
鏈接:https://github.com/gschivley/PowerGenome
電力系統(tǒng)優(yōu)化模型可用于探索未來能源系統(tǒng)中不同法規(guī)的成本和排放影響。運(yùn)行這些模型最困難的部分之一就是組裝所有數(shù)據(jù)。一個典型的模型將定義幾個區(qū)域,每個區(qū)域都需要以下數(shù)據(jù):
- 所有現(xiàn)有的發(fā)電機(jī)組(可能在每個區(qū)域內(nèi)分為幾個離散的群集)
- 區(qū)域之間的傳輸限制
- 每小時負(fù)荷概況(包括車輛和建筑物電氣化產(chǎn)生的新負(fù)荷)
- 每小時的風(fēng)能和太陽能發(fā)電概況
- 新發(fā)電機(jī)組的成本估算
由于計算復(fù)雜性和運(yùn)行時間隨區(qū)域數(shù)量和生成單元群集的增加而增加,因此用戶可能只希望分解區(qū)域和生成單元,使其靠近主要關(guān)注區(qū)域。例如,一項針對新墨西哥州清潔電力法規(guī)的研究可能會將西北太平洋的多個州合并為一個地區(qū),同時還將亞利桑那州的聯(lián)合循環(huán)機(jī)組拆分為多個組。
PowerGenome的目標(biāo)是讓用戶在設(shè)置文件中進(jìn)行所有這些選擇,然后運(yùn)行一個腳本來生成電源系統(tǒng)模型的輸入文件。PowerGenome當(dāng)前為GenX生成輸入文件,我們希望在不久的將來擴(kuò)展到其他模型。
公用事業(yè)數(shù)據(jù)解放(PUDL)
所有數(shù)據(jù)科學(xué)家都知道,查找,組織和清除特定項目所需的數(shù)據(jù)非常耗時,并且通常是成功項目的最大障礙。對于能源行業(yè)來說尤其如此,聯(lián)邦能源管理委員會(FERC),能源信息管理局(EIA)和許多其他組織在能源行業(yè)中發(fā)布了許多有用的數(shù)據(jù),但格式和標(biāo)準(zhǔn)不同。
催化劑合作社(Catalyst Cooperative)是一小組由數(shù)據(jù)科學(xué)家和政策工作者組成的小組,由工人擁有的咨詢公司組織,已創(chuàng)建了公用事業(yè)數(shù)據(jù)解放(PUDL)項目來解決此問題。用他們的話來說,PUDL“ 通過清洗,標(biāo)準(zhǔn)化和交叉鏈接來自單個數(shù)據(jù)庫中不同來源的實用程序數(shù)據(jù),獲取已經(jīng)公開可用的信息,并使之可公開使用。” PUDL數(shù)據(jù)庫當(dāng)前包含有關(guān)燃料使用,發(fā)電混合,電廠運(yùn)行成本的數(shù)據(jù),甚至包括環(huán)境保護(hù)署(EPA)的排放數(shù)據(jù)。該團(tuán)隊還著眼于添加幾個新的數(shù)據(jù)集。
這個團(tuán)隊正在解決一個巨大的問題:組織所有這些數(shù)據(jù)并將其轉(zhuǎn)換為機(jī)器可讀的格式。與Power Genome項目(使用PUDL)類似的精神,Catalyst合作社旨在降低能源系統(tǒng)分析的進(jìn)入壁壘,并使這些資源可供所有人使用。
鏈接:https://github.com/catalyst-cooperative
pyiso
要求獨(dú)立系統(tǒng)運(yùn)營商(ISO)負(fù)責(zé)運(yùn)營批發(fā)電力市場并平衡不同地區(qū)的電網(wǎng)電力,它們必須以15個間隔發(fā)布負(fù)荷數(shù)據(jù)。但是,收集此數(shù)據(jù)需要不方便的Web抓取和下載CSV文件的混合。
WattTime是一個非營利性組織,它收集實時ISO數(shù)據(jù),并使電力消費(fèi)者能夠在電網(wǎng)中可再生能源百分比最高的時候使用能源。WattTime開源了PYISO庫,該庫為其API提供了強(qiáng)大的支持,使任何人都可以方便地訪問歷史和實時負(fù)載以及生成數(shù)據(jù)。實際上,我使用該庫創(chuàng)建了Peaky Finders,這是NYISO(紐約ISO)的峰值負(fù)荷預(yù)測應(yīng)用程序,為我節(jié)省了很多時間和頭痛。
與PUDL相似,PYISO的創(chuàng)建者意識到有必要對實用程序和ISO需要發(fā)布的數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化。盡管年齡不大,但我發(fā)現(xiàn)創(chuàng)始人的播客集對學(xué)習(xí)項目背后的背景和原理很有幫助。
鏈接:https://github.com/WattTime/pyiso
其他一些
其他值得提及的項目:
WindML
- 提供對風(fēng)能數(shù)據(jù)源的訪問以進(jìn)行發(fā)電量預(yù)測和其他應(yīng)用
- 鏈接:https://github.com/cigroup-ol/windml
虛擬圖書館
- 一個開源工具,可模擬光伏(太陽能)能源系統(tǒng)的性能。
- 鏈接:https **: **//github.com/pvlib/pvlib-python
OSESMO
- 電池優(yōu)化建模是一個巨大的挑戰(zhàn),因為能量存儲資源不斷增加,以最大限度地提高可再生能源的發(fā)電量-這是一個幫助入門的開源工具。
- 鏈接:https://github.com/RyanCMann/OSESMO