Power Consumption Prediction and Power-Aware Packing in Consolidated Environments

針對(duì)問(wèn)題:整合工作負(fù)載來(lái)降低能耗。有效利用整合技術(shù),表征characterize應(yīng)用程序的能耗。這種表征對(duì)于有效預(yù)測(cè)和實(shí)施數(shù)據(jù)中心內(nèi)對(duì)能耗的適當(dāng)限制——能耗預(yù)算至關(guān)重要

提出模型:定義兩種電力預(yù)算:1)平均預(yù)算以捕獲該水平上長(zhǎng)期能耗的上限; 2)維持預(yù)算,以捕獲超過(guò)一定閾值的持續(xù)消耗電流的任何限制。使用簡(jiǎn)單的測(cè)量基礎(chǔ)結(jié)構(gòu),我們可以得出功耗曲線,即對(duì)應(yīng)用程序功耗的統(tǒng)計(jì)描述?;趯?duì)多個(gè)應(yīng)用程序(包括單個(gè)和合并應(yīng)用程序)進(jìn)行分析,開(kāi)發(fā)了用于預(yù)測(cè)合并應(yīng)用程序的平均和持續(xù)功耗的模型。在基于Xen的服務(wù)器上進(jìn)行了實(shí)驗(yàn)評(píng)估,該服務(wù)器整合了從不同池中提取的應(yīng)用程序。對(duì)于各種整合方案,我們能夠預(yù)測(cè)平均功耗在5%的誤差范圍內(nèi),而持續(xù)功耗在10%的誤差范圍內(nèi)。通過(guò)使用預(yù)測(cè)技術(shù),我們可以確保安全而有效的系統(tǒng)運(yùn)行-在典型情況下,我們可以通過(guò)選擇滿(mǎn)足要求的適當(dāng)電源狀態(tài),將服務(wù)器上整合的應(yīng)用程序數(shù)量從兩個(gè)增加到三個(gè)(與現(xiàn)有的基準(zhǔn)技術(shù)相比)與服務(wù)器關(guān)聯(lián)的電源預(yù)算。


能耗預(yù)算——能耗的上限。

合并應(yīng)用程序功耗對(duì)于整合平臺(tái)的節(jié)能操作和管理是有用的。 1.有助于對(duì)合并環(huán)境中的能耗預(yù)測(cè)和控制。 2有助于在能源成本和應(yīng)用程序性能之間權(quán)衡。3.使數(shù)據(jù)中心在有利可圖的體制下運(yùn)營(yíng),不會(huì)受到積極整合可能引起的電涌影響。 4.正在進(jìn)行的制定功率基準(zhǔn)的工作也將從這種表征中受益[38]。

合并可能會(huì)在多個(gè)空間粒度上發(fā)生,范圍從單個(gè)服務(wù)器上的多個(gè)應(yīng)用程序并置到工作負(fù)載轉(zhuǎn)移到服務(wù)器機(jī)架或機(jī)房的子集。相應(yīng)地,在這些級(jí)別中的每個(gè)級(jí)別上都需要表征功耗。在所有這些級(jí)別上,功耗的兩個(gè)方面特別重要。首先,子系統(tǒng)內(nèi)的長(zhǎng)期平均功耗(數(shù)分鐘至數(shù)小時(shí))決定了運(yùn)行該子系統(tǒng)所涉及的能源成本。其次,維持消耗功率超過(guò)與保險(xiǎn)絲/斷路器相關(guān)聯(lián)的閾值的可能性(通常為數(shù)秒甚至是亞秒的持續(xù)時(shí)間)嚴(yán)重影響受這些元件保護(hù)的設(shè)備的安全運(yùn)行。熱效應(yīng)也會(huì)增加對(duì)這兩個(gè)預(yù)算的需求。在較粗的空間粒度(例如房間)下,可能需要降低平均功率以避免過(guò)多的熱量。對(duì)于較小的組件(例如芯片),必須在更短的時(shí)間范圍內(nèi)控制功耗。在本文中,我們描述了單個(gè)應(yīng)用的功率需求,并利用這些特征來(lái)預(yù)測(cè)合并應(yīng)用的平均和持續(xù)功率需求。

(a)CPU飽和程序合并,(b)CPU非飽和-CPU飽和程序合并。兩者能耗行為不同。

整合環(huán)境中的平均功耗和維持功耗取決于各個(gè)應(yīng)用程序的功耗以及資源使用模式。 功耗預(yù)測(cè)需要識(shí)別這些依賴(lài)性。 此外,預(yù)測(cè)的成功還取決于用于測(cè)量和表征個(gè)人消費(fèi)的方法。 可以解決這些問(wèn)題的測(cè)量技術(shù)和預(yù)測(cè)模型的設(shè)計(jì)是本文的重點(diǎn)。


決定合并決策的時(shí)間尺度(與工作負(fù)載特性變化有關(guān))后,需要將能耗限制在應(yīng)用程序性能/收入和能源成本之間。 這種決策可能每隔幾分鐘或幾小時(shí)執(zhí)行一次(作為long-term),可能涉及解決復(fù)雜的優(yōu)化問(wèn)題,以平衡通過(guò)操作一部分資源產(chǎn)生的性能/收入 花費(fèi)在維護(hù),操作電源和冷卻上的費(fèi)用。 無(wú)論此決策有何細(xì)微差別,它都需要建立各種級(jí)別的長(zhǎng)期能源消耗限制機(jī)制。 我們將這種限制稱(chēng)為通過(guò)合并技術(shù)分配給它的平均功率預(yù)算。

維持功率預(yù)算,是由數(shù)據(jù)中心中與該組件關(guān)聯(lián)的保險(xiǎn)絲或斷路器所定義的各種硬件組件的可靠性需求產(chǎn)生的。(也叫做peak power)數(shù)據(jù)中心中硬件組件的持續(xù)功率預(yù)算由該組件中部署的斷路器的時(shí)間-電流特性曲線表示。

一個(gè)Amp斷路器的時(shí)間-電流特性曲線。X軸表示從電路汲取的電流,Y軸表示在斷路器跳閘之前電流持續(xù)的時(shí)間

數(shù)據(jù)中心中硬件組件的維持功率預(yù)算由該組件中部署的斷路器的時(shí)間-電流特性曲線表示。斷路器的時(shí)間-電流特性曲線可作為其規(guī)格表的一部分獲得。持續(xù)功率預(yù)算由元組(S,L)表示,表示在長(zhǎng)度L的任何間隔內(nèi)維持的最大電流S的界限。我們引用單個(gè)持續(xù)功率元組來(lái)表示電路的持續(xù)功率預(yù)算。由于維持能耗對(duì)應(yīng)于在一個(gè)時(shí)間間隔內(nèi)連續(xù)保持的最大功率,因此我們用使用該時(shí)間間隔的有效功率來(lái)表示維持能耗。但是我們的預(yù)測(cè)技術(shù)足夠通用,可以合并指定時(shí)間間隔內(nèi)功耗的其他統(tǒng)計(jì)范圍,包括最大和平均功耗。


2.離線分析能耗

將萬(wàn)用表連接到脫機(jī)的服務(wù)器,并每tp時(shí)間單位測(cè)量一次服務(wù)器的能耗。所產(chǎn)生的(瞬時(shí))能耗樣本時(shí)序稱(chēng)為應(yīng)用程序的能耗曲線。將能耗曲線轉(zhuǎn)化為能耗使用分布圖。

w^{I_p}_A代表應(yīng)用程序A在Ip時(shí)間內(nèi)的平均能耗。通過(guò)在功率分布圖上移動(dòng)大小為Ip的時(shí)間窗口,然后根據(jù)這些值構(gòu)造分布來(lái)進(jìn)行估算。圖3示出了將功率簡(jiǎn)檔轉(zhuǎn)換成功率使用分布的過(guò)程。作為配置文件的一部分,我們還分析了運(yùn)行應(yīng)用程序的服務(wù)器的空閑功率(對(duì)于我們的服務(wù)器,約為156 W)。


將能耗曲線轉(zhuǎn)化為能耗使用分布圖

**保證工作負(fù)載的現(xiàn)實(shí)性和可行性。數(shù)據(jù)中心中應(yīng)用程序是獨(dú)立啟動(dòng)的,并且工作負(fù)載要在一定時(shí)間粒度上(每日周期)是重復(fù)的。


3.3實(shí)驗(yàn)

在本節(jié)中,我們將介紹各種應(yīng)用程序,以說(shuō)明推導(dǎo)應(yīng)用程序功耗行為的過(guò)程。 我們還將介紹有關(guān)資源使用和性能的選定信息。 這些實(shí)驗(yàn)為我們提供了許多關(guān)鍵的見(jiàn)解:1)應(yīng)該如何進(jìn)行離線分析; 2)應(yīng)用程序的能耗與其各種資源的使用之間的關(guān)系; 和3)這些應(yīng)用的能耗變化程度。

我們的測(cè)試平臺(tái)由幾臺(tái)Dell PowerEdge服務(wù)器組成(詳細(xì)信息顯示在表1中)。 我們使用這些服務(wù)器之一來(lái)運(yùn)行我們分析的應(yīng)用程序。 我們將Signametrics SM2040萬(wàn)用表(詳細(xì)信息在表2中)串聯(lián)連接到該服務(wù)器的電源。 萬(wàn)用表位于另一臺(tái)服務(wù)器的PCI總線上,僅用于記錄目的。 該萬(wàn)用表能夠每毫秒記錄一次功耗。 每個(gè)記錄的功耗是每毫秒的有效(或均方根)功率。

觀察1.非CPU飽和應(yīng)用程序的功率分布的方差比CPU飽和應(yīng)用程序的方差高(和更長(zhǎng)的拖尾)。

觀察2.非CPU飽和的應(yīng)用程序,在較低的功耗狀態(tài)下,CPU利用率會(huì)提高,并且電源分配的突發(fā)性會(huì)降低。

觀察3.CPU飽和和非CPU飽和的應(yīng)用程序,在不同的CPU功率狀態(tài)下工作時(shí),功率性能的權(quán)衡差異很大。 盡管很容易預(yù)測(cè)CPU飽和的應(yīng)用程序,但非CPU飽和的應(yīng)用程序預(yù)測(cè)難度大。

觀察4.在同時(shí)放置CPU飽和的應(yīng)用程序與同時(shí)放置CPU飽和和非CPU飽和的應(yīng)用程序時(shí),平均能耗存在顯著差異。

觀察5.合并應(yīng)用程序的維持功耗表現(xiàn)與平均功耗顯著不同。


缺點(diǎn)(A)是由于假設(shè)CPU處于飽和狀態(tài):首先,基線方法無(wú)法捕獲CPU在給定長(zhǎng)度L的某些持續(xù)時(shí)間內(nèi)的某些時(shí)間處于空閑狀態(tài)的可能性。任何此類(lèi)持續(xù)時(shí)間都不應(yīng)視為違反持續(xù)功率的持續(xù)時(shí)間 發(fā)生預(yù)算(回想一下,我們假設(shè)持續(xù)預(yù)算大于閑置電量)。

缺點(diǎn)(B):假設(shè)能耗是平穩(wěn)的。對(duì)于CPU飽和的程序是這樣,對(duì)于CPU非飽和的程序,能耗變化很大。

缺點(diǎn)(C):忽略了CPU使用率的差異。假定應(yīng)用程序?qū)⑹冀K完全按照其CPU分配使用CPU。盡管此假設(shè)對(duì)于一組并置的CPU飽和的應(yīng)用程序(它們的CPU使用模式不表現(xiàn)出可變性)是正確的,但當(dāng)甚至有一個(gè)應(yīng)用程序不遵循這種行為時(shí),它也會(huì)引入不準(zhǔn)確性。 特別是,在預(yù)測(cè)由一個(gè)或多個(gè)非CPU飽和的應(yīng)用程序組成的集合的持續(xù)電源行為時(shí),它會(huì)變得不準(zhǔn)確(當(dāng)這些應(yīng)用程序因I / O活動(dòng)而被阻塞時(shí),那些空閑時(shí)間很可能會(huì)被其他并置的應(yīng)用程序使用,從而導(dǎo)致 在與Rcpu為應(yīng)用程序指定的CPU分配不同的CPU分配中)。


合并設(shè)置中應(yīng)用程序的CPU使用率主要取決于兩件事:1)合并設(shè)置中應(yīng)用程序的CPU預(yù)留,以及2)應(yīng)用程序的CPU需求(長(zhǎng)度L的整個(gè)周期)。 當(dāng)預(yù)留量高于需求時(shí),則意味著該應(yīng)用程序具有備用CPU,可供預(yù)留量小于其需求的其他應(yīng)用程序使用。 大多數(shù)基于預(yù)留的調(diào)度程序(如我們的調(diào)度程序)在這些有需要的應(yīng)用程序之間平均分配備用CPU。 我們對(duì)合并設(shè)置中應(yīng)用程序的CPU使用率的估計(jì)已考慮到上述因素。 我們首先構(gòu)建分?jǐn)?shù)CPU需求的分布??梢栽陂L(zhǎng)度L的持續(xù)時(shí)間內(nèi)對(duì)每個(gè)應(yīng)用程序進(jìn)行修改。這些分布可以很容易地從應(yīng)用程序的CPU使用情況配置文件中得出。


多服務(wù)器的持續(xù)能耗預(yù)算

目標(biāo)——計(jì)算一個(gè)PDU上m個(gè)服務(wù)器在S功率單元L長(zhǎng)度下的概率Pr_{B1,B2,...Bm}(S,L)。PDU的最小能耗值等于所有服務(wù)器平均能耗之和。

PDU的最大功率計(jì)算:

步驟1。 找出長(zhǎng)度為L(zhǎng)個(gè)時(shí)間單位的時(shí)間間隔內(nèi)單個(gè)服務(wù)器(連接到PDU)的平均能耗分布。

第2步。 將所有這些平均能耗分布相加。 假設(shè)個(gè)人消費(fèi)是獨(dú)立的(一個(gè)合理的假設(shè)),則合計(jì)的最終分布可以根據(jù)基本概率理論進(jìn)行計(jì)算。


總結(jié)

我們需要確保在企業(yè)級(jí)數(shù)據(jù)中心中整合應(yīng)用程序的新興技術(shù)表現(xiàn)出強(qiáng)大且可預(yù)測(cè)的功耗行為,從而激發(fā)了我們的工作動(dòng)力。 整合工作負(fù)載已成為抑制企業(yè)級(jí)數(shù)據(jù)中心內(nèi)快速增長(zhǎng)的能源支出的關(guān)鍵機(jī)制。 但是,在可以有效利用這些基于整合的技術(shù)之前,我們必須能夠預(yù)測(cè)并強(qiáng)制執(zhí)行數(shù)據(jù)中心內(nèi)各個(gè)級(jí)別的功耗限制。 特別是,發(fā)現(xiàn)兩種電力預(yù)算(在相對(duì)粗略的時(shí)間尺度上定義的平均預(yù)算和在較短的時(shí)間尺度上定義的持續(xù)預(yù)算)對(duì)于數(shù)據(jù)中心的安全和盈利運(yùn)營(yíng)至關(guān)重要。

我們的研究針對(duì)服務(wù)器和一組服務(wù)器上共存的應(yīng)用程序組的平均和持續(xù)功耗開(kāi)發(fā)了預(yù)測(cè)模型。 我們?cè)诨赬en的平臺(tái)上實(shí)施了我們的技術(shù),并在各種整合設(shè)置中對(duì)其進(jìn)行了評(píng)估。 我們演示了這些預(yù)測(cè)技術(shù)如何使我們能夠?qū)崿F(xiàn)高效而安全的系統(tǒng)運(yùn)行。

合并設(shè)置中應(yīng)用程序的CPU使用率主要取決于兩件事:1)合并設(shè)置中應(yīng)用程序的CPU預(yù)留,以及2)應(yīng)用程序的CPU需求(長(zhǎng)度L的整個(gè)周期)。 當(dāng)預(yù)留量高于需求時(shí),則意味著該應(yīng)用程序具有備用CPU,可供預(yù)留量小于其需求的其他應(yīng)用程序使用。 大多數(shù)基于預(yù)留的調(diào)度程序(如我們的調(diào)度程序)在這些有需要的應(yīng)用程序之間平均分配備用CPU。 我們對(duì)合并設(shè)置中應(yīng)用程序的CPU使用率的估計(jì)已考慮到上述因素。 我們首先構(gòu)建分?jǐn)?shù)CPU需求的分布-

可以在長(zhǎng)度L的持續(xù)時(shí)間內(nèi)對(duì)每個(gè)應(yīng)用程序進(jìn)行修改。這些分布可以很容易地從應(yīng)用程序的CPU使用情況配置文件中得出。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容