論文題目:RDMA Congestion Control: It’s Only for the Compliant
文章時(shí)間:2021年10月前
會(huì)議/期刊:CLOUD21
作者背景: 杜克大學(xué)
筆記時(shí)間:2021年11月08日周一
論文地址:https://danyangzhuo.com/papers/CLOUD21-RDMA.pdf
通過(guò)用戶的惡意操作,獲取不正當(dāng)?shù)牧髁績(jī)?yōu)勢(shì),提出了攻擊的方法和可能的解決方案
對(duì)比的主要兩個(gè)CC算法,DCQCN和HPCC
論文題目:Memory Demands in Disaggregated HPC: How Accurate Do We Need to Be?
文章時(shí)間:2021年11月,應(yīng)該是最近的文章吧
會(huì)議/期刊:未知,谷歌學(xué)術(shù)推薦
作者背景: 巴薩羅那超算中心
筆記時(shí)間:2021年11月08日周一
論文地址:http://paul-carpenter.org/vieira2021pmbs.pdf
研究,當(dāng)HPC環(huán)境中的內(nèi)存變?yōu)镈isaggregated memory時(shí),會(huì)有什么影響。
將內(nèi)存化為內(nèi)存池,計(jì)算通過(guò)內(nèi)存池來(lái)獲取存儲(chǔ)資源。用ordinary load-store instructions /RMDA來(lái)傳輸輸數(shù)據(jù)。
工作是用slurm的模擬器來(lái)做的,模擬的插件是自己先前的工作
F. V. Zacarias, P. Carpenter, and V. Petrucci, “Improving hpc system throughput and response time using memory disaggregation,” in 2021 IEEE 27th International Conference on Parallel and Distributed Systems(ICPADS). IEEE, 2021.
[21] “Disaggregated memory slurm simulator and allocation policy.” https://github.com/felippezacarias/slurm simulator, 2021, accessed: 2021-04-08
方法論
模擬的作業(yè)數(shù)據(jù)集:CIRNE Comprehensive Model [23]
W. Cirne and F. Berman, “A comprehensive model of the supercomputer workload,” in Proceedings of the Fourth Annual IEEE International Workshop on Workload Characterization. WWC-4 (Cat. No. 01EX538). IEEE, 2001, pp. 140–148擴(kuò)展內(nèi)存過(guò)估計(jì)的模擬器
(1)按照固定比例過(guò)估計(jì)
(2)獨(dú)立同分布的過(guò)估計(jì)對(duì)系統(tǒng)吞吐的影響
4.內(nèi)存過(guò)估計(jì)和響應(yīng)時(shí)間的關(guān)系
相關(guān)工作
1.內(nèi)存解耦
- 資源分配
- 獲取/定價(jià)機(jī)制
結(jié)論
Disaggregated Memory 是正在發(fā)展的新技術(shù),可以靈活細(xì)粒度的分配物理內(nèi)存。HPC用戶如要使用Disaggregated Memory的話,需要用戶對(duì)自己作業(yè)的內(nèi)存使用情況有個(gè)正確的估計(jì),錯(cuò)誤的估計(jì)會(huì)導(dǎo)致吞吐量和延遲的問(wèn)題,我們根據(jù)假設(shè)做了多種的實(shí)驗(yàn)。
本文是研究如何將Disaggregated Memory引入HPC的一個(gè)前導(dǎo)工作,用戶如果能提供準(zhǔn)確的內(nèi)存使用數(shù)據(jù),應(yīng)該得倒獎(jiǎng)勵(lì),獎(jiǎng)勵(lì)可以是優(yōu)先級(jí),并行作業(yè)數(shù)量,或者更大的分配核。
有一說(shuō)一,這個(gè)論文的圖,確實(shí)沒(méi)看懂。
論文題目:PREP: Predicting Job Runtime with Job Running Path on Supercomputers
文章時(shí)間:2021年08月前
會(huì)議/期刊:ICPP 2021
作者背景: 西南科技大學(xué),超算中心
筆記時(shí)間:2021年11月08日周一
論文地址:https://dl.acm.org/doi/abs/10.1145/3472456.3473521
利用作業(yè)的運(yùn)行文件路徑作為預(yù)測(cè)作業(yè)的一個(gè)參數(shù),效果可以達(dá)到預(yù)測(cè)88%
隨機(jī)森林才82%
future work,深挖作業(yè)日志提高預(yù)測(cè)準(zhǔn)確率。