v14.2.5 Nautilus 發(fā)布

Nautilus v14.2.5發(fā)布

這是Ceph Nautilus版本系列的第五個(gè)版本。在許多值得注意的更改中,此版本修復(fù)了
14.2.3 中引入的嚴(yán)重BlueStore錯(cuò)誤。建議所有Nautilus用戶升級(jí)到此版本。

顯著的變化?

關(guān)鍵修復(fù):

  • 此版本修復(fù)了一個(gè)重要的BlueStore錯(cuò)誤,該錯(cuò)誤在14.2.3中引入(并且在14.2.4中也存在),當(dāng)使用單獨(dú)的“ WAL”設(shè)備時(shí),該錯(cuò)誤可能導(dǎo)致數(shù)據(jù)損壞。

新的健康警告:

  • 如果守護(hù)程序最近崩潰,Ceph現(xiàn)在將發(fā)出運(yùn)行狀況警告。
    自Nautilus最初發(fā)布以來,Ceph 就一直在收集崩潰報(bào)告,但是
    運(yùn)行狀況警報(bào)是新的。要查看新的崩潰(或所有崩潰,如果您剛剛
    升級(jí)的話):

    ceph crash ls-new
    

    要確認(rèn)特定的崩潰(或所有崩潰)并使運(yùn)行狀況警告靜音:

    ceph crash archive-all
    
  • 如果RADOS池的pg_num 值不是2的冪,Ceph現(xiàn)在將發(fā)出健康警告。可以通過將池調(diào)整為附近的2的冪來解決此問題:

        ceph osd pool set <pool-name> pg_num <new-pg-num>
    

    或者,可以通過以下方式使警告靜音:

    ceph config set global mon_warn_on_pool_pg_num_not_power_of_two false
    
  • 如果將RADOS池的size設(shè)置為1,
    或者換句話說,如果該池配置為沒有冗余,則Ceph將發(fā)出健康警告。
    如果池大小設(shè)置為最小
    建議值,則Ceph將停止發(fā)出警告:

    ceph osd pool set <pool-name> size <num-replicas>
    

    可以通過以下方式使警告靜音:

    ceph config set global mon_warn_on_pool_no_redundancy false
    
  • 如果平均osd心跳ping
    時(shí)間超過所計(jì)算的任何間隔的可配置閾值,現(xiàn)在就會(huì)生成健康警告。OSD計(jì)算平均值,最小值和最大值的1分鐘,5分鐘和15分鐘間隔。新的配置選項(xiàng)mon_warn_on_slow_ping_ratio指定的百分比osd_heartbeat_grace來確定閾值。零值將禁用警告。 以毫秒為單位指定的新配置選項(xiàng)mon_warn_on_slow_ping_time會(huì) 覆蓋計(jì)算值,并在OSD心跳ping花費(fèi)的時(shí)間超過指定的數(shù)量時(shí)引發(fā)警告。
    新的管理命令ceph守護(hù)程序mgr。

      #dump_osd_network [閾值],
    

將列出所有ping時(shí)間長(zhǎng)于config選項(xiàng)確定的指定閾值或值的所有連接,以3個(gè)間隔中任意間隔的平均值為準(zhǔn)。
另一種新的管理命令,ceph daemon OSD。

#dump_osd_network [門檻]</cite>,

將做由指定的OSD開始同時(shí)但只包括心跳。

telemetry 模塊中的更改:

  • telemetry 模塊現(xiàn)在具有默認(rèn)啟用的“設(shè)備”通道,該通道將向telemetry.ceph.com報(bào)告匿名的硬盤和SSD健康指標(biāo),以構(gòu)建和改進(jìn)設(shè)備故障預(yù)測(cè)算法。由于telemetry 報(bào)告的內(nèi)容已更改,因此您需要通過以下方式重新選擇加入

    ceph telemetry on
    

您可以通過以下方式確切查看將首先報(bào)告哪些信息:

  ceph telemetry show
  ceph telemetry show device   # specifically show the device channel

如果您不愿意共享設(shè)備指標(biāo),則可以先停用該頻道,然后再重新啟用:

ceph config set mgr mgr/telemetry/channel_device false
ceph telemetry on
  • telemetry 模塊現(xiàn)在報(bào)告有關(guān)CephFS文件系統(tǒng)的更多信息,
    包括:

    • 多少個(gè)MDS守護(hù)程序(總計(jì)和每個(gè)文件系統(tǒng))
    • 啟用(或已啟用)哪些功能
    • 多少個(gè)數(shù)據(jù)池
    • 文件系統(tǒng)的大致年齡(年份+創(chuàng)建月份)
    • 多少個(gè)文件,字節(jié)和快照
    • 緩存了多少元數(shù)據(jù)

    我們還添加了:

    • 監(jiān)視器正在運(yùn)行哪個(gè)Ceph版本
    • 監(jiān)視器是否使用msgr v1或v2地址
    • 監(jiān)視器使用的是IPv4還是IPv6地址
    • 是否啟用RADOS緩存分層(以及哪種模式)
    • 是否復(fù)制池或?qū)Σ脸M(jìn)行編碼,以及
      正在使用哪個(gè)擦除代碼配置文件插件和參數(shù)
    • 集群中有多少臺(tái)主機(jī),每種類型的守護(hù)程序有多少臺(tái)主機(jī)
    • 是否正在使用單獨(dú)的OSD群集網(wǎng)絡(luò)
    • 集群中有多少個(gè)RBD池和映像,以及有多少個(gè)池啟用了RBD鏡像
    • 存在多少個(gè)RGW守護(hù)程序,區(qū)域和區(qū)域組;正在使用哪些RGW前端
    • 有關(guān)CRUSH映射的匯總統(tǒng)計(jì)信息,例如使用了哪些算法,有多少個(gè)
      存儲(chǔ)桶,定義了多少個(gè)規(guī)則以及
      使用了什么可調(diào)參數(shù)

    如果啟用了telemetry 功能,則需要使用以下選項(xiàng)重新加入:

    ceph telemetry on
    

    您可以通過以下方式確切查看將首先報(bào)告哪些信息:

    ceph telemetry show        # see everything
    ceph telemetry show basic  # basic cluster info (including all of the new info)
    

OSD:

  • 一個(gè)新的OSD守護(hù)程序命令“ dump_recovery_reservations”顯示
    在優(yōu)先級(jí)隊(duì)列中持有的(in_progress)和等待中的恢復(fù)鎖。
  • 另一個(gè)新的OSD守護(hù)程序命令“ dump_scrub_reservations”顯示了
    為本地(主要)和遠(yuǎn)程(副本)PG保留的清理保留。

RGW:

  • RGW現(xiàn)在支持S3對(duì)象鎖API集,允許使用WORM模型
    存儲(chǔ)對(duì)象。添加了6個(gè)新的API,放置/獲取存儲(chǔ)桶對(duì)象鎖定,
    放置/獲取對(duì)象保留,放置/獲取對(duì)象合法保留。
  • RGW現(xiàn)在支持列表對(duì)象V2
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容