ClickHouse RoadMap 2019(粗略翻譯版)

2018年12月17日

2018年即將結束。對于ClickHouse和ClickHouse社區(qū)來說,這是一個偉大的一年 - 許多活動,新功能和有趣的項目。現(xiàn)在是時候看看下一步是什么了。由Alexey Milovidov領導的ClickHouse開發(fā)團隊公布了一些計劃,并允許我們與您分享。

新年前還有一段時間,新功能可以到達。有傳言稱下一版本將于12月31日發(fā)布,盡管它可能也會提前發(fā)布。計劃在那里有以下功能:

  • 通過表函數(shù)導入/導出HDFS
  • Parquet文件格式支持導入/導出數(shù)據(jù)。這使得ClickHouse與Hadoop生態(tài)系統(tǒng)的集成變得更加容易。
  • 列級壓縮/編碼。初始版本將包括lz4,zstd和delta編碼。雙delta,Gorilla和blosc算法將在稍后發(fā)布。
  • 能夠向MergeTree存儲引擎索引添加新列。這對于需要所有非聚合列在索引中的Sumge / Aggregating MergeTree表特別有用

首批2019年主要版本將帶來以下集成擴展。

  • Amazon S3通過表函數(shù)導入/導出
  • 字典作為使用通用“CREATE TABLE”SQL語法定義的一等公民

安全和細粒度訪問控制是許多公司非常需要的功能,ClickHouse將在Q1 / 2019年正確支持它:

  • 表,列和行級安全性
  • RBAC訪問控制模型
  • 可插入外部身份驗證(LDAP,Kerberos)

MergeTree是ClickHouse的核心技術,它將進一步改進,以獲得更好的性能和可用性。Q1-Q2 / 2019計劃包括:

  • MergeTree表的自適應索引粒度
  • 二級索引結構(最小/最大,布隆過濾器)
  • 使用索引獲得更好的ORDER BY / GROUP BY性能

今年,在改進ClickHouse對SQL連接的支持方面已經做了很多工作。在Q2-Q3 / 2019中,無論是在SQL標準兼容性還是更好的性能方面,它都將繼續(xù)下去。那包括:

  • 多表連接
  • 合并大表的連接
  • 用于分布式連接的Bucket-shuffle算法
  • ASOF加入時間序列數(shù)據(jù)

計劃在2018年為多個存儲卷提供資源池和支持,但推遲使用其他功能。這些仍然在Q2-Q3 / 2019的計劃中,資源池首先出現(xiàn):

  • 資源池(細粒度CPU,內存,網絡,RAM分配)
  • 分層存儲HDD / SDD用于冷/熱數(shù)據(jù)
  • JBOD存儲支持

ClickHouse有時因地理空間數(shù)據(jù)結構的有限支持而受到批評。我們不能指望它像PostGIS一樣功能豐富,但是地理空間應用程序的一些擴展計劃在Q3 / 2019年進行,但優(yōu)先級可能會更改,并且可能會更早出現(xiàn):

  • Geohash支持
  • 多邊形詞典

除了ClickHouse開發(fā)團隊計劃開展的其他工作之外,我們還要特別強調兩個:

  • 用于搜索字符串的高級算法,使其更加全文搜索
  • 機器學習算法作為聚合函數(shù)。這開辟了很多可能性,所以我們渴望看到它是如何運作的。

這只是核心開發(fā)團隊將要開展的項目列表。有許多社區(qū)貢獻者也為ClickHouse添加了重要功能。Altinity也將在那里活躍 - 我們計劃在2019年推出幾個ClickHouse項目和代碼貢獻,這將使ClickHouse更容易和更安全地使用。

敬請關注!

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容