2018年12月17日
2018年即將結束。對于ClickHouse和ClickHouse社區(qū)來說,這是一個偉大的一年 - 許多活動,新功能和有趣的項目。現(xiàn)在是時候看看下一步是什么了。由Alexey Milovidov領導的ClickHouse開發(fā)團隊公布了一些計劃,并允許我們與您分享。
新年前還有一段時間,新功能可以到達。有傳言稱下一版本將于12月31日發(fā)布,盡管它可能也會提前發(fā)布。計劃在那里有以下功能:
- 通過表函數(shù)導入/導出HDFS
- Parquet文件格式支持導入/導出數(shù)據(jù)。這使得ClickHouse與Hadoop生態(tài)系統(tǒng)的集成變得更加容易。
- 列級壓縮/編碼。初始版本將包括lz4,zstd和delta編碼。雙delta,Gorilla和blosc算法將在稍后發(fā)布。
- 能夠向MergeTree存儲引擎索引添加新列。這對于需要所有非聚合列在索引中的Sumge / Aggregating MergeTree表特別有用
首批2019年主要版本將帶來以下集成擴展。
- Amazon S3通過表函數(shù)導入/導出
- 字典作為使用通用“CREATE TABLE”SQL語法定義的一等公民
安全和細粒度訪問控制是許多公司非常需要的功能,ClickHouse將在Q1 / 2019年正確支持它:
- 表,列和行級安全性
- RBAC訪問控制模型
- 可插入外部身份驗證(LDAP,Kerberos)
MergeTree是ClickHouse的核心技術,它將進一步改進,以獲得更好的性能和可用性。Q1-Q2 / 2019計劃包括:
- MergeTree表的自適應索引粒度
- 二級索引結構(最小/最大,布隆過濾器)
- 使用索引獲得更好的ORDER BY / GROUP BY性能
今年,在改進ClickHouse對SQL連接的支持方面已經做了很多工作。在Q2-Q3 / 2019中,無論是在SQL標準兼容性還是更好的性能方面,它都將繼續(xù)下去。那包括:
- 多表連接
- 合并大表的連接
- 用于分布式連接的Bucket-shuffle算法
- ASOF加入時間序列數(shù)據(jù)
計劃在2018年為多個存儲卷提供資源池和支持,但推遲使用其他功能。這些仍然在Q2-Q3 / 2019的計劃中,資源池首先出現(xiàn):
- 資源池(細粒度CPU,內存,網絡,RAM分配)
- 分層存儲HDD / SDD用于冷/熱數(shù)據(jù)
- JBOD存儲支持
ClickHouse有時因地理空間數(shù)據(jù)結構的有限支持而受到批評。我們不能指望它像PostGIS一樣功能豐富,但是地理空間應用程序的一些擴展計劃在Q3 / 2019年進行,但優(yōu)先級可能會更改,并且可能會更早出現(xiàn):
- Geohash支持
- 多邊形詞典
除了ClickHouse開發(fā)團隊計劃開展的其他工作之外,我們還要特別強調兩個:
- 用于搜索字符串的高級算法,使其更加全文搜索
- 機器學習算法作為聚合函數(shù)。這開辟了很多可能性,所以我們渴望看到它是如何運作的。
這只是核心開發(fā)團隊將要開展的項目列表。有許多社區(qū)貢獻者也為ClickHouse添加了重要功能。Altinity也將在那里活躍 - 我們計劃在2019年推出幾個ClickHouse項目和代碼貢獻,這將使ClickHouse更容易和更安全地使用。
敬請關注!