DB4AI,即Database for AI,是用數(shù)據(jù)庫和數(shù)據(jù)管理的技術(shù)提升AI流水線全過程性能的技術(shù),包括前期的數(shù)據(jù)準(zhǔn)備、加速訓(xùn)練推理、降低模型成本、以及產(chǎn)業(yè)化部署等。 在...
DB4AI,即Database for AI,是用數(shù)據(jù)庫和數(shù)據(jù)管理的技術(shù)提升AI流水線全過程性能的技術(shù),包括前期的數(shù)據(jù)準(zhǔn)備、加速訓(xùn)練推理、降低模型成本、以及產(chǎn)業(yè)化部署等。 在...
標(biāo)題:近似搜索的乘積量化算法。乘積量化也是在向量空間數(shù)據(jù)的KNN搜索中比較特色的一類算法,本篇是開山之作。 編者的總結(jié) 量化實際上就是找k-means做聚類,乘積量化就是分段...
十億級深度學(xué)習(xí)向量數(shù)據(jù)集的高效索引 作者來自俄羅斯Yandex 編者的總結(jié) 核心思路是使用VQ而非PQ避免分段產(chǎn)生各分段之間的互信息損失。 技術(shù)手段是使用VQ中的RVQ做兩層...
說明:本人8月5日成功申請到“2020年國家建設(shè)高水平大學(xué)公派研究生項目”聯(lián)合培養(yǎng)博士,由于疫情影響網(wǎng)申時間順延為5月15日至6月10日,本文記錄了我的CSC申請全過程。 申...
Steiner Tree是一個經(jīng)典的NP-hard問題,問題定義不在這里重復(fù)了,主要介紹幾種近年來典型的解法思路。Steiner Forest擴(kuò)展了Tree的定義,設(shè)置一組起...
本文作者來自丹麥和意大利,曾設(shè)計ann-benchmarks獲得ANN領(lǐng)域廣泛關(guān)注。 編者的思考 只選了數(shù)據(jù)集中的點當(dāng)做query,可能會有bias。 LID, expans...
標(biāo)題:大規(guī)模分布式分區(qū)iSAX本文是2018TKDE-Massively Distributed Time Series Indexing and Querying的會議版本...
2019BIGVIS-Progressive Similarity Search on Time Series Data標(biāo)題:時間序列similarity-search的一個...
作者來自英偉達(dá) 編者:本文只介紹圖結(jié)構(gòu),GPU部分暫時省略。 編者的總結(jié)(圖結(jié)構(gòu)方面) 是NSSG的一個改版,用一個K較大的KNN-Graph做初始化,然后在其中通過兩條繞路...