人工智能的初步了解
機器學習 在知識底庫中查詢,核心為查詢的算法;
傳統(tǒng)意義上我們會在鏈表、二叉樹、數(shù)組中查詢,但是人工智能中構(gòu)建了更多維度的底庫,包括按圖層創(chuàng)建、按小世界創(chuàng)建等等,基于圖的算法更迅速 效果好,但構(gòu)建更復雜。
而如何識別出結(jié)果就是我們要查詢的內(nèi)容,靠的就是距離算法,就是通過在不同的角度判斷目標與底庫中數(shù)據(jù)的距離,計算方法包括:
歐式距離:空間中兩點之間的距離
夾角余弦:角度距離,數(shù)據(jù)在同一個角度范圍內(nèi)
漢明距離:差異距離,兩個字符要變成同一字符的距離
杰卡德相似系數(shù):兩個集合交集和兩集合并集的比
以上算法成為機器視覺開始的主流算法
而這其中離不開的就是向量的概念
剛剛說了創(chuàng)建底庫,而底庫組成的元素就是向量,越多維的向量標識,則查詢的越準確,當然算力需要的也更大。
漢字的向量的一般維度是100維到300維之間,我們在同一個向量空間表達所有的詞,則這個空間就是底庫。