到底什么是kernel method?
在一個(gè)空間內(nèi),線性不可分,然后通過(guò)一個(gè)函數(shù),映射到高維空間(不一定非得是高維空間),然后線性可分了。而可分的依據(jù)是什么?是距離。那么怎么求距離呢?距離由內(nèi)積來(lái)求出來(lái)的。那在高維空間里求內(nèi)積的時(shí)候,怎么弄?不好弄,通過(guò)數(shù)學(xué)公式推理一下,會(huì)得到高維空間里的內(nèi)積運(yùn)算可以用低維空間的某個(gè)函數(shù)來(lái)表示,這個(gè)函數(shù)就是核函數(shù)了。知道了核函數(shù),就能知道高維空間里的距離了。
有個(gè)定理theorem說(shuō) 如果有高維空間,那么就有kernel function,同樣如果有kernel function就會(huì)有一個(gè)高維空間。
那么,kernel method 是怎么在heterogeneous的數(shù)據(jù)中起作用的呢??
又涉及到張量了
在feature space蛋白對(duì)和每個(gè)蛋白的的張量積相同。??什么意思?。??
第一種是:特征向量是每個(gè)蛋白序列中,3-mer出現(xiàn)的次數(shù)。
第二個(gè)特征是:一段序列里motif的數(shù)量
第三個(gè)特征是: