TreeMiner

在講Class Extension的時(shí)候:有一個(gè)十分重要的定義。
Let P be a prefix class with encoding P,and let (x,i) and (y,j) denote any two elements in the class.And let P_xdenote the class representing extensions of element(x,i).

Tree Mining Problem

Let D be a database of trees (ie:a forest).
and let subtree S \preceq T for some T\epsilon D.
Each occurence of S can be identified by its match label,which is given as the set of matching positions (in T) for nodes in S.

what's the match label?
let \{t_1,t_2,...,t_n\}be the nodes in T,so |T|=n
let \{s_1,s_2,...,s_m\}be the nodes in S,so |S|=m
then S has a match label \{t_{i_1},t_{i_2},...,t_{i_m}\} iff
1:l(s_k)=l(t_{i_k}) for all k = 1,...,m
2:branch b(s_j,s_k)in S iff t_{i_j} is an ancestor of t_{i_k} in T.

這里有兩個(gè)Condition.不是很懂。

注意:l(n_l)是指n_l這個(gè)node的label. t 和 s 如同n一樣的作用。沒(méi)有其他的意思。

個(gè)人認(rèn)為:
then S has a match label \{t_{i_1},t_{i_2},...,t_{i_m}\} iff
應(yīng)該改成:
then S has a match label\{i_1,i_2,...,i_m\} 使得 \{t_{i_1},t_{i_2},...,t_{i_m}\} iff

第4節(jié):使用Scope-List 來(lái)加快子樹的支持度的計(jì)算。
Scope-List Representation:
概念:
X is a k-subtree of a tree T.
x_k refer to the last node of X.
We use the notation L(X) to refer to the scope-list of X.
Each element of the scope-list is a triple(t,m,s).
where t is a tree id (tid) means X.
m is a match label of the (k-1) length prefix of X (base T) (個(gè)人添加)。
(recall that the prefix match label gives the positions of nodes in T that match the prefix。)
(Since a given prefix can occur multiple times in a tree ,X can be associated with multiple match label as well as multiple scopes.)
s is the scope of the last item x_k
有了上述的概念之后。
4.1:Frequent Subtree Enumeration

Computing F_1 and F_2:
Suppose that the initial database is in the horizontal string encode format.
所以D里面的T是一條條串。
看懂代碼里面的描述形式:

TreeMiner(D,minsup):
F_1 = { classes [] frequent 1-subtrees };
F_2 = { classes [P]1 of frequent 2-subtrees };
for all [P]_1 \epsilon E do Enumerate-Frequent-Subtrees([P]_1);
//注意
Enumerate-Frequent-Subtrees([P]):
for each element(x,i)\epsilon [P] do
[P_x] = \emptyset
for each element (y,j)\epsilon [P] do
R = {(x,i)+(y,j)};
L(R) = {L(x) + L(y)}
if for any r \epsilon R,r is frequent then
[P_x] = [P_x] U \{R\}
Enumerate-Frequent-Subtrees([P_x])
里面好這個(gè)函數(shù),每次傳入的是一個(gè) 前綴
最后加入的是x元素的集合。
其實(shí)是 前綴集合的子集。就是最后加入的

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi閱讀 7,841評(píng)論 0 10
  • 其實(shí)我不喜歡我這種人,不努力,又懶,我應(yīng)該去改變,都是該從哪做起……
    我在田園繡花閱讀 218評(píng)論 0 0
  • 【說(shuō)在前面】: 繁復(fù)冗雜的煩心事,真是太多了。 這樣說(shuō)來(lái),“三人成虎”其實(shí)是好事。 因?yàn)楫?dāng)所有人都在說(shuō):“會(huì)好起來(lái)...
    左燈右右右行閱讀 13,917評(píng)論 119 129
  • 人的一生會(huì)結(jié)交很多的朋友,也許有的人并不能如你所愿,也沒(méi)有必要斤斤計(jì)較,給別人以寬容的心,別人接不接受我覺(jué)得也不重...
    兩個(gè)人的森林123閱讀 227評(píng)論 0 1
  • 我在你面前 一會(huì)喊大哥 一會(huì)喊小孩 我在你面前 賭氣的時(shí)候喊大哥 歡愉的時(shí)候喊小孩 我在你面前 我一會(huì)是大哥 我一...
    倩何人換取閱讀 201評(píng)論 0 0

友情鏈接更多精彩內(nèi)容