一、校驗(yàn)數(shù)字的表達(dá)式 數(shù)字:^[0-9]*$ n位的數(shù)字:^\d{n}$ 至少n位的數(shù)字:^\d{n,}$ m-n位的數(shù)字:^\d{m,n}$ ...
文本挖掘是從大量文本中,比如微博評論,知乎評論,JD,天貓?zhí)詫毚罅吭u論中的文本中抽取出有價值的知識,并利用這些知識創(chuàng)造出價值,實(shí)現(xiàn)變現(xiàn)的一個過程...
一、PV、UV和IP的定義 PV: Page View,訪問量。即頁面瀏覽量或點(diǎn)擊量,用戶每次刷新即被計(jì)算一次。 UV:Unique Visi...
一、建立合適的索引 在常用過濾條件、表連接的字段建立索引。但并不是所有索引對查詢都有效,MySQL如果掃描數(shù)據(jù)超過30%,都會走全表。 二、在w...
一、SVD介紹 在實(shí)際生活中,采集到的數(shù)據(jù)大部分信息都是無用的噪聲和冗余信息,為了剔除掉這些噪聲和無用的信息,只保留包含絕大部分重要信息的數(shù)據(jù)特...
一、降維介紹 降維是對數(shù)據(jù)高維度特征的一種預(yù)處理方法。降維是將高維度的數(shù)據(jù)保留下最重要的一些特征,去除噪聲和不重要的特征,從而實(shí)現(xiàn)提升數(shù)據(jù)處理速...
一、FP-growth介紹 從大規(guī)模的數(shù)據(jù)集中,尋找不同特征或者物品之間的隱含關(guān)系,稱為關(guān)聯(lián)分析(association analysis),或...
一、關(guān)聯(lián)分析介紹 商場的銷售過程,涉及很多機(jī)器學(xué)習(xí)的應(yīng)用,商品的陳列,購物卷的提供,用戶忠誠度等等,通過對這些大量數(shù)據(jù)的分析,可以幫組商店了解用...
一、K-means聚類介紹 聚類是一種無監(jiān)督的學(xué)習(xí),它將相似的對象歸到同一個簇中。它有點(diǎn)像全自動分類 。聚類方法幾乎可以應(yīng)用于所有對象,簇內(nèi)的對...