1、聚類 常用的包: fpc,cluster,pvclust,mclust 基于劃分的方法: kmeans, pam, pamk, clara ...
數(shù)據(jù)庫數(shù)據(jù)字典表查詢: SELECT COL.TABLE_NAME, TT.COMMENTS, COL.COLUMN_NAME...
一、基本統(tǒng)計分析 1、描述性統(tǒng)計分析 (1)summary() apply函數(shù)族 分組描述性統(tǒng)計 group /by/reshape (2)頻數(shù)...
一.什么是缺失值,NA與NULL的區(qū)別 (1)NA表示數(shù)據(jù)集中的該數(shù)據(jù)遺失、不存在。在針對具有NA的數(shù)據(jù)集進(jìn)行函數(shù)操作的時候,該NA不會被直接剔...
文本挖掘現(xiàn)在是無處不在啊,之前在工作中涉及到一些文本挖掘的問題,但都不是很深入。最近在復(fù)習(xí)機(jī)器學(xué)習(xí)算法,看到貝葉斯分類,其中有一類就涉及到文本分...
交叉分類(列聯(lián)表)和卡方檢驗 交叉分類問題 比較和對照是進(jìn)行科學(xué)研究的基本手段。對于間距測度和比例測度的資料,進(jìn)行分組比較時可以用均數(shù)檢驗、方差...
數(shù)據(jù)結(jié)構(gòu) 一、數(shù)據(jù)管理 vector:向量 numeric:數(shù)值型向量 logical:邏輯型向量 character;字符型向量 list:列...
http://www.cnblogs.com/payton/p/5567778.html library(recharts) barnline<...
1、三種常見的清洗數(shù)據(jù) 1)重復(fù)值數(shù)據(jù) 定義:把數(shù)據(jù)結(jié)構(gòu)中,行數(shù)據(jù)相同的剔除 unique 函數(shù)語法: unique (x) 案例: 導(dǎo)入csv...