識(shí)別一個(gè)唯一的Android客戶端常用的方法是: IMEI,由于Android系統(tǒng)的開放性,可以通過修改系統(tǒng)參數(shù)來動(dòng)態(tài)改變這個(gè)值,即使是用其他替代的所謂唯一值,例如藍(lán)牙地址,mac地址,也很容易被篡改。一個(gè)不懂技術(shù)的人都可以輕易做到,淘寶上充斥著這些作弊的方案:
https://item.taobao.com/item.htm?spm=a230r.1.14.1.7uAFxs&id=521866245606&ns=1&abbucket=12#detail
在這樣的環(huán)境下,怎么樣識(shí)別出一個(gè)作弊的用戶呢?我覺得與其尋找一個(gè)難以被修改的所謂唯一值,不如換個(gè)思路,識(shí)別出作弊用戶的特征。這個(gè)特征我認(rèn)為有一個(gè)很關(guān)鍵,就是設(shè)備的硬件參數(shù),例如屏幕像素尺寸(Displayer Resolution),屏幕像素密度(DIP),CPU主頻,內(nèi)存大小等等。這些參數(shù)不能作為一個(gè)設(shè)備唯一值,但是作弊用戶的數(shù)據(jù)集在這些維度上的聚類密度非常高。可以認(rèn)為一個(gè)設(shè)備參數(shù)聚類密度非常高的用戶,就是系統(tǒng)里所謂的不受歡迎用戶。
在做數(shù)理分析的時(shí)候,要做的是:
建立合適的維度
選取核心指標(biāo)(這些核心指標(biāo)是通過維度的數(shù)據(jù)用數(shù)學(xué)公式計(jì)算得到的)
去偽存真,過濾掉異常值(某些額外數(shù)據(jù)的采集,就是為了識(shí)別這些異常值;例如我今天想采集通過這一個(gè)路口的所有車的品牌,如果我只記錄品牌信息,我可能會(huì)發(fā)現(xiàn)這一個(gè)路口通過的車很多是豐田車,如果我同時(shí)記錄車牌信息,我就會(huì)發(fā)現(xiàn)這特么有一個(gè)神經(jīng)病來來回回兜圈)
運(yùn)用到實(shí)際環(huán)境中解釋指標(biāo)(指標(biāo)只是建模的數(shù)學(xué)工具,要用合理的模型來解釋指標(biāo))
產(chǎn)品經(jīng)理要有基本的數(shù)學(xué)常識(shí)。BTW,我是一個(gè)高等數(shù)學(xué)的學(xué)渣,不過我線性代數(shù)是92分(前10%),高數(shù)和線代用到的是不同方式的思維。最后想說的是:
對自己的不足的認(rèn)識(shí)與日俱增,然而并沒有接受就這副樣子的自己。我的心態(tài)比去年又年輕一歲。那大概是因?yàn)?,也發(fā)現(xiàn)了自己的一點(diǎn)點(diǎn)優(yōu)秀的地方。