1.實(shí)驗(yàn)背景 最近畢業(yè)設(shè)計(jì)中,希望通過wifi數(shù)據(jù)計(jì)算人員軌跡的相似度。人員軌跡數(shù)據(jù)按照時(shí)間順序,以地點(diǎn)id的序列來表示。示例: LCSS算法則可以計(jì)算出兩個(gè)序列之間的最長公...
代碼大綱 數(shù)據(jù)預(yù)處理 第一步 /macinfo/origin2normal_test2.py功能:數(shù)據(jù)預(yù)處理第一步。將原始數(shù)據(jù)打散。/macinfo/macdata/orig...
一、 數(shù)據(jù)說明: 針對(duì)全國的余額寶用戶,按照一定的規(guī)則抽樣,給出對(duì)應(yīng)的性別、城市和星座 針對(duì)抽樣用戶,抽取他們的余額寶交易數(shù)據(jù),并歸類為申購和贖回兩類 訓(xùn)練數(shù)據(jù):201307...
關(guān)鍵字K_means、ARIMA 前言 一月份主要工作如下: 精細(xì)化數(shù)據(jù)預(yù)處理過濾掉單一地點(diǎn)mac、過濾掉出現(xiàn)天數(shù)低于10天的mac、進(jìn)一步細(xì)分地點(diǎn)列表; 數(shù)據(jù)索引保留兩份原...
前言 許久未更,百感交集...因?yàn)樽罱芯扛黝愃惴ǎ瑹o邊落發(fā)蕭蕭下TAT廢話不多說,最近使用FP-Growth算法繼續(xù)進(jìn)行畢設(shè)數(shù)據(jù)挖掘 選擇它的原因有二:1.比kNN算法逼格...
前言 最近幫師弟做了一個(gè)數(shù)據(jù)挖掘的大作業(yè),覺得多少還是有點(diǎn)心得,乘興記錄一下( -з) 問題陳述 Over 40,000 instances, mix of continuo...
前言 最近在之前的數(shù)據(jù)基本預(yù)處理工作之上,增加了兩個(gè)新的工作。 1.數(shù)據(jù)擴(kuò)容,將數(shù)據(jù)的維度由3列擴(kuò)容到13列 2.對(duì)于數(shù)據(jù)擴(kuò)容后的數(shù)據(jù),進(jìn)行兩方面的條件篩選:a.通過pid、...
目錄: 一、概述二、MySQL安裝以及配置三、NavicatforMySQL下載及使用 概述: MySQL版本:5.7.20 MySQL下載地址:https://dev.my...
是雷峰塔和雷鋒的關(guān)系w
pandas格式化輸出文件對(duì)于上篇中,預(yù)處理后的結(jié)構(gòu)化數(shù)據(jù),本篇希望對(duì)其進(jìn)行數(shù)據(jù)的格式化輸出。 主要目標(biāo)是:根據(jù)地點(diǎn)id,起止時(shí)間段的設(shè)定,在條件篩選下得到對(duì)應(yīng)的數(shù)據(jù),并格式化輸出到本地文件中。 上篇...
對(duì)于上篇中,預(yù)處理后的結(jié)構(gòu)化數(shù)據(jù),本篇希望對(duì)其進(jìn)行數(shù)據(jù)的格式化輸出。 主要目標(biāo)是:根據(jù)地點(diǎn)id,起止時(shí)間段的設(shè)定,在條件篩選下得到對(duì)應(yīng)的數(shù)據(jù),并格式化輸出到本地文件中。 上篇...
最近關(guān)于畢業(yè)設(shè)計(jì)遇到了第一個(gè)小難題,那就是讀取一個(gè)將近1G的文件,并對(duì)其進(jìn)行數(shù)據(jù)預(yù)處理工作。意圖是將數(shù)據(jù)打散,對(duì)于每個(gè)mac地址對(duì)其分配對(duì)應(yīng)的時(shí)間戳和地點(diǎn)id(第二列) 數(shù)據(jù)...
最近在學(xué)習(xí)研究python下的決策樹算法時(shí)遇到了一個(gè)小小的問題,弄了一下午的時(shí)間,中午解決。 問題描述:決策樹算法結(jié)果的graph圖形無法打印并且以pdf或者jpg的格式呈現(xiàn)...
本文主要參考:http://www.itdecent.cn/p/773ff5f08a2c 年初,國家統(tǒng)計(jì)局公布了70個(gè)大中城市住宅銷售價(jià)格變動(dòng)情況其中有一項(xiàng)為價(jià)格指數(shù)表: 為...
關(guān)于DTW算法 動(dòng)態(tài)時(shí)間規(guī)整/規(guī)劃(Dynamic Time Warping, DTW)是一個(gè)比較老的算法,大概在1970年左右被提出來,最早用于處理語音方面識(shí)別分類的問題。...
前言 眾所周知,BeautifulSoup 是個(gè)非常強(qiáng)大的庫,不過還有一些比較流行的解析庫,例如 lxml,使用的是 Xpath 語法,同樣是效率比較高的解析方法。如果大家對(duì)...
課題1 畢業(yè)設(shè)計(jì)里面涉及到人員相關(guān)度的計(jì)算,在這里我提出了一個(gè)猜想,大致如下: 現(xiàn)有數(shù)據(jù):學(xué)生id、學(xué)生手機(jī)mac地址、時(shí)間戳、地點(diǎn)id 構(gòu)想:通過學(xué)生mac地址某地點(diǎn)出現(xiàn)頻...