一、數(shù)據(jù)分析的目的 數(shù)據(jù)分析是指用適當(dāng)?shù)慕y(tǒng)計分析方法對收集來的大量數(shù)據(jù)進(jìn)行分析,提取有用信息和形成結(jié)論而對數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程。 本篇文章中,假設(shè)以朝陽醫(yī)院201...
一、數(shù)據(jù)來源及說明 數(shù)據(jù)來源:https://tianchi.aliyun.com/dataset/dataDetail?dataId=46&userId=1 本文從數(shù)據(jù)集中...
1.業(yè)務(wù)到底是什么 把產(chǎn)品以合理的方式通過渠道賣給消費者賺取利潤。所以業(yè)務(wù)包括:利潤、企業(yè)架構(gòu)、產(chǎn)品、渠道、運營、用戶等業(yè)務(wù)需求:業(yè)務(wù)方提的需求 2.利潤 利潤=收入-成本收...
數(shù)據(jù)分析的步驟1、提出問題——明確數(shù)據(jù)分析目的2、理解數(shù)據(jù)——理解數(shù)據(jù)列名的意義3、數(shù)據(jù)清洗——統(tǒng)一格式內(nèi)容4、構(gòu)建模型——思考用什么樣的表現(xiàn)形式把數(shù)據(jù)呈現(xiàn)出來5、數(shù)據(jù)可視化...
一、將csv格式的文件導(dǎo)入mysql 第一步:建表,本案例需要鍵兩個表。 -- 表一create table order_info(order_id int pri...
mysql服務(wù)器主要配置選項bind-adress 表示服務(wù)器綁定的ip,默認(rèn)為127.0.0.1port 表示端口,默認(rèn)為3306datadir 表是數(shù)據(jù)庫目錄,默認(rèn)為/v...
一、數(shù)據(jù)定義語言DDL 二、數(shù)據(jù)操作語言DML 三、數(shù)據(jù)查詢語言DQL 四、數(shù)據(jù)控制語言DCL 數(shù)據(jù)控制語言DCL用來授予或回收訪問數(shù)據(jù)庫的某種特權(quán),并控制數(shù)據(jù)庫操縱事務(wù)發(fā)生...
理論基礎(chǔ) 條件概率:樸素貝葉斯最核心的部分是貝葉斯法則,而貝葉斯法則的基石是條件概率。貝葉斯法則如下: 詞集模型:對于給定文檔,只統(tǒng)計某個侮辱性詞匯(準(zhǔn)確說是詞條)是否在本文...
一、線性回歸 (1) 線性回歸的數(shù)學(xué)定義 數(shù)據(jù) 模型 (2)線性回歸的數(shù)學(xué)定義(矩陣表達(dá)) 數(shù)據(jù) 模型 解析解 (3)損失函數(shù)損失函數(shù): 二、邏輯回歸 邏輯回歸是一個分類的問...
一、KNN介紹 既可以做回歸也可以做分類 k鄰近的3要素(1) 選擇合適的K(一般選奇數(shù)):通過交叉驗證來選(2) 距離選擇:歐式距離、曼哈頓距離、余弦值、相關(guān)度(3) 決策...
爬蟲入門學(xué)習(xí) 一、爬蟲基本流程 第一步,根據(jù)URL,獲取網(wǎng)頁的HTML信息。在Python3中,可以使用urllib.request和requests進(jìn)行網(wǎng)頁爬取。urlli...
sklearn學(xué)習(xí) 中文官網(wǎng) 一、一般使用 1.1 選擇學(xué)習(xí)方法 從 START 開始,首先看數(shù)據(jù)的樣本是否 >50,小于則需要收集更多的數(shù)據(jù)。 由圖可知,算法有四類:分類,...
Matlpotlib學(xué)習(xí) Matplotlib 是一個非常強大的 Python 畫圖工具??梢援嬀€圖、散點圖、等高線圖、條形圖、柱狀圖、3D圖像、動畫圖形等。 一、基本使用 ...
Numpy學(xué)習(xí) 一、數(shù)組基本屬性 ndim:維度 shape:行數(shù)和列數(shù) size:元素個數(shù) 二、numpy創(chuàng)建數(shù)組 array:創(chuàng)建數(shù)組 dtype:指定數(shù)據(jù)類型 使用li...
一、基本使用 1.1 print功能 1.python3以后的版本需要加括號,python2.7及2.7以前的版本不需要加括號。 2.打印字符串需要加單引號或者雙引號。 3....