(文末有資料領(lǐng)取)#大數(shù)據(jù)#? #數(shù)據(jù)分析#? #Python#? #開(kāi)源#? #編程#? #人工智能#
? ? ? ?Hi,我是小匿。
? ? ? ?近期我會(huì)邀請(qǐng)一些Dathoner來(lái)分享下轉(zhuǎn)行與找工作的真實(shí)面試經(jīng)驗(yàn),幫助大家一起提高知識(shí)。本次分享的Dathoner,是一個(gè)已經(jīng)有一年經(jīng)驗(yàn)的同學(xué),結(jié)合課程輔助與自身努力,最終拿到中高級(jí)數(shù)據(jù)分析師o(wú)ffer的經(jīng)歷。
一、轉(zhuǎn)行背景介紹
? ? ? ?我是19年6月底從工作了三年的手機(jī)公司辭職,并且下定決心轉(zhuǎn)行數(shù)據(jù)分析師(受一位轉(zhuǎn)行師姐的影響)。首先從知乎找攻略,并按照師姐的推薦系統(tǒng)的學(xué)習(xí)了《深入淺出統(tǒng)計(jì)學(xué)》和《利用python進(jìn)行數(shù)據(jù)分析》,簡(jiǎn)單過(guò)了一遍《Mysql必知必會(huì)》,然后開(kāi)始做了兩三個(gè)項(xiàng)目【網(wǎng)上找的PM2.5分析,淘寶用戶行為數(shù)據(jù)分析和奧林匹克運(yùn)動(dòng)員數(shù)據(jù)分析】,并且寫(xiě)成了數(shù)據(jù)分析報(bào)告上傳至網(wǎng)站上鏈接附在簡(jiǎn)歷上,最后就是投簡(jiǎn)歷找工作階段,整個(gè)過(guò)程大概三個(gè)多月的時(shí)間。
? ? ? ?其實(shí)到最后一個(gè)月開(kāi)始投簡(jiǎn)歷階段就有點(diǎn)慌了,因?yàn)槊摦a(chǎn)學(xué)習(xí)沉沒(méi)成本越大心態(tài)越崩,剛開(kāi)始投簡(jiǎn)歷回復(fù)很少幾乎沒(méi)有邀約面試的。最后不得已在51上廣撒網(wǎng),十一之后面試多起來(lái),總共面試五家,拿了三家offer,最后選擇了一家小的B2B電商公司。關(guān)于幾個(gè)找工作軟件,對(duì)于轉(zhuǎn)行人士建議BOSS和51job,拉勾上回復(fù)很少。
? ? ? ?至此,我算是轉(zhuǎn)行了,但是這家公司數(shù)據(jù)量很少,并且數(shù)據(jù)分析師就我跟另外一個(gè)同事,而那位同事業(yè)務(wù)經(jīng)驗(yàn)豐富,但是分析工具只限于Excel,除了從業(yè)經(jīng)驗(yàn)這家公司給不了我其他的經(jīng)驗(yàn)提升,因此我希望借鑒網(wǎng)上同行的經(jīng)驗(yàn)提高自己的技能水平和分析能力。這也是為啥我在知乎上發(fā)現(xiàn)了小匿。
? ? ? ?小匿的轉(zhuǎn)行經(jīng)歷讓我覺(jué)得找到前輩,就像考試找到小抄一樣。非科班出生,沒(méi)有豐富的商分經(jīng)歷,靠提升硬技能出圈。因此我也加入了小匿的社群,偶爾小匿會(huì)在群里發(fā)一些自己對(duì)某些問(wèn)題的見(jiàn)解,我覺(jué)得很專業(yè)。大概在群里潛水大半年之后,當(dāng)小匿要開(kāi)班時(shí),我果斷報(bào)名了,因?yàn)槲蚁胂到y(tǒng)的學(xué)習(xí)下數(shù)據(jù)分析的知識(shí)點(diǎn),另外在群里這么長(zhǎng)時(shí)間覺(jué)得小匿還是蠻靠譜值得信賴的人。
二、總結(jié)面試問(wèn)題
“公司1”
1.數(shù)據(jù)是怎么監(jiān)控的,跑python定時(shí)腳本,腳本多了卡死怎么辦
2.詢報(bào)價(jià)時(shí)間按周的非周末是否達(dá)標(biāo)。
周一到周四產(chǎn)生的達(dá)標(biāo)了,周五周六的要80小時(shí)。周日20-50小時(shí)波動(dòng)。
3.清洗程序,怎么做的?上線后會(huì)不會(huì)很耗時(shí)間。
不會(huì)耗時(shí),毫秒級(jí)。
編輯距離相似度是2-4秒。
4.聊聊自己的方向
5.是否有漲薪
6.聊聊自己的欠缺的方面
7.為什么跳槽
? ? ? ?首先我得職業(yè)發(fā)展方向是數(shù)據(jù)分析師這個(gè)宗旨是不變的,我很感謝前公司給了我這樣一樣入行的機(jī)會(huì),在這里我磨礪了很多分析,編程,報(bào)告的技能,當(dāng)然我也為公司帶來(lái)了相應(yīng)的改變。但是目前我已經(jīng)具備了一定的積累,為了職業(yè)生涯考慮我希望能夠邁向一個(gè)更合適的平臺(tái),發(fā)揮自己的價(jià)值。
? ? ? ?為什么說(shuō)貴公司是更合適的,對(duì)于數(shù)據(jù)從業(yè)者來(lái)說(shuō),大家都知道數(shù)據(jù)是原材料,是根基。貴公司的規(guī)模之大(說(shuō)一些該公司業(yè)務(wù)細(xì)節(jié),比如門(mén)店多)。這對(duì)我來(lái)說(shuō)吸引力非常大,我希望能夠有幸接觸到這些寶貴的數(shù)據(jù)并從中發(fā)掘價(jià)值。
幫財(cái)務(wù)sumproduct分析。
相似度分析:19%-23%
“公司2”
1.決策樹(shù)怎么選擇特征的,用信息熵增益?基尼系數(shù)。講一講基尼系數(shù)的原理。
2.lgbm的底層是什么樹(shù),回歸樹(shù)還是分類樹(shù)?
3.文本相似度用編輯距離有沒(méi)有比較過(guò)其他算法,還知道其他方法嗎?
4.pandas用的比較多的方法,列與列之間的呢
5.有沒(méi)有用過(guò)spark.
6.如何與業(yè)務(wù)方溝通需求
1.首先需要明確問(wèn)題,明確解決問(wèn)題的方式以及需要做到的程度。2.明確背景及產(chǎn)品迭代過(guò)程,明確業(yè)務(wù)方對(duì)于該項(xiàng)功能的預(yù)期。明確業(yè)務(wù)方的思路。3.細(xì)節(jié)問(wèn)題。數(shù)據(jù)分析是將具體的業(yè)務(wù)問(wèn)題抽象為有組織的數(shù)據(jù),從而發(fā)現(xiàn)規(guī)律,所以在抽象過(guò)程中可能會(huì)涉及到假設(shè)和模型,我們需要溝通假設(shè)和模型的合理性;如果涉及到有歧義的指標(biāo),需要進(jìn)一步溝通指標(biāo)的定義和時(shí)間范圍等等。
是什么,為什么,是如何,細(xì)節(jié)問(wèn)題
7.文本數(shù)據(jù)如何轉(zhuǎn)為數(shù)值數(shù)據(jù)? one hot encoding,label encoder. 有什么區(qū)別。
8.字典排序
"公司2二面"
1.某個(gè)項(xiàng)目的難點(diǎn)
2.怎么去熟悉整個(gè)工作環(huán)境
? ? ? ?先從整體了解整個(gè)部門(mén)在公司的定位和產(chǎn)品,在了解自己的崗位職責(zé),輸入是什么,輸出是什么,最后深入一個(gè)項(xiàng)目去由點(diǎn)及面擴(kuò)展。
3.說(shuō)說(shuō)邏輯回歸,是解決什么問(wèn)題?
4.如何判斷邏輯回歸的閾值是否合適
5.過(guò)擬合和欠擬合怎么辦
6.推薦系統(tǒng),你怎么去做?應(yīng)該是問(wèn)我怎么去選擇特征?
"公司3"
http://1.inexist 哪個(gè)效率高? not in 和not exist呢?
2.事務(wù)的特點(diǎn)
3.相關(guān)與回歸的區(qū)別
4.回歸的R2可以用來(lái)做模型評(píng)估嗎?
5.回歸分析的步驟
6.回歸與因果的關(guān)系
7.標(biāo)準(zhǔn)化回歸分析
8.primary key和unique key的區(qū)別
9.為什么索引的效率會(huì)比較高
10.哪些地方用索引哪些不用索引
11.case when 對(duì)數(shù)值區(qū)間的影響
12.整群抽樣
13.python讀取文件
14.如何判斷特征的重要程度。方差分析。
15.datetime轉(zhuǎn)為date
相關(guān)和因果:
相關(guān):兩個(gè)變量之間的關(guān)系,互為相關(guān),沒(méi)有先后順序;
因果:有先后順序
判斷方式:
1.將要素套到原因和結(jié)果當(dāng)中,依據(jù)經(jīng)驗(yàn)來(lái)判斷
2.看是否純屬巧合
3.是否同時(shí)存在第三個(gè)變量同時(shí)影響
4.是否有逆向關(guān)系,如果成立則不是因果
5.制造反事實(shí),如果不體檢會(huì)不會(huì)影響壽命
做實(shí)驗(yàn)對(duì)比判斷 看是否有顯著性差異。
P值是假設(shè)檢驗(yàn)中,某個(gè)小概率事件發(fā)生的真實(shí)概率,如果這個(gè)小概率事件發(fā)生了(即具備顯著性),那么就要接受H1,拒絕H0;反之,拒絕H1,接受H0。
三、Dathon課程感受
? ? ? ?Dathon課程總結(jié)下來(lái)就是干貨滿滿,之前我也病急亂投醫(yī)買(mǎi)過(guò)一些其他課程,但是對(duì)比下來(lái)會(huì)發(fā)現(xiàn)Dathon課程設(shè)計(jì)很用心每個(gè)主題都會(huì)講解的很透:配有原理和python實(shí)戰(zhàn),而不是隨便收集網(wǎng)上的錄屏和資料讓大家自己看。另外,小匿會(huì)督促大家打卡,我們一期的小伙伴都很用心學(xué)習(xí),大家在小組群里互相探討問(wèn)題,小匿以及助教會(huì)解答大家的難題。
? ? ? ?此外,Dathon課程有精心設(shè)計(jì)的項(xiàng)目,一是讓大家簡(jiǎn)歷上有拿得出手的項(xiàng)目,二是這些項(xiàng)目技能可以直接用在工作中。小匿還會(huì)指導(dǎo)大家的簡(jiǎn)歷和面試,全程輸出經(jīng)驗(yàn)。我覺(jué)得轉(zhuǎn)行路上有這樣的老師相伴,踏實(shí)。
? ? ? ? 感恩遇到小匿!今年已跳槽拿到滿意的offer!期待后續(xù)能跟著小匿大佬繼續(xù)提升!
結(jié)尾
? ? ? ?恭喜這位同學(xué)!每一位Dathoner來(lái)報(bào)喜時(shí)我真得非常的開(kāi)心,一是替這位同學(xué)開(kāi)心,二是讓我感受到教學(xué)的意義。感謝,感謝每位Dathoner,數(shù)據(jù)之路長(zhǎng)著呢,后續(xù),我們一起加油!
? ? ? ?另外,準(zhǔn)備了不少數(shù)據(jù)資料,需要的同學(xué)可以點(diǎn)擊獲取哈~
適合小白學(xué)習(xí)的數(shù)據(jù)分析免費(fèi)資料(持續(xù)更新)
