一、前言
首先,我拿到的是cvte的自然語(yǔ)言處理實(shí)習(xí)生的offer,待遇還不錯(cuò)吧。包吃包住,朝九晚九,一周上五天半的班。下面開始吹水……

二、學(xué)習(xí)過(guò)程
1. 理論基礎(chǔ)
課本:《機(jī)器學(xué)習(xí)》、《概率論與數(shù)理統(tǒng)計(jì)》
視頻:吳恩達(dá)機(jī)器學(xué)習(xí)、吳恩達(dá)深度學(xué)習(xí)、李宏毅機(jī)器學(xué)習(xí)、機(jī)器學(xué)習(xí)-白板推導(dǎo)
2. 代碼能力
課本:《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》、《利用Python進(jìn)行數(shù)據(jù)分析》、《Python自然語(yǔ)言處理》、《TensorFlow實(shí)戰(zhàn)》、廖雪峰Python
視頻:周莫煩Python、B站的Tensorflow教程、動(dòng)手學(xué)習(xí)深度學(xué)習(xí)-李沐
3. 小結(jié)
我的學(xué)習(xí)過(guò)程大概是這樣:
機(jī)器學(xué)習(xí):
- 先看一下機(jī)器學(xué)習(xí)的理論基礎(chǔ),包括上面提到的書和視頻。
- 接著學(xué)一下python基礎(chǔ)。
- 再利用《機(jī)器學(xué)習(xí)實(shí)戰(zhàn)》去把每個(gè)模型理解透徹
- 接著根據(jù) Kaggle 項(xiàng)目實(shí)戰(zhàn) 把每個(gè)模型融會(huì)貫通。
深度學(xué)習(xí):
- 同樣是先看深度學(xué)習(xí)的理論基礎(chǔ)。
- 這一步我很糾結(jié)于編程語(yǔ)言,tensorflow、pytroch、mxnet、keras,基本上我都試了個(gè)遍,跑了基本的cnn、rnn等。
- 刷深度學(xué)習(xí)相關(guān)的論文,跑了個(gè) textCNN。
4. 學(xué)習(xí)建議(結(jié)合各位面試官)
如果你的實(shí)驗(yàn)室沒(méi)項(xiàng)目,你的學(xué)習(xí)全靠自己的話
1. 論文:
論文分為兩部分(只你研究的方向的論文即可)。
一部分是行業(yè)里面現(xiàn)在比較常用的模型,這一部分必須熟練掌握。
另一部分是最新的論文,最好follow一下。能發(fā)論文最好了,鍛煉一下思維以及創(chuàng)新能力。
2. 比賽:
這一部分建立在理解各個(gè)模型的基礎(chǔ)之上。
首先多參加一些有答案的比賽(可能是已經(jīng)結(jié)束的),比如看看kaggle每個(gè)比賽里面的kernal。
掌握一點(diǎn)比賽技巧之后,就可以去爭(zhēng)取一定的名次(最好是研究方向相關(guān))。
這也是我目前正在進(jìn)行做的事。

三、面試經(jīng)歷
1. 深聲科技(3k-6k)
1.1. 最大熵
1.2. 支持向量機(jī)
1.3. 聊聊人生。。
小結(jié)
感覺(jué)他們是要招立馬能工作的人,研一的人去實(shí)習(xí)在面試官眼里就是個(gè)笑話。
這是我的第一個(gè)面試,太老實(shí)了,有什么說(shuō)什么,而且極度不自信。掛了。
2. 數(shù)據(jù)故事(3k-4k)
筆試題目:
2.1. 請(qǐng)用以下任一語(yǔ)言(C/C++/Java/Pyhton)實(shí)現(xiàn)稀疏矩陣乘法運(yùn)算。要求:定義稀疏矩陣的表示;定義計(jì)算稀疏矩陣乘法方法,輸入兩個(gè)稀疏矩陣返回兩矩陣相乘的結(jié)果矩陣。
2.2. 請(qǐng)簡(jiǎn)要說(shuō)明樸素貝葉斯及其計(jì)算過(guò)程。
2.3. bagging、boosting的區(qū)別。
2.4. 請(qǐng)寫出sigmoid函數(shù)的公式定義,并說(shuō)明其在邏輯回歸中的作用。
2.5. 請(qǐng)寫出tf(詞頻率)計(jì)算公式、idf(逆向文檔頻率)的公式和作用。
2.6. 簡(jiǎn)述 L1&L2 正則的區(qū)別。
2.7. 描述 Word2Vec 的原理和訓(xùn)練方法。
2.8. 一維數(shù)據(jù)的擬合,給定數(shù)據(jù)集{xi,yi}(i=1,...,n),xi是訓(xùn)練數(shù)據(jù),yi是對(duì)應(yīng)的預(yù)期值。擬使用線性、二次、高效等函數(shù)進(jìn)行擬合。
(1)請(qǐng)給出三次擬合的誤差函數(shù)表達(dá)式。
(2)按照梯度下降法進(jìn)行擬合,請(qǐng)給出具體的推導(dǎo)過(guò)程。
一面
2.9. 聊項(xiàng)目
2.10. tf-idf
2.11. 詞嵌入,Word2Vec
2.12. 排序算法及其時(shí)間復(fù)雜度
二面
2.13. 聊項(xiàng)目
2.14. 開放性問(wèn)題:海量某行業(yè)數(shù)據(jù),如何對(duì)該數(shù)據(jù)進(jìn)行分析。比如,美的空調(diào)很好。(詞性標(biāo)注、句法分析、句子依賴等……)
HR面
我們這里只有正式工編制和應(yīng)屆生編制,沒(méi)有實(shí)習(xí)生編制。
小結(jié)
筆試:多虧了帆哥,才能把答案寫滿。
面試:面試官對(duì)我的評(píng)價(jià)是,掌握得還不錯(cuò)。
其實(shí)只是剛好問(wèn)到我會(huì)的。那個(gè)開放性問(wèn)題我沒(méi)有回答得上來(lái)。我事前知道他們招的是應(yīng)屆生,本來(lái)是想著去混面試經(jīng)驗(yàn)的,就沒(méi)有騙他們我是19屆畢業(yè)了。
3.CVTE
一面
3.1. 如何用HMM進(jìn)行分詞
3.2. 解釋一下貝葉斯,它的公式是怎樣的,哪個(gè)是先驗(yàn),哪個(gè)是后驗(yàn)
3.3. 什么是最大團(tuán),跟勢(shì)函數(shù)有什么關(guān)系?
3.4. 計(jì)算機(jī)網(wǎng)絡(luò)的五層模型
3.5. 知道哪些設(shè)計(jì)模型?解釋一下?有哪些應(yīng)用場(chǎng)景?
二面
3.6. HMM、CRF的區(qū)別
3.7. 解釋一下fastText文本分類
3.8. 解釋一下textCNN
終面
- 給自己前面面試打分
- 從哪里知道CVTE的
- 家庭情況、個(gè)人介紹
- 本科期間,你做過(guò)最有成就的事
- 本科期間,你努力了也未能達(dá)到的事。
- 本科期間,最有挑戰(zhàn)性的事。
- 未來(lái)工作、生活的規(guī)劃
- 人生目標(biāo)
- 考研的原因(這個(gè)可能是因?yàn)槲艺f(shuō)我最有成就感的事是考研)。
- 如果給你offer,你會(huì)因?yàn)槭裁炊粊?lái)
總結(jié)
能拿到這個(gè)offer,5分靠運(yùn)氣,4分靠實(shí)力,1分靠助攻。
運(yùn)氣:1. 我的簡(jiǎn)歷居然過(guò)了篩選,里面其實(shí)沒(méi)多少東西。2. 一面居然過(guò)了,其實(shí)有很多題目沒(méi)有全部答對(duì),并且很緊張。3. 面試官問(wèn)的東西,剛好是我會(huì)的。
助攻:在準(zhǔn)備HR面試的時(shí)候,舍友幫了我不少。
感覺(jué)技術(shù)面還是相對(duì)簡(jiǎn)單一點(diǎn)的吧,而且我只跟面試官聊了20分鐘不到。別的實(shí)習(xí)生,真正有項(xiàng)目的,都差不多聊了一個(gè)小時(shí)。
HR面的話,就盡量表現(xiàn)地真誠(chéng)一點(diǎn)、很想來(lái)這家公司;表現(xiàn)得很符合這家公司的企業(yè)文化。
四、感謝
1. 感謝我的舍友,帆哥,在準(zhǔn)備HR面試的時(shí)候,幫我仔細(xì)修改每個(gè)問(wèn)題的答案。
2. 感謝我的導(dǎo)師,給了我全部的自由和絕對(duì)的支持。
- 感謝一下自己吧(臭不要臉2333)。想過(guò)放棄搞人工智能很多次,最終還是堅(jiān)持下來(lái)了。
-
注重成長(zhǎng),期待畢業(yè)前能實(shí)現(xiàn)第三個(gè)小目標(biāo)吧。
image.png
