1.【實習(xí)】信息流
時間:4月10號左右
形式:一共三面,2輪技術(shù)面,1輪HR面
1面(技術(shù)面)
做個自我介紹吧~
聊聊項目吧~
詳細問了畢設(shè)項目
給文字廣告配圖的實際場景,相關(guān)的解決辦法
C++的考察
要求看懂(線上C++,線下python的模式)
Static 作用
類名 花括號初始化? 是一種什么構(gòu)造方式?……?
2面(技術(shù)面)
做個自我介紹吧~
圖像描述生成項目
算法?
二叉樹 節(jié)點和的最小值與路徑
3面(Hr 面)
保研or考研?
家鄉(xiāng)在哪里
今后發(fā)展規(guī)劃呀(留京,行業(yè))
簡歷上這些項目是實驗室項目嗎
這些項目是基于興趣嗎?
項目的完成人數(shù)(獨自 or 團隊)
競賽的一些成績
可實習(xí)時間
有沒有其他公司的投遞與面試
有沒有考慮過國企等
技術(shù)線路規(guī)劃(專一技術(shù) or 也有產(chǎn)品的可能)
自我評價
有什么問題想問我嘛
整體2小時,包括等待
2.【校招】人工智能研究院
(1)第一位打開我github的面試官
(2)面試考察得比較深,包括一些語言背后的深層機制
(3)由于對python的一些機制不是很了解,很快就達成了一致,吾非你所求,一面掛
3.【補錄】搜索部門
時間:1月19號
形式:2輪技術(shù)面,1輪HR面
一面
自我介紹
畢設(shè)項目,強調(diào)了雖然和圖像相關(guān),但主要做nlp算法
第一份實習(xí)的工作簡單問了幾句
第二家實習(xí),自編碼器部分問了幾句
出一個問題:如果有很多文章標題,如何提取關(guān)鍵詞(假設(shè)標簽全部在標題中,不考慮語意層面)
我的回答:
1)最簡單:詞頻。一種是先分詞,再統(tǒng)計詞頻,第二種是不分詞,直接統(tǒng)計串出現(xiàn)的頻率(適合新詞發(fā)現(xiàn))
2)tf-idf 計算詞的權(quán)重,權(quán)重大的作為關(guān)鍵詞,提取出來
3)作為序列標注問題來解答。
那序列標注有哪些解決途徑?
1)HMM模型。
模型假設(shè)有(1)當(dāng)前時刻狀態(tài)只與前一時刻有關(guān)(2)當(dāng)前發(fā)射只與當(dāng)前狀態(tài)有關(guān)
模型(pai,A,B),分別的意義…
用維特比算法來求解。
2)CRF模型。
模型上…樣的,與HMM在模型假設(shè)上的不同點…
之前有用過工具包,通過人工提取一些特征(uni特征,bi-特征等等),訓(xùn)練模型
3)目前最先進的是? CNN+LSTM+CRF模型
優(yōu)點:不用自己提取特征;準確度高
CNN有什么好處?
我的回答:可以彌補LSTM的歷史信息遺忘問題,每個詞的位置是平等的
(面試官補充,可以不分詞,省去了分詞上的誤差)
算法題:
用C寫 strcopy
(寫得很爛,面試官不斷提點)
二面
一個目光炯炯有神的工程小哥哥~
簡單問了下簡歷,沒有任何為難
HR面
很和善,常見套路問題,以及如果發(fā)offer,接受意愿如何