經(jīng)歷了水深火熱的大數(shù)據(jù)學(xué)習(xí),終于撥開云霧見天明了,但你離成功總是還差了一步,那就是拿到大數(shù)據(jù)工程師的Offer。
在電腦旁奮斗了無數(shù)個(gè)日夜,代碼敲了無數(shù)遍,項(xiàng)目整改了無數(shù)遍,只為了得到一份自己滿意的高薪資高待遇的Offer。但這個(gè)收獲不僅僅需要你學(xué)到嫻熟的大數(shù)據(jù)技術(shù),還需要在面試之前精心準(zhǔn)備,了解自己要應(yīng)聘的企業(yè)發(fā)展?fàn)顩r、 自己應(yīng)聘崗位的技術(shù)要求等等,除此之外,多看一些大數(shù)據(jù)面試題也是很有必要的,給自己漲漲經(jīng)驗(yàn)。
小編雖然不能幫你調(diào)查你理想企業(yè)的發(fā)展?fàn)顩r,但大數(shù)據(jù)常見面試題早已經(jīng)為你準(zhǔn)備好了,需要的盡快收入囊中吧!
1.scala 語言有什么特點(diǎn),什么是函數(shù)式編程?有什么優(yōu)點(diǎn)
2.scala 伴生對(duì)象有什么作用
3.scala 并發(fā)編程是怎么弄得,你對(duì) actor 模型怎么理解有何優(yōu)點(diǎn)
4.Spark如何處理結(jié)構(gòu)化數(shù)據(jù),Spark如何處理非結(jié)構(gòu)話數(shù)據(jù)?
5.Spark性能優(yōu)化主要有哪些手段?
6.對(duì)于Spark你覺得他對(duì)于現(xiàn)有大數(shù)據(jù)的現(xiàn)狀的優(yōu)勢(shì)和劣勢(shì)在哪里?
7.對(duì)于算法是否進(jìn)行過自主的研究設(shè)計(jì)?
8.簡要描述你了解的一些數(shù)據(jù)挖掘算法與內(nèi)容
9.怎么用spark做數(shù)據(jù)清洗
10.跟我聊聊spark的應(yīng)用,商場(chǎng)里廣告投放,以及黃牛檢測(cè)
11.spark讀取 數(shù)據(jù),是幾個(gè)Partition呢? hdfs幾個(gè)block 就有幾個(gè) Partition?
12.Mogodb和hbase的區(qū)別
13.開發(fā)中遇到的問題
14.HIVE的優(yōu)化
15.linux的啟動(dòng)順序
16.編譯好的scala程序,運(yùn)行時(shí)還需要scala環(huán)境嗎
17.Write a java program to implement Stack in java.
18.Linkedlist和ArrayList的區(qū)別
19.hadoop中combiner的作用
20.用mr設(shè)計(jì)一個(gè)分組排重計(jì)數(shù)算法
21.用MapReduce找出存在公共好友的兩個(gè)人
22.hdfs存儲(chǔ)機(jī)制
23.MapReduce原理
24.hadoop運(yùn)行原理
25.hadoop 的 namenode 宕機(jī),怎么解決
26.Hbase 的特性,以及你怎么去設(shè)計(jì) rowkey 和 columnFamily ,怎么去建一個(gè)table
27.Redis,傳統(tǒng)數(shù)據(jù)庫,hbase,hive 每個(gè)之間的區(qū)別(問的非常細(xì))
28.說下對(duì)hadoop 的一些理解,包括哪些組件
29.詳細(xì)講解下你流式實(shí)時(shí)計(jì)算的項(xiàng)目部署以及收集的結(jié)果情況
30.實(shí)時(shí)流式計(jì)算框架,幾個(gè)人,多長時(shí)間,細(xì)節(jié)問題,包括講flume ,kafka ,storm 的各個(gè)的組件組成,你負(fù)責(zé)那一塊,如果需要你搭建你可以完成么?