InputFormat 的作用:
數(shù)據(jù)輸入->splits-><key,val>鍵值對(duì)。
將數(shù)據(jù)轉(zhuǎn)化成為鍵值對(duì),供Map使用。
所以InputFormat后面跟隨的泛型,就是map所處理的類(lèi)型。
InputFormat之中的 getSplits() 獲取split。
內(nèi)部的RecordReader 將split 轉(zhuǎn)化成為鍵值對(duì)。
自定義InputFormat 的關(guān)鍵 在于 自定義實(shí)現(xiàn) RecordReader
這個(gè)類(lèi)用來(lái)解析split,來(lái)確定,返回的鍵值對(duì)是什么。
自定義的RecordReader




自定義InputFormat?
