InputFormat

InputFormat 的作用:

數(shù)據(jù)輸入->splits-><key,val>鍵值對(duì)。

將數(shù)據(jù)轉(zhuǎn)化成為鍵值對(duì),供Map使用。

所以InputFormat后面跟隨的泛型,就是map所處理的類(lèi)型。

InputFormat之中的 getSplits() 獲取split。

內(nèi)部的RecordReader 將split 轉(zhuǎn)化成為鍵值對(duì)。

自定義InputFormat 的關(guān)鍵 在于 自定義實(shí)現(xiàn) RecordReader

這個(gè)類(lèi)用來(lái)解析split,來(lái)確定,返回的鍵值對(duì)是什么。

自定義的RecordReader






自定義InputFormat?


?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容