1.數(shù)據(jù)層及參數(shù)

要運(yùn)行caffe,需要?jiǎng)?chuàng)建一個(gè)model,比如入門常用的Lenet and Alex etc. 而一個(gè)模型由多個(gè)layer 組成,每一個(gè)layer 有很多參數(shù)。所有的參數(shù)定義在caffe.proto 文件中。要熟練使用caffe 這個(gè)工具,最重要的就是學(xué)會(huì)怎么寫配置文件(prototxt).
??layer有很多種類型,比如Data,Convolution,Pooling等,層之間的數(shù)據(jù)流動(dòng)是以Blobs的方式進(jìn)行。
??今天我們就先介紹一下數(shù)據(jù)層。數(shù)據(jù)層是每個(gè)模型的最底層,是模型的入口,不僅提供數(shù)據(jù)的輸入,也提供數(shù)據(jù)從Blobs轉(zhuǎn)換成別的格式進(jìn)行保存輸出。通常數(shù)據(jù)的預(yù)處理(如減去均值, 放大縮小, 裁剪和鏡像等),也在這一層設(shè)置參數(shù)實(shí)現(xiàn)。
??數(shù)據(jù)來源可以來自高效的數(shù)據(jù)庫(如LevelDB和LMDB),也可以直接來自于內(nèi)存。如果不是很注重效率的話,數(shù)據(jù)也可來自磁盤的hdf5文件和圖片格式文件。
??所有的數(shù)據(jù)層都具有的公用參數(shù):先看示例:

layer {
  name: "cifar"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    mean_file: "examples/cifar10/mean.binaryproto"
  }
  data_param {
    source: "examples/cifar10/cifar10_train_lmdb"
    batch_size: 100
    backend: LMDB
  }
}
  • name: 表示該層的名稱,可隨意取
  • type: 層類型,如果是Data,表示數(shù)據(jù)來源于LevelDB或LMDB。根據(jù)數(shù)據(jù)的來源不同,數(shù)據(jù)層的類型也不同(后面會(huì)詳細(xì)闡述)。一般在練習(xí)的時(shí)候,我們都是采 用的LevelDB或LMDB數(shù)據(jù),因此層類型設(shè)置為Data。
  • top或bottom: 每一層用bottom來輸入數(shù)據(jù),用top來輸出數(shù)據(jù)。如果只有top沒有bottom,則此層只有輸出,沒有輸入。反之亦然。如果有多個(gè) top或多個(gè)bottom,表示有多個(gè)blobs數(shù)據(jù)的輸入和輸出。
  • data 與 label: 在數(shù)據(jù)層中,至少有一個(gè)命名為data的top。如果有第二個(gè)top,一般命名為label。 這種(data,label)配對(duì)是分類模型所必需的。
  • include: 一般訓(xùn)練的時(shí)候和測(cè)試的時(shí)候,模型的層是不一樣的。該層(layer)是屬于訓(xùn)練階段的層,還是屬于測(cè)試階段的層,需要用include來指定。如果沒有include參數(shù),則表示該層既在訓(xùn)練模型中,又在測(cè)試模型中。
  • Transformations: 數(shù)據(jù)的預(yù)處理,可以將數(shù)據(jù)變換到定義的范圍內(nèi)。如設(shè)置scale為0.00390625,實(shí)際上就是1/255, 即將輸入數(shù)據(jù)由0-255歸一化到0-1之間。

其它的數(shù)據(jù)預(yù)處理也在這個(gè)地方設(shè)置:

transform_param {
    scale: 0.00390625
    mean_file_size: "examples/cifar10/mean.binaryproto"
    # 用一個(gè)配置文件來進(jìn)行均值操作
    mirror: 1  #1表示開啟鏡像,0表示關(guān)閉,也可用ture和false來表示
    # 剪裁一個(gè) 227*227的圖塊,在訓(xùn)練階段隨機(jī)剪裁,在測(cè)試階段從中間裁剪
    crop_size: 227
  }

后面的data_param部分,就是根據(jù)數(shù)據(jù)的來源不同,來進(jìn)行不同的設(shè)置。

1、數(shù)據(jù)來自于數(shù)據(jù)庫(如LevelDB和LMDB)

  • 層類型(layer type):Data
    必須設(shè)置的參數(shù):
  • source: 包含數(shù)據(jù)庫的目錄名稱,如examples/mnist/mnist_train_lmdb
  • batch_size: 每次處理的數(shù)據(jù)個(gè)數(shù),如64
    可選的參數(shù):
  • rand_skip: 在開始的時(shí)候,路過某個(gè)數(shù)據(jù)的輸入。通常對(duì)異步的SGD很有用。
  • backend: 選擇是采用LevelDB還是LMDB, 默認(rèn)是LevelDB.

示例:

layer {
  name: "mnist"
  type: "Data"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    scale: 0.00390625
  }
  data_param {
    source: "examples/mnist/mnist_train_lmdb"
    batch_size: 64
    backend: LMDB
  }
}

2、數(shù)據(jù)來自于內(nèi)存

  • 層類型:MemoryData
    必須設(shè)置的參數(shù):
  • batch_size:每一次處理的數(shù)據(jù)個(gè)數(shù),比如2
  • channels:通道數(shù)
  • height:高度
  • width: 寬度

示例:

layer {
  top: "data"
  top: "label"
  name: "memory_data"
  type: "MemoryData"
  memory_data_param{
    batch_size: 2
    height: 100
    width: 100
    channels: 1
  }
  transform_param {
    scale: 0.0078125
    mean_file: "mean.proto"
    mirror: false
  }
}

3、數(shù)據(jù)來自于HDF5

  • 層類型:HDF5Data
    必須設(shè)置的參數(shù):
  • source: 讀取的文件名稱
  • batch_size: 每一次處理的數(shù)據(jù)個(gè)數(shù)

示例:

layer {
  name: "data"
  type: "HDF5Data"
  top: "data"
  top: "label"
  hdf5_data_param {
    source: "examples/hdf5_classification/data/train.txt"
    batch_size: 10
  }
}

4、數(shù)據(jù)來自于圖片

  • 層類型:ImageData
    必須設(shè)置的參數(shù):
  • source: 一個(gè)文本文件的名字,每一行給定一個(gè)圖片文件的名稱和標(biāo)簽(label)
  • batch_size: 每一次處理的數(shù)據(jù)個(gè)數(shù),即圖片數(shù)
    可選參數(shù):
  • rand_skip: 在開始的時(shí)候,路過某個(gè)數(shù)據(jù)的輸入。通常對(duì)異步的SGD很有用。
  • shuffle: 隨機(jī)打亂順序,默認(rèn)值為false
  • new_height,new_width: 如果設(shè)置,則將圖片進(jìn)行resize

示例:

layer {
  name: "data"
  type: "ImageData"
  top: "data"
  top: "label"
  transform_param {
    mirror: false
    crop_size: 227
    mean_file: "data/ilsvrc12/imagenet_mean.binaryproto"
  }
  image_data_param {
    source: "examples/_temp/file_list.txt"
    batch_size: 50
    new_height: 256
    new_width: 256
  }
}

5、數(shù)據(jù)來源于Windows

  • 層類型:WindowData
    必須設(shè)置的參數(shù):
  • source: 一個(gè)文本文件的名字
  • batch_size: 每一次處理的數(shù)據(jù)個(gè)數(shù),即圖片數(shù)

示例:

layer {
  name: "data"
  type: "WindowData"
  top: "data"
  top: "label"
  include {
    phase: TRAIN
  }
  transform_param {
    mirror: true
    crop_size: 227
    mean_file: "data/ilsvrc12/imagenet_mean.binaryproto"
  }
  window_data_param {
    source: "examples/finetune_pascal_detection/window_file_2007_trainval.txt"
    batch_size: 128
    fg_threshold: 0.5
    bg_threshold: 0.5
    fg_fraction: 0.25
    context_pad: 16
    crop_mode: "warp"
  }
}

雖然都是別人寫過的東西,但是自己再重新整理一遍還是很有意義的,尤其對(duì)于我這樣一個(gè)健忘的人,要學(xué)習(xí)的東西太多了,我們不可能記住那么多,多總結(jié),前人的精華融入自己的理解就是自己成長(zhǎng)的階梯,為了明天的我加油!

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容