"笨方法"學(xué)習(xí)CNN圖像識(shí)別(二)—— tfrecord格式高效讀取數(shù)據(jù)

原文地址:https://finthon.com/learn-cnn-two-tfrecord-read-data/
-- 全文閱讀5分鐘 --

在本文中,你將學(xué)習(xí)到以下內(nèi)容:


  • 將圖片數(shù)據(jù)制作成tfrecord格式
  • 將tfrecord格式數(shù)據(jù)還原成圖片

前言

tfrecord是TensorFlow官方推薦的標(biāo)準(zhǔn)格式,能夠?qū)D片數(shù)據(jù)和標(biāo)簽一起存儲(chǔ)成二進(jìn)制文件,在TensorFlow中實(shí)現(xiàn)快速地復(fù)制、移動(dòng)、讀取和存儲(chǔ)操作。訓(xùn)練網(wǎng)絡(luò)的時(shí)候,通過(guò)建立隊(duì)列系統(tǒng),可以預(yù)先將tfrecord格式的數(shù)據(jù)加載進(jìn)隊(duì)列,隊(duì)列會(huì)自動(dòng)實(shí)現(xiàn)數(shù)據(jù)隨機(jī)或有序地進(jìn)出棧,并且隊(duì)列系統(tǒng)和模型訓(xùn)練是獨(dú)立進(jìn)行的,這就加速了我們模型的讀取和訓(xùn)練。

準(zhǔn)備圖片數(shù)據(jù)

按照圖片預(yù)處理教程,我們獲得了兩組resize成224*224大小的商標(biāo)圖片集,把標(biāo)簽分別命名成1和2兩類(lèi),如下圖:

兩類(lèi)圖片數(shù)據(jù)集

label:1

label:2

我們現(xiàn)在就將這兩個(gè)類(lèi)別的圖片集制作成tfrecord格式。

制作tfrecord格式

導(dǎo)入必要的庫(kù):

import os
from PIL import Image
import tensorflow as tf

定義一些路徑和參數(shù):

# 圖片路徑,兩組標(biāo)簽都在該目錄下
cwd = r"./brand_picture/"

# tfrecord文件保存路徑
file_path = r"./"

# 每個(gè)tfrecord存放圖片個(gè)數(shù)
bestnum = 1000

# 第幾個(gè)圖片
num = 0

# 第幾個(gè)TFRecord文件
recordfilenum = 0

# 將labels放入到classes中
classes = []
for i in os.listdir(cwd):
    classes.append(i)

# tfrecords格式文件名
ftrecordfilename = ("traindata_63.tfrecords-%.3d" % recordfilenum)
writer = tf.python_io.TFRecordWriter(os.path.join(file_path, ftrecordfilename))

bestnum控制每個(gè)tfrecord的大小,這里使用1000,首先定義tf.python_io.TFRecordWriter,方便后面寫(xiě)入存儲(chǔ)數(shù)據(jù)。
制作tfrecord格式時(shí),實(shí)際上是將圖片和標(biāo)簽一起存儲(chǔ)在tf.train.Example中,它包含了一個(gè)字典,鍵是一個(gè)字符串,值的類(lèi)型可以是BytesList,F(xiàn)loatList和Int64List。

for index, name in enumerate(classes):
    class_path = os.path.join(cwd, name)
    for img_name in os.listdir(class_path):
        num = num + 1
        if num > bestnum:    #超過(guò)1000,寫(xiě)入下一個(gè)tfrecord
            num = 1
            recordfilenum += 1
            ftrecordfilename = ("traindata_63.tfrecords-%.3d" % recordfilenum)
            writer = tf.python_io.TFRecordWriter(os.path.join(file_path, ftrecordfilename))
        
        img_path = os.path.join(class_path, img_name)  # 每一個(gè)圖片的地址
        img = Image.open(img_path, 'r')
        img_raw = img.tobytes()  # 將圖片轉(zhuǎn)化為二進(jìn)制格式
        example = tf.train.Example(
            features=tf.train.Features(feature={
                'label': tf.train.Feature(int64_list=tf.train.Int64List(value=[index])),
                'img_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw])),
            }))
        writer.write(example.SerializeToString())  # 序列化為字符串
writer.close()

在這里我們保存的label是classes中的編號(hào)索引,即0和1,你也可以改成文件名作為label,但是一定是int類(lèi)型。圖片讀取以后轉(zhuǎn)化成了二進(jìn)制格式。最后通過(guò)writer寫(xiě)入數(shù)據(jù)到tfrecord中。
最終我們?cè)诋?dāng)前目錄下生成一個(gè)tfrecord文件:

tfrecord文件

讀取tfrecord文件

讀取tfrecord文件是存儲(chǔ)的逆操作,我們定義一個(gè)讀取tfrecord的函數(shù),方便后面調(diào)用。

import tensorflow as tf


def read_and_decode_tfrecord(filename):
    filename_deque = tf.train.string_input_producer(filename)
    reader = tf.TFRecordReader()
    _, serialized_example = reader.read(filename_deque)
    features = tf.parse_single_example(serialized_example, features={
        'label': tf.FixedLenFeature([], tf.int64),
        'img_raw': tf.FixedLenFeature([], tf.string)})
    label = tf.cast(features['label'], tf.int32)
    img = tf.decode_raw(features['img_raw'], tf.uint8)
    img = tf.reshape(img, [224, 224, 3])
    img = tf.cast(img, tf.float32) / 255.0
    return img, label


train_list = ['traindata_63.tfrecords-000']
img, label = read_and_decode_tfrecord(train_list)

這段代碼主要是通過(guò)tf.TFRecordReader讀取里面的數(shù)據(jù),并且還原數(shù)據(jù)類(lèi)型,最后我們對(duì)圖片矩陣進(jìn)行歸一化。到這里我們就完成了tfrecord輸出,可以對(duì)接后面的訓(xùn)練網(wǎng)絡(luò)了。
如果我們想直接還原成原來(lái)的圖片,就需要先注釋掉讀取tfrecord函數(shù)中的歸一化一行,并添加部分代碼,完整代碼如下:

import tensorflow as tf
from PIL import Image
import matplotlib.pyplot as plt


def read_and_decode_tfrecord(filename):
    filename_deque = tf.train.string_input_producer(filename)
    reader = tf.TFRecordReader()
    _, serialized_example = reader.read(filename_deque)
    features = tf.parse_single_example(serialized_example, features={
        'label': tf.FixedLenFeature([], tf.int64),
        'img_raw': tf.FixedLenFeature([], tf.string)})
    label = tf.cast(features['label'], tf.int32)
    img = tf.decode_raw(features['img_raw'], tf.uint8)
    img = tf.reshape(img, [224, 224, 3])
    # img = tf.cast(img, tf.float32) / 255.0      #將矩陣歸一化0-1之間
    return img, label


train_list = ['traindata_63.tfrecords-000']
img, label = read_and_decode_tfrecord(train_list)
img_batch, label_batch = tf.train.batch([img, label], num_threads=2, batch_size=2, capacity=1000)

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    # 創(chuàng)建一個(gè)協(xié)調(diào)器,管理線程
    coord = tf.train.Coordinator()
    # 啟動(dòng)QueueRunner,此時(shí)文件名隊(duì)列已經(jīng)進(jìn)隊(duì)
    threads = tf.train.start_queue_runners(sess=sess, coord=coord)
    while True:
        b_image, b_label = sess.run([img_batch, label_batch])
        b_image = Image.fromarray(b_image[0])
        plt.imshow(b_image)
        plt.axis('off')
        plt.show()
    coord.request_stop()
    # 其他所有線程關(guān)閉之后,這一函數(shù)才能返回
    coord.join(threads)

在后面建立了一個(gè)隊(duì)列tf.train.batch,通過(guò)Session調(diào)用順序隊(duì)列系統(tǒng),輸出每張圖片。Session部分在訓(xùn)練網(wǎng)絡(luò)的時(shí)候還會(huì)講到。我們學(xué)習(xí)tfrecord過(guò)程,能加深對(duì)數(shù)據(jù)結(jié)構(gòu)和類(lèi)型的理解。到這里我們對(duì)tfrecord格式的輸入輸出有了一定了解,我們訓(xùn)練網(wǎng)絡(luò)的準(zhǔn)備工作已完成,接下來(lái)就是我們CNN模型的搭建工作了。

可能感興趣

"笨方法"學(xué)習(xí)CNN圖像識(shí)別(一)—— 圖片預(yù)處理
"笨方法"學(xué)習(xí)CNN圖像識(shí)別(二)—— tfrecord格式高效讀取數(shù)據(jù)
"笨方法"學(xué)習(xí)CNN圖像識(shí)別(三)—— ResNet網(wǎng)絡(luò)訓(xùn)練及預(yù)測(cè)
使用Python+Tensorflow的CNN技術(shù)快速識(shí)別驗(yàn)證碼


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容