东方耀AI技术分享

标题: Caffe的数据层及其参数详解 [打印本页]

作者: 东方耀    时间: 2020-7-10 10:03
标题: Caffe的数据层及其参数详解
Caffe的数据层及其参数详解

层有很多种类型,比如Data,Convolution,Pooling等,层之间的数据流动是以Blobs的方式进行。

要运行caffe,需要先创建一个模型(model),如比较常用的Lenet,Alex等, 而一个模型由多个层(layer)构成,每一层又由许多参数组成。所有的参数都定义在caffe.proto这个文件中。
$CAFFE_ROOT/src/caffe/proto/caffe.proto

要熟练使用caffe,最重要的就是学会配置文件(prototxt)的编写。

今天我们就先介绍一下数据层.

数据层是每个模型的最底层,是模型的入口,不仅提供数据的输入,也提供数据从Blobs转换成别的格式进行保存输出。通常数据的预处理(如减去均值, 放大缩小, 裁剪和镜像等),也在这一层设置参数实现

数据来源可以来自高效的数据库(如LevelDB和LMDB),也可以直接来自于内存。如果不是很注重效率的话,数据也可来自磁盘的hdf5文件和图片格式文件。


type: 层类型,如果是Data,表示数据来源于LevelDB或LMDB。根据数据的来源不同,数据层的类型也不同
data 与 label: 在数据层中,至少有一个命名为data的top。如果有第二个top,一般命名为label
transform_param {
    scale: 0.00390625
  }
  transform_param是数据的预处理,可以将数据变换到定义的范围内。如设置scale为0.00390625,实际上就是1/255, 即将输入数据由0-255归一化到0-1之间
  
1、数据来自于数据库  层类型(layer type):type: "Data"
data_param {
    source: "examples/mnist/mnist_train_lmdb"
    batch_size: 64
    backend: LMDB
  }
  
2、数据来自于内存  type: "MemoryData"

memory_data_param{
    batch_size: 2
    height: 100
    width: 100
    channels: 1
  }
  
3、数据来自于HDF5  层类型:HDF5Data
hdf5_data_param {
    source: "examples/hdf5_classification/data/train.txt"
    batch_size: 10
  }
  
  
4、数据来自于图片  层类型:ImageData
image_data_param {
    source: "examples/_temp/file_list.txt"
    batch_size: 50
    new_height: 256
    new_width: 256
    shuffle: true
  }
必须设置的参数:

  source: 一个文本文件的名字,每一行给定一个图片文件的名称和标签(label)

  batch_size: 每一次处理的数据个数,即图片数

可选参数:

  rand_skip: 在开始的时候,路过某个数据的输入。通常对异步的SGD很有用。

  shuffle: 随机打乱顺序,默认值为false

  new_height,new_width: 如果设置,则将图片进行resize
  










欢迎光临 东方耀AI技术分享 (http://www.ai111.vip/) Powered by Discuz! X3.4