东方耀AI技术分享

标题: Caffe的数据层及其参数详解 [打印本页]

作者: 东方耀 时间: 2020-7-10 10:03
标题: Caffe的数据层及其参数详解
Caffe的数据层及其参数详解

层有很多种类型，比如Data,Convolution,Pooling等，层之间的数据流动是以Blobs的方式进行。

要运行caffe，需要先创建一个模型（model)，如比较常用的Lenet,Alex等，而一个模型由多个层（layer）构成，每一层又由许多参数组成。所有的参数都定义在caffe.proto这个文件中。
$CAFFE_ROOT/src/caffe/proto/caffe.proto

要熟练使用caffe，最重要的就是学会配置文件（prototxt）的编写。

今天我们就先介绍一下数据层.

数据层是每个模型的最底层，是模型的入口，不仅提供数据的输入，也提供数据从Blobs转换成别的格式进行保存输出。通常数据的预处理（如减去均值, 放大缩小, 裁剪和镜像等），也在这一层设置参数实现

数据来源可以来自高效的数据库（如LevelDB和LMDB），也可以直接来自于内存。如果不是很注重效率的话，数据也可来自磁盘的hdf5文件和图片格式文件。

type: 层类型，如果是Data，表示数据来源于LevelDB或LMDB。根据数据的来源不同，数据层的类型也不同
data 与 label: 在数据层中，至少有一个命名为data的top。如果有第二个top，一般命名为label
transform_param {
scale: 0.00390625
  }
  transform_param是数据的预处理，可以将数据变换到定义的范围内。如设置scale为0.00390625，实际上就是1/255, 即将输入数据由0-255归一化到0-1之间

1、数据来自于数据库  层类型（layer type）:type: "Data"
data_param {
source: "examples/mnist/mnist_train_lmdb"
batch_size: 64
backend: LMDB
  }

2、数据来自于内存  type: "MemoryData"

memory_data_param{
batch_size: 2
height: 100
width: 100
channels: 1
  }

3、数据来自于HDF5  层类型：HDF5Data
hdf5_data_param {
source: "examples/hdf5_classification/data/train.txt"
batch_size: 10
  }


4、数据来自于图片  层类型：ImageData
image_data_param {
source: "examples/_temp/file_list.txt"
batch_size: 50
new_height: 256
new_width: 256
shuffle: true
  }
必须设置的参数：

  source: 一个文本文件的名字，每一行给定一个图片文件的名称和标签（label)

  batch_size: 每一次处理的数据个数，即图片数

可选参数：

  rand_skip: 在开始的时候，路过某个数据的输入。通常对异步的SGD很有用。

  shuffle: 随机打乱顺序，默认值为false

  new_height,new_width: 如果设置，则将图片进行resize

欢迎光临东方耀AI技术分享 (http://www.ai111.vip/)