|
Caffe的数据层及其参数详解
层有很多种类型,比如Data,Convolution,Pooling等,层之间的数据流动是以Blobs的方式进行。
要运行caffe,需要先创建一个模型(model),如比较常用的Lenet,Alex等, 而一个模型由多个层(layer)构成,每一层又由许多参数组成。所有的参数都定义在caffe.proto这个文件中。
$CAFFE_ROOT/src/caffe/proto/caffe.proto
要熟练使用caffe,最重要的就是学会配置文件(prototxt)的编写。
今天我们就先介绍一下数据层.
数据层是每个模型的最底层,是模型的入口,不仅提供数据的输入,也提供数据从Blobs转换成别的格式进行保存输出。通常数据的预处理(如减去均值, 放大缩小, 裁剪和镜像等),也在这一层设置参数实现
数据来源可以来自高效的数据库(如LevelDB和LMDB),也可以直接来自于内存。如果不是很注重效率的话,数据也可来自磁盘的hdf5文件和图片格式文件。
type: 层类型,如果是Data,表示数据来源于LevelDB或LMDB。根据数据的来源不同,数据层的类型也不同
data 与 label: 在数据层中,至少有一个命名为data的top。如果有第二个top,一般命名为label
transform_param {
scale: 0.00390625
}
transform_param是数据的预处理,可以将数据变换到定义的范围内。如设置scale为0.00390625,实际上就是1/255, 即将输入数据由0-255归一化到0-1之间
1、数据来自于数据库 层类型(layer type):type: "Data"
data_param {
source: "examples/mnist/mnist_train_lmdb"
batch_size: 64
backend: LMDB
}
2、数据来自于内存 type: "MemoryData"
memory_data_param{
batch_size: 2
height: 100
width: 100
channels: 1
}
3、数据来自于HDF5 层类型:HDF5Data
hdf5_data_param {
source: "examples/hdf5_classification/data/train.txt"
batch_size: 10
}
4、数据来自于图片 层类型:ImageData
image_data_param {
source: "examples/_temp/file_list.txt"
batch_size: 50
new_height: 256
new_width: 256
shuffle: true
}
必须设置的参数:
source: 一个文本文件的名字,每一行给定一个图片文件的名称和标签(label)
batch_size: 每一次处理的数据个数,即图片数
可选参数:
rand_skip: 在开始的时候,路过某个数据的输入。通常对异步的SGD很有用。
shuffle: 随机打乱顺序,默认值为false
new_height,new_width: 如果设置,则将图片进行resize
|
|