平时处理数据时,CSV是最常见的格式,文件的每行记录一个向量,其中最后一列为标记。TensorFlow提供了非常便捷的方式从CSV文件中读取数据集。
加载对应的函数库:
import tensorflow as tf import numpy as np
从CSV文件中读取数据:
training_set = tf.contrib.learn.datasets.base.load_csv_with_header( filename=" iris_training.csv", target_dtype=np.int, features_dtype=np.float32) feature_columns = [tf.contrib.layers.real_valued_column("", dimension=4)]
其中各个参数定义为:
·filename,文件名;
·target_dtype,标记数据类型;
·features_dtype,特征数据类型。
访问数据集合的特征以及标记的方式为:
x=training_set.data y=training_set.target