3.3.3 数据读取

平时处理数据时,CSV是最常见的格式,文件的每行记录一个向量,其中最后一列为标记。TensorFlow提供了非常便捷的方式从CSV文件中读取数据集。

加载对应的函数库:


    import tensorflow as tf
import numpy as np

从CSV文件中读取数据:


    training_set = tf.contrib.learn.datasets.base.load_csv_with_header(
    filename=" iris_training.csv",
    target_dtype=np.int,
    features_dtype=np.float32)
feature_columns = [tf.contrib.layers.real_valued_column("", dimension=4)]

其中各个参数定义为:

·filename,文件名;

·target_dtype,标记数据类型;

·features_dtype,特征数据类型。

访问数据集合的特征以及标记的方式为:


x=training_set.data
y=training_set.target