宜配屋

本文实例讲述了Python Tensor FLow简单使用方法。分享给大家供大家参考，具体如下：

1、基础概念

Tensor表示张量，是一种多维数组的数据结构。Flow代表流，是指张量之间通过计算而转换的过程。TensorFLow通过一个计算图的形式表示编程过程，数据在每个节点之间流动，经过节点加工之后流向下一个节点。

计算图是一个有向图，其组成如下：节点：代表一个操作。边：代表节点之间的数据传递和控制依赖，其中实线代表两个节点之间的数据传递关系，虚线代表两个节点之间存在控制相关。

张量是所有数据的表示形式，可以将其理解为一个多维数组。零阶张量就是标量（scalar），表示一个数，一阶张量为一维数组，即向量（vector）。n阶张量也就是n维数组。张量并不保存具体数字，它保存的是计算过程。

下面的例子是将节点1、2的值相加得到节点3。

import tensorflow as tf 
node1=tf.constant(3.0,tf.float32,name='node1')  #创建浮点数节点
node2=tf.constant(4.0,tf.float32,name='node2')
node3=tf.add(node1,node2)       #节点三进行相加操作,源于节点1、2
ses=tf.Session()
print(node3)      #输出张量：Tensor("Add_3:0", shape=(), dtype=float32)
print(ses.run(node3))    #通过会话运行节点三，将节点1、2相加，输出：7.0
ses.close()           #不使用时，关闭会话

直接print(node3)输出的结果不是具体的值，而是张量结构。因为创建计算图只是建立了计算模型，只有会话执行run()才能获得具体结果。

Tensor("Add_3:0", shape=(), dtype=float32)中，Add表示节点名称，3表示这是该节点的第3个输出。shape表示张量的维度信息，()代表标量。dtype表示张量的类型，每个张量的类型唯一，如果不匹配会报错，不带小数点的默认类型为int32，带小数点默认为float35。下面的例子为更复杂的张量类型：

tensor1=tf.constant([[[1,1,1],[1,2,1]],
     [[2,1,1],[2,2,1]],
     [[3,1,1],[3,2,1]],
     [[4,1,1],[4,2,1]]],name='tensor1')
print(tensor1)
ss=tf.Session()
print(ss.run(tensor1)[3,0,0])     #访问tensor1的具体元素
#输出：Tensor("tensor1:0", shape=(4, 2, 3), dtype=int32) 4

其中shape=(4,2,3)表示tensor1的最外层有4个数组，每个数组内有2个子数组，子数组由3个数字构成。可以通过多维数组的方式访问其中的具体元素，[3,0,0]即为第四个数组中第一个子数组的第一个元素，4。

计算图中还有的节点表示操作，例如加减乘除、赋初值等，操作有自己的属性，需要在创建图的时候就确定，操作之间有先后等依赖关系，通过图的边可以直观地看出来。

2、运算

会话

会话（Session）拥有并管理TensorFLow的所有资源，通过Session运行计算才能得到结果，计算完成后记得关闭会话回收资源。下面是使用Session的流程：

#定义计算图
tensor1=tf.constant([1,2,3])
#创建会话
ss=tf.Session()
#利用会话进行计算操作
print(ss.run(tensor1))
#关闭会话
ss.close()

也可以通过python上下文管理器来使用Session，当退出上下文时会自动关闭Session并释放资源

tensor1=tf.constant([1,2,3])
with tf.Session() as ss:    #上下文管理器
 print(ss.run(tensor1))

还可以通过指定默认会话，使用eval()获取张量的值：

tensor1=tf.constant([1,2,3])
ss=tf.Session()
with ss.as_default():     #指定默认会话
 print(tensor1.eval())

在交互式环境下通过InteractiveSession()自动将生成的会话设为默认：

tensor1=tf.constant([1,2,3])
ss=tf.InteractiveSession()     #自动注册默认会话
print(tensor1.eval())
ss.close()

变量、常量

TensorFLow通过constant函数完成对常量的定义，可以为其赋初值与命名

a=tf.constant(10,'int_a')

而变量不仅需要定义，还需要经过初始化后才可以使用，初始化操作不仅需要定义，还需要执行

node1=tf.Variable(3.0,name='node1')    #定义变量
node2=tf.Variable(4.0,name='node2')
res=tf.add(node1,node2,name='res')
 
ss=tf.Session()        
init=tf.global_variables_initializer()   #定义全部变量的初始化操作
ss.run(init)         #执行初始化操作
 
print(ss.run(res))
ss.close()

TensorFLow的变量一般不需要手动赋值，因为系统会在训练过程中自动调整。如果不希望由模型自动赋值，可以在定义时指定属性trainable=False，并通过assign函数来手动赋值

var1=tf.Variable(0,name='var')
one=tf.constant(1)
var2=tf.add(var1,one)       #变量1加1得到变量2
update=tf.assign(var1,var2)     #定义update操作，将变量2赋值给变量1
 
init=tf.global_variables_initializer()
ss=tf.Session()
ss.run(init)
for _ in range(10):
 ss.run(update)        #执行update操作
 print(ss.run(var1))
 
ss.close()
 
#输出：1 2 3 4 5 6 7 8 9 10

在执行ss.run(update)操作时，由于update需要var1和var2依赖，而得到var2需要执行add操作，因此只需要run一个update就会触发整个计算网络。

占位符

有时在定义变量的时候，并不知道它的具体值，只有在运行的时候才输入对应数值，而tensorflow中变量的定义需要赋初值，这时就需要使用占位符placeholder来进行定义，并在计算时传入具体数值。一个简单的使用例子：

node1=tf.placeholder(tf.float32,name='node1')  #定义占位符，规定其类型、结构、名字
node2=tf.placeholder(tf.float32,name='node2') 
m=tf.multiply(node1,node2,'multinode')
 
ss=tf.Session()
res=ss.run(m,feed_dict={node1:1.2,node2:3.4})  #在运行时通过feed_dict为占位符赋值 
print(res)
ss.close()

也可以把多个操作放到一次feed操作完成

node1=tf.placeholder(tf.float32,[3],name='node1')  #第二个参数规定占位符的类型为3维数组
node2=tf.placeholder(tf.float32,[3],name='node2') 
m=tf.multiply(node1,node2,'multinode')
s=tf.subtract(node1,node2,'subnode')
 
ss=tf.Session()
#将m，s两个操作放到一起，并返回两个结果
resm,ress=ss.run([m,s],feed_dict={node1:[1.0,2.0,4.0],node2:[3.0,5.0,6.0]})
print(resm)           #输出：[ 3. 10. 24.]
ss.close()

3、TensorBoard

TensorBoard是TensorFLow的可视化工具，通过程序运行中输出的日志文件可视化地表示TensorFLow的运行状态。其编程如下：

node1=tf.Variable(3.0,name='node1')    
node2=tf.Variable(4.0,name='node2')
res=tf.add(node1,node2,name='res')
ss=tf.Session()        
init=tf.global_variables_initializer()   
ss.run(init)         
print(ss.run(res))
ss.close()
 
#清除default graph和其他节点
tf.reset_default_graph()
#定义日志存放的默认路径
logdir='D:\Temp\TensorLog'
#生成writer将当前的计算图写入日志
writer=tf.summary.FileWriter(logdir,tf.get_default_graph())
writer.close()

TensorBoard已经随Anaconda安装完成，首先通过Anaconda Prompt进入日志文件的存放目录，然后输入tensorboard --logdir=D:\Temp\TensorLog，设定日志的存放路径，完成之后在浏览器的localhost:6006端口就可以看到TensorBoard，也可以通过--port命令修改默认端口。

利用TensorBoard显示图片，通过summary.image()将格式化的图片数据显示，其中输入的image_imput数据是四维格式，第一维表示一次输入几行数据，-1表示不确定。28，28，1表示图片数据为28×28大小，且其色彩通道为1。

通过summary.histogram()可以显示直方图数据。通过summary.scalar()可以显示标量数据。在所有summary定义完成后，可以通过summary.merge_all()函数定义一个汇总操作，将所有summary聚合起来。

在创建session后定义writer用于日志文件的写入，在进行训练时，每批次训练都将执行一次merge操作，并将结果写入日志。

如下为通过多层神经网络解决MNIST手写识别问题的例子，将其中的一些数据通过TensorBoard显示出来：

#TensorBoard使用
#定义日志保存位置
log_dir='D:\Temp\MachineLearning\TensorLog'
#显示图片
image_input=tf.reshape(x,[-1,28,28,1])
tf.summary.image('input',image_input,10)  #一次最多显示图片数：10
#显示直方图
tf.summary.histogram('Y',Y3)
#显示标量loss
tf.summary.scalar('loss',loss_function)
tf.summary.scalar('accurancy',accuracy)
#定义汇总summary操作
merge_op=tf.summary.merge_all()
 
ss=tf.Session()
ss.run(tf.global_variables_initializer())
#定义writer
writer=tf.summary.FileWriter(log_dir,ss.graph)
 
for epoch in range(train_epochs):
 for batch in range(batch_num): #分批次读取数据进行训练
  xs,ys=mnist.train.next_batch(batch_size)
  ss.run(optimizer,feed_dict={x:xs,y:ys})
  #执行summary操作并将结果写入日志文件
  summary_str=ss.run(merge_op,feed_dict={x:xs,y:ys})
  writer.add_summary(summary_str,epoch)
  
 loss,acc=ss.run([loss_function,accuracy],\
     feed_dict={x:mnist.validation.images,y:mnist.validation.labels})
 print('第%2d轮训练：损失为：%9f，准确率：%.4f'%(epoch+1,loss,acc))

运行结果如下图所示分别为图片、accuracy、loss标量图、Y1直方图以及随之生成的分布图：