继续运行手写数字识别的示例,识别此图像,一个0还是1,我们所使用的是神经网络架构,其中有一个输入X,然后是第一个隐藏层,有25个单位,第二个隐藏层,有15个单元,然后一个输出单元,将得到一组由图像x组成的训练示例,以及地面真相标签Y。
如何训练这个神经网络的参数
和之前所写的类似,在这里要求TensorFlow按顺序串在一起,神经网络的这三层,第一个隐藏层,有25个单位和Z状结肠激活,第二个隐藏层有15个,最后是输出层;第二步是要求tensorflow编译模型,其关键步骤是指定要使用的损失函数是什么,在这种情况下,将使用一种神秘的稀疏名称——范畴交叉熵,指定了损失函数之后,第三步是调用fit函数,它告诉TensorFlow拟合在步骤一中使用损失指定的模型,或者在第二步中指定的数据集x y的成本函数,当我们谈到梯度下降时,我们必须决定梯度下降要走多少步或者梯度下降要跑多长时间,所以纪元是一个专业术语,对于像梯度下降这样的学习算法,你可能想要运行多少步。
总结一下,第一步是指定告诉TensorFlow的模型,如何计算推理,第二步是使用特定的损失函数编译模型,第三步是训练模型。