为一张图片产生一个描述被称为image caption任务,为一个视频产生一个描述成为vedio caption,但视频可以理解为在时间上有连续性的一组图片,因此可以理解成为一组图片产生一个描述。Vedio caption是属于对vedio analysis的高层语义分析。描述一般描述两个方向,属性和相互关系。
排序算法汇总
排序算法汇总。动画演示:一份清晰又全面的排序算法攻略
卷积神经网络手写数字识别
卷积神经网络手写数字识别(基于TensorFlow),数据:MNIST库(手写体数字库),包含55000张训练图片,每张图片分辨率是28×28,故训练网络输入应该是28×28=784个像素数据。
搭建深度神经网络识别猫
搭建深度神经网络识别猫(Python手写)。