CS231n学习笔记

近期在学习深度学习的理论知识,在对一些术语有了基本的了解后,我开始学习斯坦福大学的CS231n课程。该课程主要介绍Image Classification(图像分类)以及其用到的Convolutional Neural Networks(卷积神经网络)。谨以此文记录课程中的阶段性总结,以及自己的一些理解。

注1:课程视频在网易云课堂(中文字幕)和bilibili(英文字幕)上均可观看,个人推荐b站,因为b站可以调整倍速,而Andrej Karpathy助教的语速实在是……太快了!

注2:第一节课主要是对计算机视觉简史的介绍,有兴趣的可以自行观看视频,在此不再赘述。


Lecture 2: Image Classification pipeline

这是深度学习与计算机视觉的第2课,从图形识别问题介绍到数据驱动的图像识别方法,重点讲述了K最近邻与线性分类器两类算法。以下是课程小结。

  • Image Classification: We are given a Training Set of labeled images, asked to predict labels on Test Set. Common to report the Accuracy of predictions (fraction of correctly predicted images)

    We introduced the k-Nearest Neighbor Classifier, which predicts the labels based on nearest images in the training set.

    We saw that the choice of distance and the value of k are hyperparameters that are tuned using a validation set, or through cross-validation if the size of the data is small.

    Once the best set of hyperparameters is chosen, the classifier is evaluated once on the test set, and reported as the performance of kNN on that data.

这个小节用了二十多分钟介绍了最近邻和K最近邻线性分类器,但实际上这种线性分类器很少用在图像分类上。首先,它的训练时间很短,但是测试时间……可以说相当长,而且随着数据集增加,训练时间呈线性增长。其次,在使用欧式距离计算时,对图片做不同的处理后得到的图片与原图的距离参数很可能是一样的,因而它无法区分出这些图片的不同。

文章作者: Elody
文章链接: http://Elody-07.github.io/CS231n笔记/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Elody的博客