计算机视觉|基于Paddle的计算机视觉入门教程——第2讲计算机视觉的分类分类|paddle

B站教程地址
https://www.bilibili.com/video/BV18b4y1J7a6/
传统计算机视觉方法 【计算机视觉|基于Paddle的计算机视觉入门教程——第2讲计算机视觉的分类】
传统的计算机视觉可以使用Opencv等Python库，对图像进行简单的操作，例如对图像缩放、滤波、阈值分割等等。对于计算机来说，一张彩色图片就是一个三通道的矩阵，分别对应**红绿蓝（RGB）**三种颜色，通过改变颜色的数值（0-255）来显示出一张完整的彩色图片，传统的计算机视觉就是围绕这一个三维矩阵，比如设置一个颜色区间，进行过滤等等操作。
这一类视觉处理的方法，功能相对较弱一些，能够处理一些简单的应用场景，比如识别绿色物体，识别动态的物体等。但是对于背景复杂的实际场景中，很多问题都难以解决。
推荐Opencv教程地址：https://github.com/CodecWang/opencv-python-tutorial
深度学习通过人工智能对图像进行处理的算法有很多，其中最为经典的为卷积神经网络，对原始图像不停卷积运算，充分提取特征，最后输出想要的结果，这类方法经过实践的验证取得了非常不错的精度表现，在目前的很多硬件上，都能够跑出实时的效果。

文章图片

当然，更多新型的视觉处理算法也涌现出来，比如最近比较火热的Transformer算法，最初应用于NLP（自然语言处理），最近科研者们发现它在视觉领域也展现出了非常不错的表现，很多领域下都取得了最佳的精度，突破了卷积神经网络的精度瓶颈。我们这期教程还是围绕卷积神经网络，这种经典的算法展开，仍然值得大家深入地学习。

文章图片

计算机视觉任务的分类分类（Classification）
分类任务是对整张图片进行分类，例如最为经典的猫狗分类。

文章图片

猫狗分类就是让计算机对于我指定的图片进行归类，如果这张图片是猫，我把图片输入到模型后，我期望输出的就是猫这个类别。可以看到，分类任务是对整张图片的归类，如果一张图片里面既有猫，又有狗，那么显然分类无法完成，因为分类任务是不需要对物体定位的。分类任务是计算机视觉最简单的任务，实现的难度最低，当然功能也最为简单。
检测（Detection）

文章图片

检测任务相对于分类任务，需要精确地对图像中的目标物体定位，一般用矩形框确定目标位置。如上图，一张图片中，有狗，有自行车，有汽车，对于检测任务，就需要精确地框出他们的位置，并判别类别。检测任务是对图像中的物体进行特征识别，相比分类任务难度有所提升，也是我们经常会有的需求，需要精确判定特征物体在画面中的位置，例如行人检测，人脸检测等等。
分割（Segmentation）

文章图片

分割任务的难度再次增加，任务要求不仅需要确定位置，还需要勾勒出物体的轮廓，类似PS的抠图，过滤去背景。例如上图所示的工业读表，车道线分割等等，这类任务对于模型和算法的考验较大，在特定的场合中有一定的应用。

计算机视觉|基于Paddle的计算机视觉入门教程——第2讲计算机视觉的分类

推荐阅读

巧影APP怎么制作隐身人?

荣耀|不再低调，6.5寸全速屏+22.5W快充+后置三摄，价格感人！

异地恋见面怎么省钱异地恋见面如何省钱，异地恋见面如何省钱呢

天宫二号为什么坠毁了中国第一个牺牲的宇航员是谁

12123在线支付不了怎么回事 12123在线支付没反应

美的空调格力和海尔哪个好家用,大部分是这里有问题

Win7系统不能正常关机的解决方法|Win7系统不能正常关机的解决教程

Python全栈系列[更新中]|Python零基础入门篇 - 52 - 文件操作的避坑指南

婚姻里丈夫和妻子相敬如宾好吗？

勇猛的近义词是什么勇猛的近义词是啥

为什么氯化铝是共价化合物

移动来电提醒怎么设置移动呼叫转移13800短信呼

Android工程化开发这门学科的看法

让你轻松搞定打印机废墨问题 3153废墨垫更换清零技巧分享

理怎么组词汉字理怎么组词

戒烟必经三大阶段戒烟关键期

边牧剪指甲正确方法边牧指甲怎么剪

腊八节是几月几日的腊八节是几月几号哪一天

魅族18参数

长城炮尿素冻了怎么办长城炮的尿素冬天能冻住吗

计算机视觉|基于Paddle的计算机视觉入门教程——第2讲 计算机视觉的分类

推荐阅读

计算机视觉|基于Paddle的计算机视觉入门教程——第2讲计算机视觉的分类