常用的十大python图像处理工具原文标题:10 Python image manipulation tools.
作者 | Parul Pandey
翻译 | 安其罗乔尔、JimmyHua
今天,在我们的世界里充满了数据,图像成为构成这些数据的重要组成部分 。但无论是用于何种用途,这些图像都需要进行处理 。图像处理就是分析和处理数字图像的过程,主要旨在提高其质量或从中提取一些信息 , 然后可以将其用于某种用途 。
图像处理中的常见任务包括显示图像,基本操作如裁剪、翻转、旋转等,图像分割,分类和特征提?。枷窕指春屯枷袷侗?。Python成为这种图像处理任务是一个恰当选择 , 这是因为它作为一种科学编程语言正在日益普及,并且在其生态系统中免费提供许多最先进的图像处理工具供大家使用 。
让我们看一下可以用于图像处理任务中的常用 Python 库有哪些吧 。
1.scikit-image
scikit-image是一个开源的Python包,适用于numpy数组 。它实现了用于研究,教育和工业应用的算法和实用工具 。即使是那些刚接触Python生态系统的人,它也是一个相当简单直接的库 。此代码是由活跃的志愿者社区编写的,具有高质量和同行评审的性质 。
资源
文档里记录了丰富的例子和实际用例,阅读下面的文档:
用法
该包作为skimage导入,大多数功能都在子模块中找的到 。下面列举一些skimage的例子:
图像过滤
使用match_template函数进行模板匹配
你可以通过此处查看图库找到更多示例 。
2. Numpy
Numpy是Python编程的核心库之一,并为数组提供支持 。图像本质上是包含数据点像素的标准Numpy数组 。因此,我们可以通过使用基本的NumPy操作,例如切片、掩膜和花式索引,来修改图像的像素值 。可以使用skimage加载图像并使用matplotlib显示图像 。
资源
Numpy的官方文档页面提供了完整的资源和文档列表:
用法
使用Numpy来掩膜图像.
3.Scipy
scipy是Python的另一个类似Numpy的核心科学模块,可用于基本的图像操作和处理任务 。特别是子模块scipy.ndimage,提供了在n维NumPy数组上操作的函数 。该包目前包括线性和非线性滤波,二值形态学 , B样条插值和对象测量等功能函数 。
资源
有关scipy.ndimage包提供的完整功能列表,请参阅下面的链接:
用法
【python图片裁剪函数 python对图片进行裁剪】使用SciPy通过高斯滤波器进行模糊:
4. PIL/ Pillow
PIL( Python图像库 )是Python编程语言的一个免费库,它支持打开、操作和保存许多不同的文件格式的图像 。然而,随着2009年的最后一次发布,它的开发停滞不前 。但幸运的是还有有Pillow,一个PIL积极开发的且更容易安装的分支,它能运行在所有主要的操作系统 , 并支持Python3 。这个库包含了基本的图像处理功能,包括点运算、使用一组内置卷积核的滤波和色彩空间的转换 。
资源
文档中有安装说明,以及涵盖库的每个模块的示例:
用法
在 Pillow 中使用 ImageFilter 增强图像:
5. OpenCV-Python
OpenCV( 开源计算机视觉库 )是计算机视觉应用中应用最广泛的库之一。OpenCV-Python 是OpenCV的python版API 。OpenCV-Python的优点不只有高效,这源于它的内部组成是用C/C编写的,而且它还容易编写和部署(因为前端是用Python包装的) 。这使得它成为执行计算密集型计算机视觉程序的一个很好的选择 。
资源
OpenCV-Python-Guide指南可以让你使用OpenCV-Python更容易:
用法
下面是一个例子,展示了OpenCV-Python使用金字塔方法创建一个名为“Orapple”的新水果图像融合的功能 。
6. SimpleCV
SimpleCV 也是一个用于构建计算机视觉应用程序的开源框架 。有了它,你就可以访问几个高性能的计算机视觉库,如OpenCV,而且不需要先学习了解位深度、文件格式、颜色空间等 。
它的学习曲线大大小于OpenCV,正如它们的口号所说“计算机视觉变得简单” 。一些支持SimpleCV的观点有:
即使是初学者也可以编写简单的机器视觉测试摄像机、视频文件、图像和视频流都是可互操作的资源
官方文档非常容易理解,而且有大量的例子和使用案例去学习:
用法
7. Mahotas
Mahotas 是另一个计算机视觉和图像处理的Python库 。它包括了传统的图像处理功能例如滤波和形态学操作以及更现代的计算机视觉功能用于特征计算,包括兴趣点检测和局部描述符 。该接口是Python语言,适合于快速开发,但是算法是用C语言实现的,并根据速度进行了调优 。Mahotas库速度快,代码简洁,甚至具有最小的依赖性 。通过原文阅读它们的官方论文以获得更多的了解 。
资源
文档包括安装指导 , 例子,以及一些教程,可以更好的帮助你开始使用mahotas 。
用法
Mahotas库依赖于使用简单的代码来完成任务 。关于‘Finding Wally’的问题,Mahotas做的很好并且代码量很少 。下面是源码:
8. SimpleITK
ITK 或者 Insight Segmentation and Registration Toolkit是一个开源的跨平台系统,为开发人员提供了一套广泛的图像分析软件工具。其中, SimpleITK是建立在ITK之上的简化层,旨在促进其在快速原型设计、教育、解释语言中的应用 。SimpleITK 是一个图像分析工具包,包含大量支持一般过滤操作、图像分割和匹配的组件 。SimpleITK本身是用C写的,但是对于包括Python以内的大部分编程语言都是可用的 。
资源
大量的Jupyter Notebooks 表明了SimpleITK在教育和研究领域已经被使用 。Notebook展示了用Python和R编程语言使用SimpleITK来进行交互式图像分析 。
用法
下面的动画是用SimpleITK和Python创建的刚性CT/MR匹配过程的可视化。点击此处可查看源码!
9. pgmagick
pgmagick是GraphicsMagick库的一个基于python的包装 。GraphicsMagick图像处理系统有时被称为图像处理的瑞士军刀 。它提供了一个具有强大且高效的工具和库集合 , 支持以88种主要格式(包括重要格式 , 如DPX、GIF、JPEG、JPEG-2000、PNG、PDF、PNM和TIFF)读取、写入和操作图像 。
资源
有一个专门用于PgMagick的Github库 , 其中包含安装和需求说明 。还有关于这个的一个详细的用户指导:
用法
使用pgmagick可以进行的图像处理活动很少,比如:
图像缩放
边缘提取
10. Pycairo
Pycairo是图像处理库cairo的一组Python捆绑 。Cairo是一个用于绘制矢量图形的2D图形库 。矢量图形很有趣,因为它们在调整大小或转换时不会失去清晰度。Pycairo是cairo的一组绑定 , 可用于从Python调用cairo命令 。
资源
Pycairo的GitHub库是一个很好的资源,有关于安装和使用的详细说明 。还有一个入门指南 , 其中有一个关于Pycairo的简短教程 。
库:指南:用法
使用Pycairo绘制线条、基本形状和径向梯度:
总结
有一些有用且免费的Python图像处理库可以使用,有的是众所周知的,有的可能对你来说是新的,试着多去了解它们 。
在python中怎么裁剪图片大?。咳绾卫肞ython裁剪图片?先对图片进行二值化处理 。
由于这些格子大小均匀,所以可以使用常规的除法,先裁剪出第一个格子:
e=a[:,:,0].shape
f=a[0:int(e[0]/9),0:int(e[1]/9)]
io.imsave('00.png',f)
下图是等比例放大的效果图 。
第一列第二个格子:
m=1
n=0
f=a[int(m*e[0]/9):int((m 1)*e[0]/9),int(n*e[1]/9):int((n 1)*e[1]/9)]
第一行第二个格子:
m=0
n=1
f=a[int(m*e[0]/9):int((m 1)*e[0]/9),int(n*e[1]/9):int((n 1)*e[1]/9)]
这样,用for循环,可以实现全部裁剪:
for m in range(9):
for n in range(9):
f=a[int(m*e[0]/9):int((m 1)*e[0]/9),int(n*e[1]/9):int((n 1)*e[1]/9)]
io.imsave('0/' str(m) '-' str(n) '.png',f)
去除边界的黑框,只保留数字或空白:
for m in range(9):
for n in range(9):
f=a[int(m*e[0]/9) 10:int((m 1)*e[0]/9)-10,int(n*e[1]/9) 10:int((n 1)*e[1]/9)-10]
io.imsave('0/' str(m) '-' str(n) '.png',f)
1.图像裁剪、加边框、旋转(Python PIL)日常工作中经常要用Photoshop打印一些地质图 , 虽然说PS有动作录制的功能,但是打印这个功能我尝试过录制动作后并未能成功运行,而且要打印的图像尺寸很多都是不同的,试了几次后就放弃了,直到后来Python学起来了 , 通过pywinauto库实现了这个功能,在这里就简单记录下吧 。
在写Photoshop的打印操作之前,先来回顾下打印之前的图像处理工作 。
接到的地质图多为MapGIS程序导出的jpg图片,偶尔也会有Tif格式的遥感图 。对这些图像进行打印很简单 , 基本流程是:用PS打开图像-裁剪图像四周空白边缘-为图像四周加上3cm宽白色边框(为了美观和装订的需要)-打印 。那为啥用PS来打印不直接用Windows自带打印呢,应该是打印需要用到PS特定的颜色处理模式吧 , 经过试验 , 通过两种方式打出来的色彩效果确实是不同的 。
打印前图像处理的主要目标很简单:
1、裁剪图像四周空白
2、为图像四周加上3cm白色边框
下面就用Python实现它们
图像处理主要用的是PIL这个库 , 中途由于单位电脑比较旧(4g内存Win7 32位系统,后来重装成64位了 , 体验就是搞这种东西必须整个64位系统),性能不太行了,也用Opencv整了下,还是感觉PIL稍微快那么一点点,不知道是不是错觉呢 。
(后来发现这两步在PS录个动作也能轻松完成(???))
一、获取所有图片路径
有时候要打印的图片会放在好多个不同文件夹里面,要把它们遍历出来:
import os
二、读取图片并裁剪四周空白
import PIL
获得了图像尺寸后接下来就要对图像进行边缘空白的裁剪了(其实这两步不分先后顺序的):
裁剪的思路是网上搜到的,整理下就是:
1、先把图像转成灰度模式(值变成单一的0-255以方便判断 , 如果要裁剪其他颜色我就不知道了,我这里只要裁掉最常见的由MapGIS导出的标准的白色边缘) 。
2、分别从四个方向扫描图像,找到四个方向各自第一个灰度值不为255(最纯粹的白色(???))的像素,记下它的坐标(i,j) 。
3、通过四组坐标大小比较,得到图像除了四周空白区域外的坐标极值,也就得到了裁剪的区域左上(left,top)和右下坐标(right,bottom) 。
4、利用PIL.Image.crop(),完成图像的裁剪 。
5、没了,就是后来发现PIL自带这个算法 , 引用一下: 使用PIL裁剪图片白边
要是用PS来做呢,‘图像-裁切-确定’就完事了 。
三、给裁剪后的图像加上x厘米的白色边框
这一步主要是为了打印出来的图规范且美观 。
这一步要是用PS来搞 , ‘图像-画布大小-设置相对的宽度和高度’ 就好了
四、判断图像是否需要旋转 。
为什么要旋转这些图像呢?因为最终是要把它们用打印机打印出来,而打印机能打印的最大宽度是有限的,所以就有了这个步骤 。
单位的打印机型号是惠普的HP DesignJet Z6200 60 英寸照片打印机,最大打印纸张宽度是60英寸,大约就是1524mm左右吧,除了最大尺寸外,日常还用到的纸张宽度有440、610、914、1067、1274等6、7种吧,所以出于节约打印时间和省钱的考虑,为每张图选择最合适的打印纸张宽度也是很有必要的 。
判断图像是否需要旋转的思路是这样的:
1、比较图像的宽和高,判断谁是图像的长边和短边 。
2、短边如果大于1524mm , 这图按1:1就打不出来了,超过打印机最大可装入的纸张的宽度,把这个图像文件放到Oversize_path路径下 , 后续自己看着办 。
3、在短边小于等于1524mm的前提下,根据对图像宽高和长短边的比较,有两种需要旋转的情况:
3.1 如果图像的宽是长边(矮胖的矩形),且宽大于1524mm , 那么这图得旋转90°;
3.2 如果图像的高是长边(瘦高的矩形),且高小于1524mm,那么这图也得旋转90° 。
*printTOtkinter()是个用tkinter搞的进度显示窗口 , 就输出下一些文本信息而已 。
五、为图像选择最合适的打印纸张尺寸
单位打印纸有438、610、914、1524等7种宽度,现在要选出最适合的一种来进行打印 。
在把短边大于1524这种情况排除之后,剩下的图像情况为短边小于1524,即单位的打印机能打印出来了 。
这时要判断最佳打印用纸的宽度,有两种情况需要考虑:
1、长边>1524,改用短边来比较选择打印纸宽度 。
2、长边 ≤ 1524 , 用长边来比较选择打印纸宽度 。
下面思路就是把要用作比较的边长放入纸张宽度列表,把列表排序后找到比这个边长大一点的那个纸张宽度 。
主要的步骤就是这些 , 再经过一顿复制粘贴完善一下其他细节之后,最后会得到一个存放打印信息的列表,把它用txt存起来,这样后面的PS批量打印需要的信息就全部搞到手了 。最后放个gif 。
OpenCV Python实现旋转矩形的裁剪环境
矩形操作是我们在 OpenCV 里最常用的操作,其中最为常见的就是包围框( Bounding Box )和旋转矩形( Rotated Box ) 。其中包围框是最为常见的,对应 OpenCV 中的 boundingRect(),使用正矩形框处物体,一般多用在目标检测中 。使用包围框框柱目标物体,这种操作比较简单,但是通常框中也会有一些其他的区域 。其次就是使用旋转矩形,也叫最小外接矩形,对应 OpenCV 中的 minAreaRect() , 用来使用旋转矩形最大限度的框出目标物体,减小背景干扰,在 OCR 任务中较为常用 。
minAreaRect() 返回了所需区域的最小斜矩形的参数,与包围框直接返回四个顶点的坐标不同,最小外接矩形返回的是矩形的 ((x, y), (w, h), angle) ,对应了矩形的中心,宽度,高度和旋转角度 。
旋转角度 angle 是水平轴( x 轴)逆时针旋转,与碰到的矩形的第一条边的夹角 。并且这个边的边长是 width,另一条边边长是 height。也就是说,在这里 width 与 height 不是按照长短来定义的 。
在 OpenCV 中,坐标系原点在左上角 , 相对于 x 轴,逆时针旋转角度为负 , 顺时针旋转角度为正,所以函数 minAreaRect() 返回的角度范围时 [-90~0)。想象一个平放的长矩形,调用 minAreaRect()返回的角度为 -90 度 。如果我们旋转图像,直到矩形树立起来,这是调用 minAreaRect() 得到的角度依然是 -90 度 。
第一种裁剪旋转矩形的方法是通过仿射变换旋转图像的方式 。
仿射变换( Affine Transformation ) 是一种二维坐标到二维坐标之间的线性变换,保持二维图形的“平直性”( straightness,即变换后直线还是直线不会打弯,圆弧还是圆?。┖汀捌叫行浴保?parallelness,其实是指保二维图形间的相对位置关系不变,平行线还是平行线,相交直线的交角不变 。) 。
计算过程:
如果不做边长和角度的判断,则只会沿着 x 轴的顺时针方向做相同大小角度的旋转,不能保证旋转后的视角是正确的视角:
根据任务目标的类型,做边长和角度的判断并进行相应的调整 , 可以保证旋转后的视角是正确的视角:
第二种裁剪旋转矩形的方法是通过透视变换直接将旋转矩形的四个顶点映射到正矩形的四个顶点 。
透视变换( Perspective Transformation )是将图片投影到一个新的视平面( Viewing Plane ),也称作投影映射( Projective Mapping ) 。
计算过程:
以上两种方法都可以用来抠取旋转矩形的内容 。仿射变换方法需要预先对整张图进行旋转 , 通过观察旋转后的图像可以发现,有一部分图像被旋转出了图像边界 , 如果你要抠取的目标正好在图像边缘附近,那么很容易出界导致图像抠取的缺失 。同时我们需要对宽、高和角度做出动态的调整;透视变换的方法直接对抠取区域进行了映射,这种方法可以省略旋转的步骤,并且不会出现抠取内容的缺失 。同时我们只需要对4个顶点之间的映射关系做好定义即可 , 不需要考虑角度的问题 。相对的,透视变换相对于仿射变换计算量更大一些,不过这在 c的底层实现上带来的时延差距小于 ms。
python PIL如何才能把图片修改成正方形或者任意尺寸而不产生挤压改变图像尺寸有两类方法:
一是缩放(resize),即重采样 。这时,如果图像纵横比发生变化就会导致“挤压” 。
二是裁剪(crop) 。当然图只能越裁越?。徊还梢耘浜纤醴牛?先放大再裁剪 。
既然题主要求不能“挤压”,那就只能裁剪了 。函数名我给出来了 , 具体用法题主自己研究 。
python图片裁剪函数的介绍就聊到这里吧,感谢你花时间阅读本站内容 , 更多关于python对图片进行裁剪、python图片裁剪函数的信息别忘了在本站进行查找喔 。
推荐阅读
- 查询索引名字mysql,es修改索引名字
- 周小闹微信视频号是真的吗,周小闹抖音视频
- 斗鱼如何直播录下来的视频,斗鱼怎么录播
- oracle如何压缩索引 oracle 压缩
- 大富翁下载,天天大富翁下载
- ppt怎么画等距,ppt怎么画等距离竖线
- 关于c语言获取系统时间戳函数的信息
- 直播买什么比较好呢,直播买什么最好
- 视频号怎么存到电脑上,视频号里的视频怎么存