Python实现xml格式转txt格式的示例代码
目录
- 1、前言
- 2、分析xml、txt数据
- 3、转换过程
- 4、最后结果对比
1、前言 最近学习Yolo v5是遇见了个问题,找的数据集全是xml文件,VOC 的标注是 xml 格式的,而YOLO是.txt格式,那么问题就来了,手动提取肯定是不可能的,那只能借用程序解决咯。
2、分析xml、txt数据 这是xml树形结构
文章图片
这是txt格式
文章图片
总结:
1.提取object->name、bndbox->xmin,ymin,xmax,ymin
2.格式转化需要用公式转换
YOLO数据集txt格式:
x_center :归一化后的中心点x坐标
y_center : 归一化后的中心点y坐标
w:归一化后的目标框宽度
h: 归一化后的目标况高度
(此处归一化指的是除以图片宽和高)
VOC数据集xml格式
文章图片
yolo的四个数据 | xml->txt公式 |
---|---|
x_center | ((x_min+x_max)/2-1)/w_image |
y_center | ((y_min+y_max)/2-1)/h_image |
w | (x_max-x_min)/w_image |
h | (y_max-y_min)/h_image |
3、转换过程 定义两个文件夹,train放xml数据, labels放txt数据。
文章图片
代码解析:
import osimport xml.etree.ElementTree as ETimport iofind_path = './train/'#xml所在的文件savepath='./labels/'#保存文件class Voc_Yolo(object):def __init__(self, find_path):self.find_path = find_pathdef Make_txt(self, outfile):out = open(outfile,'w') print("创建成功:{}".format(outfile))return outdef Work(self, count):#找到文件路径for root, dirs, files in os.walk(self.find_path):#找到文件目录中每一个xml文件for file in files:#记录处理过的文件count += 1#输入、输出文件定义input_file = find_path + fileoutfile = savepath+file[:-4]+'.txt'#新建txt文件,确保文件正常保存out = self.Make_txt(outfile)#分析xml树,取出w_image、h_imagetree=ET.parse(input_file)root=tree.getroot()size=root.find('size')w_image=float(size.find('width').text)h_image=float(size.find('height').text)#继续提取有效信息来计算txt中的四个数据for obj in root.iter('object'):#将类型提取出来,不同目标类型不同,本文仅有一个类别->0classname=obj.find('name').textcls_id = classnamexmlbox=obj.find('bndbox')x_min=float(xmlbox.find('xmin').text)x_max=float(xmlbox.find('xmax').text)y_min=float(xmlbox.find('ymin').text)y_max=float(xmlbox.find('ymax').text)#计算公式x_center=((x_min+x_max)/2-1)/w_imagey_center=((y_min+y_max)/2-1)/h_imagew=(x_max-x_min)/w_imageh=(y_max-y_min)/h_image#文件写入out.write(str(cls_id)+" "+str(x_center)+" "+str(y_center)+" "+str(w)+" "+str(h)+'\n')out.close()return countif __name__ == "__main__":data = https://www.it610.com/article/Voc_Yolo(find_path)number = data.Work(0)print(number)
4、最后结果对比 【Python实现xml格式转txt格式的示例代码】创建成功
文章图片
与真实数据对比误差很小
文章图片
到此这篇关于Python实现xml格式转txt格式的示例代码的文章就介绍到这了,更多相关Python xml转txt内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
推荐阅读
- python机器学习sklearn实现识别数字
- python|python机器学习基础01——sklearn开启
- python|python机器学习基础05——sklearn之逻辑回归+分类评价指标
- 一些好玩的事|我赌你没有了解过——Python 图像加密
- Python|机器学习1——手写数字识别
- python图像识别数字_sklearn例程:识别图像中的手写数字
- 基于python的数字识别_基于sklearn数字识别(python开发)
- python|python 车牌识别简单_Python利用百度云接口实现车牌识别
- 用python做一个车牌识别_python利用百度云接口实现车牌识别
- python代码示例百度云-python利用百度云接口实现车牌识别的示例