文章詳情頁

python代碼xml轉(zhuǎn)txt實例

瀏覽：79日期：2022-08-03 08:54:48

為了訓(xùn)練深度學(xué)習(xí)模型，經(jīng)常要整理大量的標(biāo)注數(shù)據(jù)，需統(tǒng)一不同格式的標(biāo)注數(shù)據(jù)，一般情況下習(xí)慣讀取TXT格式的數(shù)據(jù)。但實際中經(jīng)常遇到XML格式的標(biāo)注數(shù)據(jù)，在此舉例：1.讀取XML標(biāo)注數(shù)據(jù)；2.寫入TXT文件。

XML標(biāo)注數(shù)據(jù)如下

<annotation verified='no'> <folder>suE</folder> <filename>Drivingrecord_001</filename> <path>C:DesktopDrivingrecord_001.jpg</path> <source> <database>Unknown</database> </source> <size> <width>1920</width> <height>1080</height> <depth>3</depth> </size> <segmented>0</segmented> <object> <name>蘇E*****-藍(lán)-1-白,灰-大眾-上海大眾-桑塔納-尚納</name> <flag>polygon</flag> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <leftTopx>170</leftTopx> <leftTopy>704</leftTopy> <rightTopx>167</rightTopx> <rightTopy>729</rightTopy> <rightBottomx>242</rightBottomx> <rightBottomy>735</rightBottomy> <leftBottomx>243</leftBottomx> <leftBottomy>710</leftBottomy> </bndbox> </object> <object> <name>蘇E*****-藍(lán)-1-黃-雷克薩斯-雷克薩斯(進(jìn)口)-雷克薩斯RX</name> <flag>polygon</flag> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <leftTopx>733</leftTopx> <leftTopy>721</leftTopy> <rightTopx>733</rightTopx> <rightTopy>759</rightTopy> <rightBottomx>881</rightBottomx> <rightBottomy>760</rightBottomy> <leftBottomx>882</leftBottomx> <leftBottomy>722</leftBottomy> </bndbox> </object> <object> <name>蘇*****-藍(lán)-1-黑-寶馬-寶馬(進(jìn)口)-寶馬7系</name> <flag>polygon</flag> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <leftTopx>1274</leftTopx>

<leftTopy>657</leftTopy> <rightTopx>1274</rightTopx> <rightTopy>671</rightTopy> <rightBottomx>1325</rightBottomx> <rightBottomy>670</rightBottomy> <leftBottomx>1326</leftBottomx> <leftBottomy>656</leftBottomy> </bndbox> </object> <object> <name>蘇*****-藍(lán)-1-灰-標(biāo)致-東風(fēng)標(biāo)致-標(biāo)致307</name> <flag>polygon</flag> <pose>Unspecified</pose> <truncated>0</truncated> <difficult>0</difficult> <bndbox> <leftTopx>1609</leftTopx> <leftTopy>658</leftTopy> <rightTopx>1611</rightTopx> <rightTopy>671</rightTopy> <rightBottomx>1659</rightBottomx> <rightBottomy>669</rightBottomy> <leftBottomx>1657</leftBottomx> <leftBottomy>656</leftBottomy> </bndbox> </object> </annotation>

在此，我們只需要圖片名filename，和每個object的坐標(biāo)（四個點的坐標(biāo)）

Drivingrecord_001.jpg 170 704 167 729 242 735 243 710 733 721 733 759 881 760 882 722 1274 657 1274 671 1325 670 1326 656 1609 658 1611 671 1659 669 1657 656

利用xml.dom.*模塊，文件對象模塊DOM在讀取XML文件時，一次讀取整個文件，將其所有數(shù)據(jù)保存在一個樹結(jié)構(gòu)中，此時，可利用DOM的各種函數(shù)來讀取目標(biāo)數(shù)據(jù)。在此，利用xml.dom.minidom解析XML文件。

并將目標(biāo)數(shù)據(jù)寫入TXT文檔。

# -*- coding: utf-8 -*- ''' Created on Fri Mar 2 15:36:44 2018 @author: gg ''' import xml.dom.minidom import os save_dir = ’D:plate_train’ if not os.path.exists(save_dir): os.mkdir(save_dir) f = open(os.path.join(save_dir, ’landmark.txt’), ’w’) DOMTree = xml.dom.minidom.parse(’D:plate_trainlabelDrivingrecord_001.xml’) annotation = DOMTree.documentElement filename = annotation.getElementsByTagName('filename')[0] imgname = filename.childNodes[0].data+’.jpg’ print(imgname) objects = annotation.getElementsByTagName('object') loc = [imgname] #文檔保存格式：文件名坐標(biāo) for object in objects: bbox = object.getElementsByTagName('bndbox')[0] leftTopx = bbox.getElementsByTagName('leftTopx')[0] lefttopx = leftTopx.childNodes[0].data print(lefttopx) leftTopy = bbox.getElementsByTagName('leftTopy')[0] lefttopy = leftTopy.childNodes[0].data print(lefttopy) rightTopx = bbox.getElementsByTagName('rightTopx')[0] righttopx = rightTopx.childNodes[0].data print(righttopx) rightTopy = bbox.getElementsByTagName('rightTopy')[0] righttopy = rightTopy.childNodes[0].data print(righttopy) rightBottomx = bbox.getElementsByTagName('rightBottomx')[0] rightbottomx = rightBottomx.childNodes[0].data print(rightbottomx) rightBottomy = bbox.getElementsByTagName('rightBottomy')[0] rightbottomy = rightBottomy.childNodes[0].data print(rightbottomy) leftBottomx = bbox.getElementsByTagName('leftBottomx')[0] leftbottomx = leftBottomx.childNodes[0].data print(leftbottomx) leftBottomy = bbox.getElementsByTagName('leftBottomy')[0] leftbottomy = leftBottomy.childNodes[0].data print(leftbottomy) loc = loc + [lefttopx, lefttopy, righttopx, righttopy, rightbottomx, rightbottomy, leftbottomx, leftbottomy] for i in range(len(loc)): f.write(str(loc[i])+’ ’) f.write(’tn’) f.close()

以上這篇python代碼xml轉(zhuǎn)txt實例就是小編分享給大家的全部內(nèi)容了，希望能給大家一個參考，也希望大家多多支持好吧啦網(wǎng)。

Python 編程

上一條：Python 讀取xml數(shù)據(jù),cv2裁剪圖片實例下一條：Python切割圖片成九宮格的示例代碼

相關(guān)文章：

1. js實現(xiàn)跳一跳小游戲2. PHP設(shè)計模式（四）原型模式Prototype實例詳解【創(chuàng)建型】3. Python編寫nmap掃描工具4. JVM之class文件結(jié)構(gòu)5. 10個提供免費PHP腳本下載的網(wǎng)站6. js實現(xiàn)貪吃蛇小游戲（加墻）7. Django通過設(shè)置CORS解決跨域問題8. SpringBoot 開發(fā)提速神器 Lombok+MybatisPlus+SwaggerUI9. 使用idea 去除 html 代碼前的行號和空行的方法詳解10. php5.6不能擴展redis.so的解決方法

排行榜

					
					php5.6不能擴展redis.so的解決方法
10個提供免費PHP腳本下載的網(wǎng)站
SpringBoot 開發(fā)提速神器 Lombok+MybatisPlus+SwaggerUI
使用idea 去除 html 代碼前的行號和空行的方法詳解
Django通過設(shè)置CORS解決跨域問題
js實現(xiàn)跳一跳小游戲
PHP設(shè)計模式（四）原型模式Prototype實例詳解【創(chuàng)建型】
js實現(xiàn)貪吃蛇小游戲（加墻）
JVM之class文件結(jié)構(gòu)
Python編寫nmap掃描工具
通過代碼實例解析JAVA類生命周期