用python将xml转coco数据集json格式

### 使用 Python 将 XML 文件转换为 COCO 数据集 JSON 格式的示例为了实现这一目标，通常会使用 `xml.etree.ElementTree` 库来解析 XML 文件，并构建符合 COCO 数据集标准的 JSON 结构。下面是一个完整的例子。 #### 安装必要的库首先安装所需的第三方库： ```bash pip install lxml pycocotools ``` #### 解析 XML 并创建 COCO JSON 的代码如下： ```python import os from lxml import etree import json import uuid def parse_xml(xml_file): tree = etree.parse(xml_file) root = tree.getroot() filename = root.find('filename').text size = root.find('size') width = int(size.find('width').text) height = int(size.find('height').text) objects = [] for obj in root.findall('object'): name = obj.find('name').text bndbox = obj.find('bndbox') xmin = float(bndbox.find('xmin').text) ymin = float(bndbox.find('ymin').text) xmax = float(bndbox.find('xmax').text) ymax = float(bndbox.find('ymax').text) bbox_width = xmax - xmin bbox_height = ymax - ymin object_info = { "category_id": get_category_id(name), "bbox": [xmin, ymin, bbox_width, bbox_height], "area": bbox_width * bbox_height, "iscrowd": 0 } objects.append(object_info) image_info = { "id": str(uuid.uuid4()), "file_name": filename, "width": width, "height": height } return image_info, objects def create_coco_format(xml_folder, output_json): categories = [{"supercategory": "", "id": i+1, "name": label} for i, label in enumerate(get_all_labels())] images = [] annotations = [] annotation_id = 1 for xml_file in os.listdir(xml_folder): if not xml_file.endswith('.xml'): continue img_info, objs = parse_xml(os.path.join(xml_folder, xml_file)) images.append(img_info) for obj in objs: obj["id"] = annotation_id annotation_id += 1 annotations.extend(objs) coco_data = { 'images': images, 'annotations': annotations, 'categories': categories } with open(output_json, 'w') as f: json.dump(coco_data, f) if __name__ == '__main__': # 假设所有的标注文件存放在 './Annotations' 文件夹下 create_coco_format('./Annotations', './coco_dataset.json') ``` 此脚本遍历指定目录中的所有 XML 文件，提取图像信息和对象边界框信息，并将其保存到遵循 COCO 数据集格式的 JSON 文件中[^1]。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 python词频统计人物出现次数

目录

用python将xml转coco数据集json格式

Python内容推荐

VOC数据集转COCO数据集python工具

python实现提取COCO,VOC数据集中特定的类

基于python实现voc转yolo格式voc转coco格式源码+项目说明.zip

Convert-COCO-to-Pascal in python3

voc中xml格式转coco数据json格式

将labelme和labelimg标注的数据 转成paddlex的数据格式

YOLOv8训练数据集指南[项目源码]

voc2coco：将VOC格式的XML转换为COCO格式的json

目标检测数据集制作:VOC,COCO,YOLO等常用数据集格式的制作和互相转换脚本

把COCO数据集的josn标注转变成VOC数据集xml格式的标注；json数据标注转xml数

Detectron：训练自己的数据集——将自己的数据格式转换成COCO格式

coco、voc实例分割数据集制作-labelme

常见检测数据集格式之间的相互转换：csv、voc、coco、labelimg、json。

labelme(.json)2coco和coco(.json)2xml.zip

VOC XML标注转COCO JSON格式完整转换工具

将自己的数据集转换为coco_格式_convert_dataset_to_coco.zip

Objects365-COCO数据集转换为xml格式，并转为yolo的txt格式，xml数据统n

将数据集制作成VOC数据集格式的实例

xmltojson:将类似voc格式的xml文件转换为类似可可格式的注释，以进行Detectron培训

目标检测常用数据集，包含了coco格式yolo格式voc格式，并且包含了它们互相转换的代码

【CNN-BiLSTM-attention】基于高斯混合模型聚类的风电场短期功率预测方法（Python&matlab代码实现）

高校技术转移办公室人员如何借助区域科技创新大脑提升科研成果的转化效率？.docx

Makefile编写，一文吃透 Makefile 函数

高校技术转移办公室人员如何通过区域科技创新大脑提升科研成果对接成功率？.docx

基于Rao-Blackwellized粒子滤波与多融合策略全阶 EKF 的双车协同 SLAM 研究（Matlab代码实现）

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

将labelme和labelimg标注的数据转成paddlex的数据格式