实现一个Python函数，能分析json数据

以下是一个能够分析 JSON 数据的 Python 函数，它不仅能解析 JSON 字符串或文件，还能提供结构概览、数据类型统计、深度遍历以及错误处理等分析功能： ```python import json from collections import defaultdict from typing import Any, Dict, List, Union def analyze_json(data: Union[str, dict, list], source_type: str = "string") -> Dict[str, Any]: """ 分析 JSON 数据并返回详细的结构和内容信息。参数: data: JSON 字符串、字典或列表。 source_type: 数据来源类型，可选值为 "string"（默认）、"file" 或 "object"。返回: 包含分析结果的字典。 """ parsed_data = None try: if source_type == "string": parsed_data = json.loads(data) elif source_type == "file": with open(data, 'r', encoding='utf-8') as f: parsed_data = json.load(f) elif source_type == "object": parsed_data = data # 假设已经是一个 Python 对象（dict/list） else: raise ValueError("source_type must be 'string', 'file', or 'object'") except Exception as e: return { "error": True, "message": f"Failed to parse JSON: {str(e)}" } # 初始化分析结果 analysis = { "error": False, "data_type": type(parsed_data).__name__, "total_keys": 0, "total_items": 0, "depth": _get_depth(parsed_data), "structure": _infer_structure(parsed_data), "type_distribution": defaultdict(int), "paths": [] } # 遍历数据以收集类型分布和路径 def traverse(obj, path=""): if isinstance(obj, dict): for k, v in obj.items(): new_path = f"{path}.{k}" if path else k analysis["paths"].append(new_path) analysis["total_keys"] += 1 analysis["type_distribution"][type(v).__name__] += 1 traverse(v, new_path) elif isinstance(obj, list): analysis["type_distribution"]["list"] += 1 for i, item in enumerate(obj): new_path = f"{path}[{i}]" analysis["paths"].append(new_path) traverse(item, new_path) else: t = type(obj).__name__ analysis["type_distribution"][t] += 1 traverse(parsed_data) # 转换 defaultdict 为普通 dict 以便 JSON 序列化 analysis["type_distribution"] = dict(analysis["type_distribution"]) analysis["total_items"] = sum(analysis["type_distribution"].values()) return analysis def _get_depth(data: Any) -> int: """计算 JSON 结构的最大嵌套深度""" if isinstance(data, dict): return 1 + max((_get_depth(v) for v in data.values()), default=0) elif isinstance(data, list): return 1 + max((_get_depth(item) for item in data), default=0) else: return 0 def _infer_structure(data: Any) -> Any: """推断数据结构，将具体值替换为类型标签，用于模式识别""" if isinstance(data, dict): return {k: _infer_structure(v) for k, v in data.items()} elif isinstance(data, list): if not data: return [] # 若列表元素类型一致，只取第一个；否则用类型标记 types = list({type(item).__name__ for item in data}) if len(types) == 1: return [_infer_structure(data[0])] else: return [f"<{types}>"] else: return f"<{type(data).__name__}>" # 示例使用： if __name__ == "__main__": sample_json = ''' { "name": "Alice", "age": 30, "is_student": false, "courses": ["Math", "Physics"], "address": { "city": "Beijing", "zipcode": "100001" } } ''' result = analyze_json(sample_json, source_type="string") import pprint pprint.pprint(result) ``` ### 解释： 1. **`analyze_json` 函数**： - 支持从字符串 (`"string"`), 文件路径 (`"file"`), 或已加载的对象 (`"object"`) 加载 JSON。 - 使用 `json.loads` 或 `json.load` 安全地解析 JSON。 - 包含异常捕获，防止程序崩溃，并返回错误信息。 2. **分析内容包括**： - 是否出错 - 数据整体类型（dict/list） - 总键数与总项目数 - 最大嵌套深度 - 推断的结构模板（隐藏实际值，保留类型结构） - 各数据类型的分布（如 str, int, bool, list 等） - 所有访问路径（例如 `"address.city"`） 3. **辅助函数**： - `_get_depth`: 递归计算最大深度。 - `_infer_structure`: 生成结构骨架，便于查看模式。 4. **用途场景**： - API 返回数据分析 - 日志 JSON 格式校验 - 数据清洗前的探索性分析 ---

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Python同时连接DB2和MySQL数据库

目录

实现一个Python函数，能分析json数据

Python内容推荐

python中json格式数据输出的简单实现方法

深入分析python数据挖掘 Json结构分析

Python-json2csv实现将jsoncsv文件转换工具

python json文件转txt文件，批处理json文件转换成一个txt文件

python如何读写json数据

用Python将mysql数据导出成json的方法

python3实现将json对象存入Redis以及数据的导入导出

Python爬取数据保存为Json格式的代码示例

python食物数据爬取及分析（源码、爬取数据、数据可视化图表、报告）

把JSON数据格式转换为Python的类对象方法详解（两种方法）

python爬取电影Top250数据并进行可视化分析.zip

Python实现读取json文件到excel表

python json文件转txt文件，批处理json文件转换成一个txt文件，

Python爬取智联招聘数据分析师岗位相关信息的方法

python json 递归打印所有json子节点信息的例子

中国地图绘制的json文件 用于补充【python数据分析】.zip

Python实现将Excel转换为json的方法示例

Python遍历文件夹 处理json文件的方法

python3.x上post发送json数据

Python获取lunwen信息，包含数据爬取、数据分析、数据可视化代码

PyPI 官网下载 | mlpack3-3.4.2-cp36-cp36m-manylinux1_x86_64.whl

实现基于C++或者python基本库，初学学习之用.zip

机器学习的一些基础算法，主要使用Python、Cpp、Matlab编写。.zip

jenkins-conf:Jenkins的配置文件

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

中国地图绘制的json文件用于补充【python数据分析】.zip

Python遍历文件夹处理json文件的方法