Python里做计数统计有哪些常用方法？不同场景该选哪个？

由于用户问题为“计数统计”，结合用户历史提问（“蓝桥杯python计数统计模板”）以及提供的参考资料，可以判断用户的深层需求是了解如何使用Python，特别是Pandas库，进行各种计数统计操作，这可能旨在为编程竞赛（如蓝桥杯）或数据分析任务准备通用模板[ref_3][ref_5][ref_6]。 Python中进行计数统计的核心是`pandas`库，它提供了灵活且强大的工具集。以下将系统性地介绍计数统计的应用场景、实现方法及核心模板代码，以满足不同场景下的计数需求。 #### **1. 单列基本计数** 最基本的计数是统计某列中元素出现的频次。 ```python import pandas as pd # 示例数据：学生成绩 data = {'姓名': ['张三', '李四', '王五', '张三', '赵六', '李四'], '成绩': [85, 92, 78, 85, 88, 92]} df = pd.DataFrame(data) # 方法1：value_counts() 统计每个值出现的次数 name_counts = df['姓名'].value_counts() print(name_counts) # 张三 2 # 李四 2 # 王五 1 # 赵六 1 # 方法2：size() 与 groupby() 结合，功能类似 name_counts_group = df.groupby('姓名').size() print(name_counts_group) ``` #### **2. 分组计数（GroupBy）** 这是数据分析中最常用的计数操作之一，用于按一个或多个键对数据进行分组，然后统计各组内的记录数[ref_3][ref_5]。 ```python # 示例数据：销售记录 sales_data = { '区域': ['北区', '南区', '北区', '东区', '南区', '北区'], '产品': ['A', 'B', 'A', 'A', 'B', 'C'], '销售额': [100, 200, 150, 300, 120, 180] } df_sales = pd.DataFrame(sales_data) # 按单个列分组计数 region_count = df_sales.groupby('区域')['销售额'].count() # 统计非空值数量 print("按区域计数（非空）：") print(region_count) # 按多个列分组计数，形成多级索引 region_product_count = df_sales.groupby(['区域', '产品']).size() print("\n按区域和产品分组计数：") print(region_product_count) # 可以使用 unstack() 转换为透视表格式 pivot_count = region_product_count.unstack(fill_value=0) print("\n转换为透视表格式：") print(pivot_count) ``` #### **3. 条件计数** 统计满足特定条件的数据行数。 ```python # 统计成绩大于等于90分的人数 count_high_score = (df['成绩'] >= 90).sum() print(f"成绩≥90分的人数：{count_high_score}") # 使用 query 进行复杂条件筛选后计数 count_complex = df.query('成绩 >= 80 and 姓名 in ["张三", "李四"]').shape[0] print(f"成绩≥80且姓名为张三或李四的记录数：{count_complex}") ``` #### **4. 数据透视表（Pivot Table）计数** `pivot_table`函数是实现多维计数和聚合的利器，功能类似于Excel的数据透视表[ref_3][ref_4]。 ```python # 使用数据透视表进行计数， aggfunc='count' pivot_table_count = pd.pivot_table(df_sales, index='区域', columns='产品', values='销售额', # 选择任意列作为计数值源 aggfunc='count', fill_value=0) print("使用pivot_table进行计数：") print(pivot_table_count) ``` #### **5. 描述性统计中的计数** 在生成数据的整体概览时，`describe()`方法和`agg()`方法非常有用[ref_6]。 ```python # describe() 方法包含计数 desc_stats = df['成绩'].describe() print("成绩列的描述性统计（包含计数count）：") print(desc_stats) # 使用 agg() 对多列进行多种聚合，包括计数 summary = df_sales.agg({ '销售额': ['count', 'sum', 'mean'], # 对销售额进行计数、求和、求平均 '区域': 'nunique' # 统计区域唯一值个数 }) print("\n多列聚合统计：") print(summary) ``` #### **6. 自定义与高级分组计数** 可以使用`apply`或自定义聚合函数实现更复杂的计数逻辑[ref_5]。 ```python # 示例：计算每个区域内销售额超过150的记录数 def count_above_threshold(series, threshold=150): """统计序列中大于阈值的个数""" return (series > threshold).sum() high_sales_count_by_region = df_sales.groupby('区域')['销售额'].apply(count_above_threshold) print("各区域销售额>150的记录数：") print(high_sales_count_by_region) ``` #### **7. 蓝桥杯风格计数统计模板** 针对算法竞赛场景，通常处理的是列表或数组，而非表格数据。核心是使用字典或`collections.Counter`进行高效计数[ref_1]。 ```python from collections import Counter # 场景：统计一个列表中各元素出现的次数 data_list = [1, 2, 3, 2, 2, 3, 4, 1, 1, 2] # 方法1：使用字典手动计数 count_dict = {} for num in data_list: count_dict[num] = count_dict.get(num, 0) + 1 print("字典计数结果：", count_dict) # 方法2：使用 collections.Counter（最简洁高效） counter_obj = Counter(data_list) print("Counter计数结果：", dict(counter_obj)) # 获取出现次数最多的前N个元素 print("出现最多的2个元素：", counter_obj.most_common(2)) # 复杂场景：统计元组或字符串 words = ["apple", "banana", "apple", "orange", "banana", "apple"] word_counter = Counter(words) print("单词计数结果：", dict(word_counter)) ``` #### **总结与对比** 下表归纳了不同场景下推荐的Python计数统计方法： | **应用场景** | **推荐方法/函数** | **关键优势** | **参考来源** | | :--- | :--- | :--- | :--- | | 单列值频次统计 | `Series.value_counts()` | 简单直接，排序可选 | [ref_3] | | 按列分组计数 | `DataFrame.groupby().size()` 或 `count()` | 支持单键/多键分组，是聚合基础 | [ref_3][ref_5] | | 条件筛选计数 | 布尔序列的`.sum()` 或 `.shape[0]` | 逻辑清晰，易于组合复杂条件 | [ref_6] | | 多维交叉计数 | `pd.pivot_table(aggfunc=‘count’)` | 可快速生成行列透视结构，便于分析 | [ref_3][ref_4] | | 数据整体概览 | `DataFrame.describe()` 或 `agg()` | 一次性获得计数等多维度统计量 | [ref_6] | | 算法/竞赛场景 | `collections.Counter` | 针对可哈希元素，API高效，功能强大 | [ref_1] | | 自定义聚合计数 | `groupby().apply(custom_func)` | 灵活性高，可实现任意复杂逻辑 | [ref_5] | 掌握以上模板和方法，即可应对绝大多数涉及计数统计的数据分析与算法题目。在实际使用中，应根据数据结构和具体需求选择最合适的方法。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 WebStorm 调试前端项目时，浏览器怎么连上并断点生效？

目录

Python里做计数统计有哪些常用方法？不同场景该选哪个？

Python内容推荐

python 统计列表中不同元素的数量方法

浅谈python中统计计数的几种方法和Counter详解

python统计文本字符串里单词出现频率的方法

python统计文本文件内单词数量的方法

Python实现统计给定列表中指定数字出现次数的方法

python统计不同字符个数.docx

python 不以科学计数法输出的方法

Python统计一个字符串中每个字符出现了多少次的方法【字符串转换为列表再统计】

Python实现统计文本文件字数的方法

统计数字问题Python

Python中使用Counter进行字典创建以及key数量统计的方法

详解python pandas 分组统计的方法

python 统计一个列表当中的每一个元素出现了多少次的方法

python统计字符串中指定字符出现次数的方法

python人流量计数人数统计上下行计数统计

python实现字符串中字符分类及个数统计

详解Python用三种方式统计词频的方法

python统计字母、空格、数字等字符个数的实例

python统计中文字符数量的两种方法

python计算书页码的统计数字问题实例

Python基础第八章

python面试必备知识点分享.docx

Python面试题及答案共55道.docx

python笔试题(2).docx

Python-100个精选的python陷阱示例每周1个新示例

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构