这段Pandas代码为什么能把用户每天拨打的号码去重后存成列表？

这段代码的作用是对 `calling_df` 这个数据框进行分组聚合操作，具体逻辑如下： 1. **按 `SUB_ID` 和 `STAT_DAY` 分组**： - 使用 `groupby(['SUB_ID', 'STAT_DAY'])` 将数据按照 `SUB_ID`（用户ID）和 `STAT_DAY`（统计日期）进行分组。 2. **对 `RECIPIENT_NUMBER` 列进行聚合操作**： - 使用 `agg(lambda x: x.drop_duplicates().tolist())`，对每组数据中的 `RECIPIENT_NUMBER`（被叫号码）列进行去重操作，并将结果转换为列表。 - 也就是说，每个 `SUB_ID` 和 `STAT_DAY` 的组合，都会得到一个该用户在当天拨打过的所有唯一号码的列表。 3. **重置索引**： - 使用 `.reset_index()` 将分组后的索引重置，使 `SUB_ID` 和 `STAT_DAY` 重新变回普通列。 4. **重命名列名**： - 使用 `.rename(columns={"RECIPIENT_NUMBER": "RECEIVE_NUMBER_COUNT_DAY"})` 将聚合后的列重命名为 `RECEIVE_NUMBER_COUNT_DAY`，表示接收号码的去重列表。最终，`calling_number_df` 将包含三列： - `SUB_ID`：用户ID - `STAT_DAY`：统计日期 - `RECEIVE_NUMBER_COUNT_DAY`：该用户在该天拨打过的唯一号码的列表 --- ```python # 示例数据 import pandas as pd data = { 'SUB_ID': [1, 1, 1, 2, 2], 'STAT_DAY': ['2023-10-01', '2023-10-01', '2023-10-02', '2023-10-01', '2023-10-02'], 'RECIPIENT_NUMBER': ['A', 'A', 'B', 'C', 'C'] } calling_df = pd.DataFrame(data) # 执行代码 calling_number_df = calling_df.groupby(['SUB_ID', 'STAT_DAY'])['RECIPIENT_NUMBER'] \ .agg(lambda x: x.drop_duplicates().tolist()).reset_index() \ .rename(columns={"RECIPIENT_NUMBER": "RECEIVE_NUMBER_COUNT_DAY"}) print(calling_number_df) ``` 输出结果： ``` SUB_ID STAT_DAY RECEIVE_NUMBER_COUNT_DAY 0 1 2023-10-01 ['A'] 1 1 2023-10-02 ['B'] 2 2 2023-10-01 ['C'] 3 2 2023-10-02 ['C'] ``` ---

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 ViT是怎么把一张图变成Transformer能处理的序列的？

目录

这段Pandas代码为什么能把用户每天拨打的号码去重后存成列表？

Python内容推荐

python列表去重的二种方法

python pandas dataframe 去重函数的具体使用

python去重,一个由dict组成的list的去重示例

Python对列表去重的多种方法(四种方法)

对python中两种列表元素去重函数性能的比较方法

Python Dataframe 指定多列去重、求差集的方法

Python对多属性的重复数据去重实例

Python代码源码-实操案例-框架案例-如何实现字符串与列表等数据的去重.zip

Python DataFrame使用drop_duplicates()函数去重(保留重复值，取重复值)

Python的Pandas库中DataFrame去重函数的应用

核心基础-如何实现字符串与列表等数据的去重-Python实例源码.zip

python 爬虫 实现增量去重和定时爬取实例_python增量爬虫_爬虫实现增量去重和定时爬取实例_python_wherev

Python爬虫代码合集.zip

Pandas 同元素多列去重的实例

pandas中的数据去重处理的实现方法

pandas 实现将重复表格去重,并重新转换为表格的方法

号码归属地查询，拨打电话

批量获取当前目录下excel文件中的电话号码,导出为所有电话号码的csv文件(去重)

Pandas 数据框增、删、改、查、去重、抽样基本操作方法

24小时重复拨打率

闲鱼自动发货系统[可运行源码]

智能闲鱼客服机器人系统：专为闲鱼平台打造的AI值守解决方案，实现闲鱼平台7×24小时自动化值守，支持多专家协同决策、智能议价和上.zip

校园二手平台开发与市场分析.zip

闲鱼自动回复系统：闲鱼智能客服与商品自动发货工具

闲鱼自动发货系统部署教程[项目源码]

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

python 爬虫实现增量去重和定时爬取实例_python增量爬虫_爬虫实现增量去重和定时爬取实例_python_wherev