头歌平台做机器学习实验时，怎么把CSV数据正确读进Python并做好基础统计？

以头歌平台上“理解机器学习基本概念：从电影评分预测讲起”为例，在该场景中载入数据可参考以下代码，其使用 Pandas 库来处理数据，将训练数据以 DataFrame 对象形式载入，代码如下： ```python # -*- coding:utf-8 -*- import pandas as pd # 假设这里有训练数据文件，需要根据实际文件路径修改，这里只是示例 # 这里假设数据文件路径为 train_data.csv train_data = pd.read_csv('train_data.csv') def stat_data(train_data): """求出用户数和电影数，评分数目, 平均评分, 最大评分, 最小评分参数: train_data - Pandas的DataFrame对象，有四列'user','movie','rating','timestamp'，是训练数据集返回值： num_user - 整数，用户数 num_movie - 整数，电影数 num_rating - 整数，评分数目 avg_rating - 浮点数，平均评分 max_rating - 浮点数，最大评分 min_rating - 浮点数，最小评分 """ num_user = 0 num_movie = 0 num_rating = 0 avg_rating = 0 max_rating = 0 min_rating = 0 # 请在此添加实现代码 #********** Begin *********# num_user = train_data['user'].nunique() num_movie = train_data['movie'].nunique() num_rating = train_data.shape[0] avg_rating = train_data['rating'].mean() max_rating = train_data['rating'].max() min_rating = train_data['rating'].min() #********** End *********# return num_user, num_movie, num_rating, avg_rating, max_rating, min_rating ``` 此代码通过`pd.read_csv`函数将数据文件载入为 DataFrame 对象`train_data`，方便后续对数据进行分析和处理，为选择或设计机器学习模型算法做准备 [^2]。另外，在“【头歌】重生之机器学习 - 线性回归”中也有载入数据的示例，对于一元数据，使用`pandas`的`read_csv`函数载入数据文件，并为数据附上名字标签。示例代码如下： ```python import pandas as pd import os if __name__ == "__main__": path = os.getcwd() + '/ex1data1.txt' # 利用 pandas 读入数据 data，并将数据属性分别命名为 'Population' 和 'Profit' #********* begin *********# data = pd.read_csv(path, header=None, names=['Population', 'Profit']) #********* end *********# print(data.shape) ``` 该代码中通过修改`names`参数可以为不同特征赋予合适的名称，便于后续处理 [^4]。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇水质数据的Python分析流程是怎么组织的？从加载到可视化有哪些关键步骤？

目录

头歌平台做机器学习实验时，怎么把CSV数据正确读进Python并做好基础统计？

Python内容推荐

python读写csv文件并增加行列的实例代码

python 读取.csv文件数据到数组(矩阵)的实例讲解

python 实现读取csv数据,分类求和 再写进 csv

Python 中导入csv数据的三种方法

Python对CSV文件数据进行可视化

利用Python如何将数据写到CSV文件中

Python将列表数据写入文件（txt, csv，excel）

Python将字典数据写入CSV文件

python机器学习fandago_scores.csv数据集

python读取当前目录下的CSV文件数据

python处理csv数据的方法

Python读取mat文件,并转为csv文件的实例

python爬取招聘网信息并保存为csv文件

使用python获取csv文本的某行或某列数据的实例

利用python将json数据转换为csv格式的方法

python读csv文件时指定行为表头或无表头的方法

Python读取csv文件分隔符设置方法

Python将一个CSV文件里的数据追加到另一个CSV文件的方法

python_for_ml：用于机器学习的Python简介

Python写入CSV文件的方法

处理minio文件分析链接的python

minio 文件服务器

minio-py:用于 Python 的 MinIO 客户端 SDK

二、python+前端 实现MinIO分片上传

Python连接MinIO[项目代码]

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

python 实现读取csv数据,分类求和再写进 csv

二、python+前端实现MinIO分片上传