DNA序列里的ATCG转成0123，用Python处理FASTA文件该怎么做？

要将Fasta文件（`.fasta`）中的DNA序列中的碱基ATCG替换为数字0123并保存到一个新的Fasta文件，你可以使用Python的内置模块`Bio.SeqIO`来读取和操作序列，然后对每个序列进行修改。以下是一个简单的步骤：首先，请确保已经安装了`biopython`库，如果没有安装，可以通过`pip install biopython`来安装。 ```python from Bio import SeqIO # 输入和输出文件名 input_file = "input.fasta" output_file = "output.fasta" # 创建一个新的SeqRecord列表用于存储处理后的序列 new_records = [] # 遍历输入文件中的每一个序列 with open(input_file, "r") as in_fh: for record in SeqIO.parse(in_fh, "fasta"): # 获取原始序列 seq = str(record.seq) # 将A、T、C、G替换为0、1、2、3 new_seq = seq.replace("A", "0").replace("T", "1").replace("C", "2").replace("G", "3") # 创建一个新的SeqRecord，用新序列替换旧序列 new_record = SeqRecord(Seq(new_seq), id=record.id, description="") new_records.append(new_record) # 写入新的Fasta文件 with open(output_file, "w") as out_fh: SeqIO.write(new_records, out_fh, "fasta") ``` 这段代码会读取`input.fasta`文件中的所有序列，将它们的A、T、C、G分别替换为0、1、2、3，然后保存到`output.fasta`文件中。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇用Python把GDP数据里第三产业的历年数值画成带国家区分的柱状图，具体怎么操作？

目录

DNA序列里的ATCG转成0123，用Python处理FASTA文件该怎么做？

Python内容推荐

python 整数 加100完全平方数 加168又完全平方数

数值模拟和动画展示在火星大气中载荷的下降附Matlab代码 附matlab代码.rar

pip-matplotlib-3.6.3-cp311-cp311-win32.whl.zip

IMG_20260713_212959.jpg

Altium Designer实用操作技巧教程

个人经验总结文档数据仅供参考

基于混沌函数的改进达尔文粒子群优化算法Matlab代码.rar

Vue3+TypeScript智能车PID调参与赛道遥测对比分析工具源码

风储VSG-基于虚拟同步发电机的风储并网系统Simulink仿真

Matlab APP Designer document

NVIDIA H100 GPU白皮书解析核心与PCIE5.0-SXM5技术

基于Linux5.1kernel的alsa声卡驱动

易语言源码DLL注入模块

pip-matplotlib-3.6.3-pp39-pypy39_pp73-win_amd64.whl.zip

易语言源码EDB,高级表格,XLS互换

web课程设计报告总结

大鱼营销geo布局2026

AI聊天工具-纯前端java

IB Specification Vol 2-Release-2.0-Final-2025-07-31 watermarked.pdf

opencode-dcp

基于打开pycharm有带图片md文件卡死问题的解决

PyCharm集成Jupyter启动卡死解决[代码]

解决终端运行Py闪退

解决PyCharm闪退问题[项目代码]

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

python 整数加100完全平方数加168又完全平方数

数值模拟和动画展示在火星大气中载荷的下降附Matlab代码附matlab代码.rar