如何用纯Python（不依赖matplotlib等库）分析FASTA文件里短于300的蛋白序列，并生成氨基酸组成饼图？

不使用库来统计 `protein_sequences.fa` 中长度小于 300 的蛋白序列里不同氨基酸的含量，并绘制饼状图保存结果，可按以下步骤操作： ### 统计氨基酸含量以下是不使用库统计氨基酸含量的代码： ```python amino_acid_counts = {} with open('protein_sequences.fa', 'r') as file: current_seq = '' for line in file: if line.startswith('>'): if 0 < len(current_seq) < 300: for aa in current_seq: if aa in amino_acid_counts: amino_acid_counts[aa] += 1 else: amino_acid_counts[aa] = 1 current_seq = '' else: current_seq += line.strip() # 处理文件最后一个序列 if 0 < len(current_seq) < 300: for aa in current_seq: if aa in amino_acid_counts: amino_acid_counts[aa] += 1 else: amino_acid_counts[aa] = 1 # 计算每个氨基酸的含量（百分比） total_count = sum(amino_acid_counts.values()) amino_acid_percentages = {aa: (count / total_count) * 100 for aa, count in amino_acid_counts.items()} ``` ### 绘制并保存饼状图虽然 Python 标准库没有直接绘制饼状图的功能，但可以借助 HTML 和 JavaScript 的 `Chart.js` 库来实现。以下是生成 HTML 文件来绘制饼状图的代码： ```python html_template = """ <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8"> <meta name="viewport" content="width=device-width, initial-scale=1.0"> <title>Amino Acid Composition</title> <script src="https://cdn.jsdelivr.net/npm/chart.js"></script> </head> <body> <canvas id="aminoAcidChart"></canvas> <script> const ctx = document.getElementById('aminoAcidChart').getContext('2d'); const aminoAcids = {amino_acids}; const percentages = {percentages}; new Chart(ctx, { type: 'pie', data: { labels: aminoAcids, datasets: [{ label: 'Amino Acid Composition', data: percentages, backgroundColor: [ 'rgba(255, 99, 132, 0.2)', 'rgba(54, 162, 235, 0.2)', 'rgba(255, 206, 86, 0.2)', 'rgba(75, 192, 192, 0.2)', 'rgba(153, 102, 255, 0.2)', 'rgba(255, 159, 64, 0.2)' ], borderColor: [ 'rgba(255, 99, 132, 1)', 'rgba(54, 162, 235, 1)', 'rgba(255, 206, 86, 1)', 'rgba(75, 192, 192, 1)', 'rgba(153, 102, 255, 1)', 'rgba(255, 159, 64, 1)' ], borderWidth: 1 }] }, options: { responsive: true } }); </script> </body> </html> """ # 填充模板 filled_template = html_template.format( amino_acids=list(amino_acid_percentages.keys()), percentages=list(amino_acid_percentages.values()) ) # 保存为 HTML 文件 with open('amino_acid_pie_chart.html', 'w') as html_file: html_file.write(filled_template) ``` ### 代码解释 - 首先，代码通过读取 `protein_sequences.fa` 文件，逐行处理，遇到以 `>` 开头的行表示新的序列开始，统计长度小于 300 的序列中氨基酸的含量。 - 接着，计算每个氨基酸的含量百分比。 - 最后，使用 `Chart.js` 库生成 HTML 文件来绘制饼状图并保存。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇怎么用Python快速分析短蛋白序列（<300aa）的氨基酸组成并生成带百分比的饼图？

目录

如何用纯Python（不依赖matplotlib等库）分析FASTA文件里短于300的蛋白序列，并生成氨基酸组成饼图？

Python内容推荐

Python的基因数据科学

python_scripts_from_my_masters:实用程序脚本，用于解析基因组数据并执行基本分析

Python库 | genedataset-0.1.6.tar.gz

BioPython安装使用指南[源码]

Python库 | biotite-0.26.0-cp38-cp38-manylinux1_x86_64.whl

Python库 | bio_pyminer-0.9.15.tar.gz

Python-用于读写基因组数据的Python和C代码

bioinfo_gui_scripts:可以轻松转换为GUI程序的python脚本，供湿实验室科学家使用

python_bioinf_2021

Amino-acid-count:它包含python代码，可从给定的DNA序列中计算氨基酸序列中的氨基酸

生物信息学算法第一章的python实现

BioCoding_Tutorial:Python教程，所有示例都向学生教授生物学。 写给没有以前经验的高中生

基于Python的自动获取生物信息数据的软件设计.zip

hiv-variation:评估艾滋病毒变异性的Python管道和常用方法

2026年电工杯A 题 绿电直连型电氢氨园区优化运行【思路、Python代码、Matlab代码、论文(持续更新中......)】

2026年电工杯B题：嵌入式社区养老服务站的建设与优化问题【思路、Python代码、Matlab代码、论文(持续更新中......)】

基序标记：用于可视化FASTA序列中基序（例如基因，前mRNA）的工具

motif-relative-position-MEME:用MEME计算发现的基序的所有组合的相对位置

ProteinSearch

HGT_identification_in_evol_exps:HGT识别工作流程的脚本

使用Python中的matplotlib库读取csv文件绘制混合图

关于python3.7安装matplotlib始终无法成功的问题的解决

Python使用matplotlib模块绘制图像并设置标题与坐标轴等信息示例

python matplotlib库直方图绘制详解

利用Python+matplotlib对泰坦尼克号进行数据分析

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

BioCoding_Tutorial:Python教程，所有示例都向学生教授生物学。写给没有以前经验的高中生

2026年电工杯A 题绿电直连型电氢氨园区优化运行【思路、Python代码、Matlab代码、论文(持续更新中......)】