python ocr 实现识别图片上的数字并将识别到的数字保存

### Python OCR 实现图片数字识别并保存结果要实现通过 Python 进行 OCR 数字识别并将结果保存到文件中，可以采用多种方法。以下是基于 OpenCV 和 KNearest 的一种解决方案： #### 方法概述此方案利用 OpenCV 提供的 `KNearest` 功能来训练模型以识别手写体或打印体数字[^4]。 #### 完整代码示例以下是一个完整的代码示例，展示如何使用 OpenCV 中的 `KNearest` 来识别图片中的数字，并将结果保存至 `.txt` 文件中。 ```python import cv2 import numpy as np # 加载训练数据集 (假设已经准备好数字样本) def load_digits(dataset_path): digits_img = cv2.imread(dataset_path, 0) # 灰度读取图像 rows = np.vsplit(digits_img, 50) # 将图像分割成 50 行 cells = [] for row in rows: cols = np.hsplit(row, 100) # 每行再分成 100 列 for cell in cols: cell = cell.flatten() # 展平为一维数组 cells.append(cell) cells = np.array(cells, dtype=np.float32) # 转换为浮点数类型 labels = np.repeat(np.arange(10), 500) # 创建标签向量 return cells, labels # 训练 KNearest 模型 def train_knearest(train_cells, train_labels): knn = cv2.ml.KNearest_create() knn.train(train_cells, cv2.ml.ROW_SAMPLE, train_labels) return knn # 图片预处理函数 def preprocess_image(image_path): img = cv2.imread(image_path, 0) # 灰度读取目标图像 _, thresh = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY_INV | cv2.THRESH_OTSU) # 阈值化 contours, _ = cv2.findContours(thresh.copy(), cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)[-2:] rectangles = [cv2.boundingRect(contour) for contour in contours] sorted_rectangles = sorted(rectangles, key=lambda rect: rect[0]) # 按 X 坐标排序 return thresh, sorted_rectangles # 主程序逻辑 def recognize_and_save(knn_model, test_image_path, output_file): thresholded, rects = preprocess_image(test_image_path) results = [] for rect in rects: x, y, w, h = rect roi = thresholded[y:y+h, x:x+w].copy() resized_roi = cv2.resize(roi, (20, 20)) # 统一大小 feature_vector = resized_roi.reshape((1, 400)).astype(np.float32) ret, result, neighbours, dist = knn_model.findNearest(feature_vector, k=3) results.append(int(result[0][0])) with open(output_file, 'w') as f: f.write(''.join(map(str, results))) print(f"Recognition completed and saved to {output_file}") # 数据加载与模型训练 train_cells, train_labels = load_digits("digits.png") # 替换为实际路径 knn_model = train_knearest(train_cells, train_labels) # 测试图片识别 recognize_and_save(knn_model, "test_numbers.png", "results.txt") # 替换为目标测试图片和输出文件名 ``` --- ### 关键说明 1. **训练数据** 上述代码依赖于一个名为 `digits.png` 的训练数据集，该数据集中包含了从 0 到 9 的标准数字样本。如果未提供此类数据集，则需自行创建或下载合适的替代品[^4]。 2. **图片预处理** 使用阈值化 (`threshold`) 和轮廓检测 (`findContours`) 对输入图片进行初步清理，提取出单个字符区域以便后续分析。 3. **特征匹配** 每个字符被调整为固定尺寸（如 \(20 \times 20\)），随后展平为一维向量作为特征输入给 KNearest 模型。 4. **结果存储** 所有识别出来的数字按顺序拼接成字符串形式，并最终写入指定的目标文本文件中。 --- ###

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇如何用python实时监视网站的视频是否暂停

目录

python ocr 实现识别图片上的数字并将识别到的数字保存

Python内容推荐

python图片识别OCR源码

pythonOCR图片文字识别.zip

Python-CardOcr身份证识别OCR

基于PyQt5+Python实现的OCR文字识别系统源码(含GUI界面).zip

python OCR 识别

python ocr识别证件号码，识别验证码，调用摄像头

python opencv自动识别电表读数（识别LED数字）附源代码

python ocr识别文字识别图片百度ai.doc

Python PaddleOCR OCR结构化识别的例子

python 提取照片jpg/png的文字内容，手写文字识别度非常高，提供界面操作可以实现批量提取

python语言OCR图像识别程序源代码.zip

python电表识别 带有简单的UI界面，能够识别电表数字和电表工作状态

python高概率OCR图像识别案例

基于python的利用语言模型纠正OCR识别错误代码实现

python文字识别、python ocr精准识别

基于python+图文识别，将微信支付单据是被并存放mysql数据库

简单实用的基于python的中文OCR字符识别

第十章：项目实战-文档扫描OCR识别,ocr识别pdf,Python

python+opencv-tessert OCR 实现简易的车牌的检测与识别（全）

完整的OCR图片识别源码：已用python实现ocr功能并返回html结构，核心是rapidOCR改造而来

python 实现识别图片上的数字

Python调用百度OCR实现图片文字识别的示例代码

基于Python实现对PDF文件的OCR识别

Python识别快递条形码及Tesseract-OCR使用详解

Python基于百度AI实现OCR文字识别

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

python电表识别带有简单的UI界面，能够识别电表数字和电表工作状态