|
|
@ -5,7 +5,7 @@ |
|
|
|
- **免费**:本项目所有代码开源,完全免费。 |
|
|
|
- **方便**:解压即用,无需安装。不需要网络。 |
|
|
|
- **高效**:OCR识别引擎是C++编译的 [PaddleOCR-json](https://github.com/hiroi-sora/PaddleOCR-json) (PP-OCRv2.6 cpu_avx_mkl),比前代提速20%。只要电脑性能足够且支持mkldnn,通常能比在线OCR服务更快。 |
|
|
|
- **精准**:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对非常规字形(手写、艺术字、小字、方向不正、杂乱背景等)也有不错的识别率。可设置**忽略区域**进一步提高精准性。支持载入自己训练的模型以适应任务需求。 |
|
|
|
- **精准**:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对非常规字形(手写、艺术字、小字、方向不正、杂乱背景等)也有不错的识别率。可设置**忽略区域**排除水印,进一步提高精准性。 |
|
|
|
|
|
|
|
 |
|
|
|
|
|
|
@ -270,7 +270,7 @@ Github下载: |
|
|
|
| PP-OCR模型库版本 | v2 | v2 | v2 | **v3** | v3 slim | v3 | |
|
|
|
| 总耗时(秒) | 90 | 120 | 65 | **63** | 170 | 400 | |
|
|
|
| 平均单张耗时(秒) | 0.9 | 1.2 | 0.65 | **0.63** | 1.7 | 4.0 | |
|
|
|
| 内存占用(MB) | 1000 | 350 | 1200 | **1700** | 5800 | 500 | |
|
|
|
| 内存占用峰值(MB) | 1000 | 350 | 1200 | **1700** | 5800 | 500 | |
|
|
|
|
|
|
|
结论: |
|
|
|
|
|
|
@ -295,32 +295,46 @@ Github下载: |
|
|
|
|
|
|
|
#### 已发布 |
|
|
|
|
|
|
|
- [x] 输出内容可选为markdown风格并嵌入图片路径。 |
|
|
|
- [x] 设置项能保存。 |
|
|
|
- [x] 自动打开输出文件or文件夹。 |
|
|
|
- [x] 识别剪贴板中的图片。 |
|
|
|
- [x] 任务进行时,禁用部分设置项。 |
|
|
|
- [x] 计划任务:完成后自动关机/休眠等。 |
|
|
|
- [x] 递归导入文件夹。 |
|
|
|
- [x] 优化适配PaddleOCR v3模型。 |
|
|
|
<details> |
|
|
|
<summary>展开详情</summary> |
|
|
|
|
|
|
|
- 输出内容可选为markdown风格并嵌入图片路径。 |
|
|
|
- 设置项能保存。 |
|
|
|
- 自动打开输出文件or文件夹。 |
|
|
|
- 识别剪贴板中的图片。 |
|
|
|
- 任务进行时,禁用部分设置项。 |
|
|
|
- 计划任务:完成后自动关机/休眠等。 |
|
|
|
- 递归导入文件夹。 |
|
|
|
- 优化适配PaddleOCR v3模型。 |
|
|
|
|
|
|
|
</details> |
|
|
|
|
|
|
|
#### 正在开发 |
|
|
|
|
|
|
|
- [x] 增加OCR引擎进程常驻后台的模式,以缩短剪贴板识图等零碎任务的启动时间。 |
|
|
|
[测试版下载地址(蓝奏云,密码1111)](https://wwn.lanzoul.com/b037embad) |
|
|
|
|
|
|
|
- [x] 增加OCR引擎进程常驻后台的模式,大幅缩短剪贴板识图等零碎任务的启动时间。 |
|
|
|
- [x] 监控OCR引擎进程内存占用,并可随时强制停止该进程。 |
|
|
|
- [ ] 自动检测CPU指令集是否兼容。 |
|
|
|
- [ ] 自动检测Windows语言是否兼容。 |
|
|
|
- [ ] 内置截图。 |
|
|
|
- [ ] 可最小化至系统托盘。 |
|
|
|
|
|
|
|
#### 画饼(有生之年) |
|
|
|
- [ ] 对图片重命名。 |
|
|
|
- [ ] 提高初始化速度。 |
|
|
|
- [ ] 忽略区域能保存预设。 |
|
|
|
- [ ] 缩减离线OCR模块的体积。 |
|
|
|
- [ ] 排版优化:模糊匹配同行文段,自定义文段方向。 |
|
|
|
- [ ] 解决引擎Opencv对不同地区语言Windows的兼容性。 |
|
|
|
- [ ] 离线OCR模块增加 `no_avx` 和 `openblas` 版本。 |
|
|
|
- [ ] 文本纠错。 |
|
|
|
|
|
|
|
<details> |
|
|
|
<summary>展开详情</summary> |
|
|
|
|
|
|
|
- 对图片重命名。 |
|
|
|
- 提高初始化速度。 |
|
|
|
- 忽略区域能保存预设。 |
|
|
|
- 缩减离线OCR模块的体积。 |
|
|
|
- 排版优化:模糊匹配同行文段,自定义文段方向。 |
|
|
|
- 解决引擎Opencv对不同地区语言Windows的兼容性。 |
|
|
|
- 离线OCR模块增加 `no_avx` 和 `openblas` 版本。 |
|
|
|
- 文本纠错。 |
|
|
|
|
|
|
|
</details> |
|
|
|
|
|
|
|
## 更新日志 |
|
|
|
|
|
|
|