gumblex / tessdata_chiLinks
Retrained Tesseract OCR model for Chinese
☆128Updated 3 years ago
Alternatives and similar repositories for tessdata_chi
Users that are interested in tessdata_chi are comparing it to the libraries listed below
Sorting:
- Python bindings for WPS Office RPC (for Linux)☆264Updated 6 months ago
- Based on RapidOCR, extract the PDF content☆181Updated 5 months ago
- 🔎📖对中文PDF进行OCR | OCR for Chinese PDF file using API from DayBreak-u/chineseocr_lite☆108Updated last year
- OCR离线图片文字识别命令行windows程序,以JSON字符串形式输出结果,方便别的程序调用。基于 RapidOcrOnnx 。☆293Updated last year
- 【间隙·树·排序算法】 对OCR结果或PDF提取的文本进行版面分析,按人类阅读顺序进行排序。☆157Updated last year
- CnSTD: 基于 PyTorch/MXNet 的 中文/英文 场景文字检测(Scene Text Detection)、数学公式检测(Mathematical Formula Detection, MFD)、篇章分析(Layout Analysis)的Python3 包☆762Updated 3 months ago
- rapidocr onnx cpp☆282Updated 6 months ago
- CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直…☆45Updated last year
- an open high-performance Optical Character Recognition (OCR) toolkit☆295Updated 2 months ago
- 文档图像处理工具(Document image processing tool),包括漂白 / 文字方向矫正 / 清晰增强 / 笔记去噪美化 / 去阴影 / 扭曲矫正 / 切边增强(DocBleach / TextOrientationCorrection / DocSha…☆96Updated last year
- 开源的中英文离线 OCR,使用 PaddleOCR 实现,提供了简单的 Web 页面及接口☆125Updated 3 years ago
- 《现代汉语词典》(第7版)全文TXT☆287Updated last year
- 中文词典 / 中文詞典。Chinese / Chinese-English dictionaries.☆195Updated last year
- 中文汉语拼音辞典,汉字拼音字典,词典,成语词典,常用字、多音字字典数据库☆665Updated 8 months ago
- 手写文字擦除第1名方案,水印智能消除赛第1名☆161Updated last year
- 基于序列表格识别算法推理库,集成PP-Structure和modelscope等表格识别算法。☆378Updated last month
- pretrained models for cnocr☆56Updated 3 years ago
- 多格式(word/excel/ppt转pdf/ofd, pdf/ofd相互转换)文档转换系统☆15Updated last year
- chineseocr lite onnx,超轻量级中文ocr demo,支持onnx推理 ( dbnet+crnn+anglenet)☆142Updated 2 years ago
- Automatically exported from code.google.com/p/lingoes-extractor☆60Updated 9 years ago
- A simple way to deploy PaddleOCR based on FastAPI. (PaddleOCR 的 FastAPI 快速部署方案)☆144Updated 6 months ago
- “Dive Into OCR” is a textbook developed by the PaddleOCR community that integrates OCR theory and practice.☆250Updated 2 years ago
- Convert the model in PaddleOCR to ONNX format☆101Updated 2 months ago
- 文档方向分类☆226Updated 10 months ago
- AI-OCR是基于PaddleOCR的OCR桌面客户端程序,支持Windows、Linux、MacOS等操作系统。 技术架构 前端界面:Electron + Reactjs + ArcoDesign OCR引擎:PaddleOCR + Pyinstaller 打包 前端和O…☆27Updated 3 years ago
- ☆48Updated 6 years ago
- 汉字数据集,包括汉字的相关信息,例如笔画数、部首、拼音、英文释义/同义词等。☆123Updated 5 years ago
- 精选的中国开放文档格式(OFD)资源列表,包括标准规范、库、SDK、转换工具、阅读器和教程,为开发者和研究者提供全面参考。☆34Updated last year
- english dictionary database☆281Updated 3 years ago
- ☆392Updated 2 months ago