gumblex / tessdata_chi
Retrained Tesseract OCR model for Chinese
☆109Updated 2 years ago
Alternatives and similar repositories for tessdata_chi
Users that are interested in tessdata_chi are comparing it to the libraries listed below
Sorting:
- Based on RapidOCR, extract the PDF content☆166Updated last week
- Python bindings for WPS Office RPC (for Linux)☆243Updated last month
- 🔎📖对中文PDF进行OCR | OCR for Chinese PDF file using API from DayBreak-u/chineseocr_lite☆99Updated 10 months ago
- 开源的中英文离线 OCR,使用 PaddleOCR 实现,提供了简单的 Web 页面及接口☆121Updated 2 years ago
- 《现代汉语词典》(第7版)全文TXT☆267Updated 10 months ago
- 【间隙·树·排序算法】 对OCR结果或PDF提取的文本进行版面分析,按人类阅读顺序进行排序。☆132Updated last year
- 词语拼音数据☆480Updated last month
- 中文汉语拼音辞典,汉字拼音字典,词典,成语词典,常用字、多音字字典数据库☆593Updated 3 months ago
- GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆170Updated this week
- Fast integer versions of trained LSTM models☆535Updated 9 months ago
- rapidocr onnx cpp☆238Updated last month
- Best (most accurate) trained LSTM models.☆1,340Updated last year
- 使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆153Updated 4 years ago
- 文档方向分类☆217Updated 5 months ago
- This project employs Optical Character Recognition (OCR) to digitize historical records from the Qing manufacturing office.☆25Updated 2 years ago
- CnSTD: 基于 PyTorch/MXNet 的 中文/英文 场景文字检测(Scene Text Detection)、数学公式检测(Mathematical Formula Detection, MFD)、篇章分析(Layout Analysis)的Python3 包☆739Updated 2 months ago
- PPOCRLabel is a semi-automatic graphic annotation tool suitable for OCR field, with built-in PP-OCR model to automatically detect and re-…☆202Updated last year
- Chinese characters code table 全部汉字20902个汉字的全拼|五笔|郑码|UNICODE|GBK|笔画数|部首|笔顺编号等编码☆15Updated 2 years ago
- ☆297Updated last month
- 一个中文语音转文字项目,封装自FireRedASR☆47Updated 2 months ago
- The latest SQLite version of the China Biographical Database☆126Updated 8 months ago
- 《通用规范汉字表》+ 注音 + Rime 字表☆48Updated 2 years ago
- The hanzi similar tool.(汉字相似度计算工具,中文形近字算法。可用于手写汉字识别纠正,文本混淆等。)☆263Updated last year
- transformers ocr for chinese☆386Updated 2 years ago
- 图片搜索引擎,很简单。三步构建属于你自己的图片搜索引擎,掌握向量数据库和以图搜图、文本搜索图片。☆129Updated last year
- 手写文字擦除第1名方案,水印智能消除赛第1名☆140Updated last year
- CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直…☆41Updated last year
- 基于序列表格识别算法推理库,集成PP-Structure和modelscope等表格识别算法。☆287Updated last week
- 開放漢語字典 - 現代漢語字音數據庫☆22Updated 4 years ago
- Analysis of Chinese and English layouts 中英文版面分析☆208Updated last month