NewComer00 / chinese-pdf-ocrLinks
🔎📖对中文PDF进行OCR | OCR for Chinese PDF file using API from DayBreak-u/chineseocr_lite
☆103Updated last year
Alternatives and similar repositories for chinese-pdf-ocr
Users that are interested in chinese-pdf-ocr are comparing it to the libraries listed below
Sorting:
- Based on RapidOCR, extract the PDF content☆179Updated 3 months ago
- Retrained Tesseract OCR model for Chinese☆118Updated 3 years ago
- 开源的中英文离线 OCR,使用 PaddleOCR 实现,提供了简单的 Web 页面及接口☆124Updated 3 years ago
- 使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆155Updated 4 years ago
- FastAPI PaddleSpeech 音频录音转文字☆51Updated last year
- PDF 批量翻译,翻译后的PDF格式基本不变。导出PDF和Docx。优化并精简了来自于QPromise 的 EasyTrans。优 化了通过百度翻译API稳定进行长翻译!☆142Updated last year
- 【间隙·树·排序算法】 对OCR结果或PDF提取的文本进行版面分析,按人类阅读顺序进行排序。☆146Updated last year
- CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直…☆45Updated last year
- Library classification systems such as Library of Congress Classification, Chinese Library Classification (《中国图书馆分类法》).☆69Updated 5 years ago
- 通过paddle ocr实现pdf转markdown☆72Updated 9 months ago
- GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆178Updated last month
- 一个简单快速的分词、命名实体识别工具☆606Updated 2 weeks ago
- ☆385Updated 3 weeks ago
- a pdg2pdf tool to convert pdg files to pdf☆51Updated 3 years ago
- 《现代汉语词典》(第7版)全文TXT☆283Updated last year
- 一个可以验证和计算文本消耗 Token 的小工具,支持在浏览器中使用,汉化自 OpenAI Tokenizer。☆57Updated last year
- 印章提取, 公章提取, 背景透明, 电子章☆107Updated 4 years ago
- 轻量级高性能中文分词项目☆200Updated 2 years ago
- A method to build a portable and offline-available MSD Manual. 一种构建便携式离线《默沙东诊疗手册》的方法。☆66Updated last year
- an open high-performance Optical Character Recognition (OCR) toolkit☆267Updated 2 weeks ago
- Automatic Speech Recognition(ASR), Text-To-Speech(TTS) engine. 中英语音识别、多角色语音合成,支持多语言,准确率高☆500Updated 8 months ago
- Anti OCR, Free Texts (拒绝被OCR,让文字得到自由)。把文本转换成机器无法识别但人可读的图片。☆52Updated 2 years ago
- 图片搜索引擎,很简单。三步构建属于你自己的图片搜索引擎,掌握向量数据库和以图搜图、文本搜索图片。☆145Updated last year
- ☆350Updated last year
- Umi-OCR windows 运行环境☆122Updated 4 months ago
- Code for my medium article: ["Faster Notes with Python and Deep Learning"](https://medium.com/p/b713bbb3c186/edit)☆140Updated 4 years ago
- 使用python写的,根据word文档模板,自动生成合同材料,相关的输入信息通过UI界面来输入。☆48Updated 5 years ago
- [内测中]QPT - 致力于让开源项目更好通往互联网世界的Python to EXE工具(Python打包)。☆768Updated 6 months ago
- Umi-OCR Linux 运行环境☆125Updated 4 months ago
- 食物营养成分表,共 1643 条数据。☆53Updated 4 years ago