nmusik / padpdf-ocr
PaddleOCR for Chinese pdf
☆15Updated 3 years ago
Alternatives and similar repositories for padpdf-ocr:
Users that are interested in padpdf-ocr are comparing it to the libraries listed below
- 百度汉语字典爬虫,拼音数据,35万海量百度词典数据。☆24Updated 2 years ago
- 利用paddleocr,离线状态下识别身份证复印件☆31Updated 4 years ago
- lightsmile个人的用于爬取网络公开语料数据的mini通用爬虫框架。☆12Updated 4 years ago
- 一个快速确定文本(新闻)归属地的工具☆18Updated 4 years ago
- 文本纠错工具包(Text Correct, CSC), 支持中文拼写纠错/标点符号纠错(CSC, Chinese Spelling Correct / Check; Punct), CSC支持各领域数据(包括古文), 模型在大规模、各领域的、现代/当代语料上训练而得, 泛化…☆10Updated this week
- create ChatGPT Desktop Application (Mac and Windows ) by pyside6☆22Updated 2 years ago
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 2 years ago
- 该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件☆23Updated 2 years ago
- 基于ffmpeg最新版与Python3最新版开 发的视频与文件处理工具,可以批量递归进行处理视频(改名,倍速,提取音频或不含音频的视频,替换原视频中的音频)☆9Updated 4 years ago
- 版面分析+OCR☆11Updated 3 years ago
- TTS(Text to speech) GUI using Baidu TTS api, currently only support Chinese; 将文字转换为语音mp3文件,自动拆分较长文本文件,适合用于生成有声小说☆47Updated 6 years ago
- ☆44Updated 5 years ago
- 【写作天下】为作家们创造世界而诞生,执云作笔,诉尽平生意。☆37Updated 5 years ago
- OCR 识别图片以及PDF中的文字, based on Qt for windows and linux.☆141Updated this week
- Web application for easy and convenient viewing of OCR results.☆15Updated 4 years ago
- 针对口语进行时间抽取并标准化☆13Updated 5 years ago
- Large-scale exact string matching tool☆17Updated last month
- 名人名言,格言网,整站数据获取爬虫。☆17Updated 5 years ago
- 使用 Python 制作简单视频 🎬☆17Updated 2 years ago
- 中文文本改写☆19Updated 4 years ago
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆40Updated 2 years ago
- 公众号☆11Updated last year
- 中文「四角号码」数据与工具,可以将汉字拆解成和字形相关的编码,在机器学习中作为汉字的字形特征☆26Updated 5 years ago
- 利用 onnxruntime 及 PaddleOCR 提供的模型, 对图片中的文字进行检测与识别.☆85Updated 2 years ago
- 诗词歌词格言生成配图卡片☆16Updated 5 years ago
- 视频工厂设计图制作框架:10行代码实现对图片/视频等素材的特效、转场、剪辑、合成等形式的加工,生产出炫酷影集和广告视频☆37Updated 4 years ago
- Vietnamese and Chinese to English☆15Updated 6 years ago
- 文档翻译服务☆13Updated 7 years ago
- 表格结构识别LGPMA推理☆23Updated 2 years ago
- 开源的中英文离线 OCR,使用 PaddleOCR 实现,提供了简单的 Web 页面及接口☆120Updated 2 years ago