nmusik / padpdf-ocr
PaddleOCR for Chinese pdf
☆15Updated 3 years ago
Alternatives and similar repositories for padpdf-ocr:
Users that are interested in padpdf-ocr are comparing it to the libraries listed below
- 百度汉语字典爬虫,拼音数据,35万海量百度词典数据。☆24Updated 2 years ago
- lightsmile个人的用于爬取网络公开语料数据的mini通用爬虫框架。☆12Updated 4 years ago
- 该项目主要是抽取病历文件中的一些关键信息。并将抽取的内容进行streamlit前端的展示。目前支持的文件类型:图片,pdf文件,word文件☆23Updated 2 years ago
- 汉英双语词典,python crawler,chinese-english bilingual dictionary☆12Updated 5 years ago
- 利用paddleocr,离线状态下识别身份证复印件☆30Updated 4 years ago
- 中文文本改写☆19Updated 4 years ago
- 基于ffmpeg最新版与Python3最新版开发的视频与文件处理工具,可以批量递归进行处理视频(改名,倍速,提取音频或不含音频的视频,替换原视频中的音频)☆9Updated 4 years ago
- 一个用YOLO足球视频分析的任务,检测视频中的人与球。 A task of football video analysis to detect people and balls in the video with YOLO☆11Updated 4 years ago
- 针对口语进行时间抽取并标准化☆13Updated 4 years ago
- self complemented AlindexSpyder based on Selenium ,阿里商品指数抓取,包括淘宝采购指数,淘宝供应指数,1688供应指数。☆21Updated 6 years ago
- 该项目主要是为了识别图片里面的表格数据,并将表格数据抽取处理,导出成csv的文件。整个项目会使用streamlit进行部署和展示。使用的技术:paddleocr,PPStructure,streamlit☆35Updated 2 years ago
- 英文文档即时划词翻译软件。UI界面集成 阅读器 和 翻译器 于一体 ,避免来回切换。支持PDF/WORD格式。☆34Updated 4 years ago
- 版面分析+OCR☆11Updated 2 years ago
- pretrained models for cnocr☆55Updated 3 years ago
- Large-scale exact string matching tool☆15Updated 3 months ago
- 诗词歌词格言生成配图卡片☆15Updated 5 years ago
- 微博的爬虫,爬个人主页,用的scrapy 框架☆23Updated 9 months ago
- Document Layout Analysis Projects☆23Updated 5 years ago
- Python爬虫项目集合☆56Updated 6 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- ☆43Updated 5 years ago
- ☆12Updated last year
- ☆37Updated 5 years ago
- 快速使用FastAPI部署机器学习模型☆10Updated 4 years ago
- 通过语音(说话)即可完成实时文本输入。通过PaddleSpeech项目二次开发 完成,支持离线脱网环境部署,支持GPU推理,目前客户端仅支持Windows。☆25Updated 2 years ago
- 金庸小说人物关系图谱构建☆62Updated 5 years ago
- 使用 PyWebIO 部署 PaddleOCR 应用☆8Updated 3 years ago
- 基于浏览器端,通过JavaScript的小红书爬虫☆13Updated last year
- 图书名语料库。含部分电影、游戏名称。☆68Updated 10 months ago
- 错别字纠正算法。调用pycorrector接口,使用规则。☆66Updated 5 years ago