gumblex / tessdata_chi
Retrained Tesseract OCR model for Chinese
☆99Updated 2 years ago
Alternatives and similar repositories for tessdata_chi:
Users that are interested in tessdata_chi are comparing it to the libraries listed below
- Based on RapidOCR, extract the PDF content.☆137Updated 4 months ago
- OCR离线图片文字识别命令行windows程序,以JSON字符串形式输出结果,方便别的程序调用。基于 RapidOcrOnnx 。☆216Updated last year
- Python bindings for WPS Office RPC (for Linux)☆231Updated 2 months ago
- “Dive Into OCR” is a textbook developed by the PaddleOCR community that integrates OCR theory and practice.☆226Updated 2 years ago
- Convert the model in PaddleOCR to ONNX format☆74Updated 4 months ago
- transformers ocr for chinese☆370Updated 2 years ago
- 日历、公历(阳历)、农历(阴历、老黄历)、佛历、道历,支持节假日、星座、儒略日、干支、生肖、节气、节日、彭祖百忌、每日宜忌、吉神宜趋凶煞宜忌、吉神(喜神/福神/财神/阳贵神/阴贵神)方位、胎神方位、冲煞、纳音、星宿、八字、五行、十神、建除十二值星、青龙名堂等十二神、黄道黑道…☆313Updated 2 months ago
- 轻量级高性能中文分词项目☆198Updated last year
- 一个简易的mdx词典,支持中英文☆58Updated 8 months ago
- 基于1988出版的《现代汉语常用字表》,制作的常用汉字表(2500 + 1000)及 基本汉子表(7000)。☆17Updated 2 years ago
- 《现代汉语大词典》字词头☆25Updated 4 years ago
- 一个带透明化及滚动截图(截屏)功能的截图软件☆56Updated 6 months ago
- 用python实现的滚动截屏☆24Updated 2 years ago
- 《通用规范汉字表》是由中华人民共和国教育部、国家语言文字工作委员会联合组织研制的汉字使用规范, 2013年6月5日正 式颁布,成为社会一般应用领域的汉字规范.☆55Updated last month
- Fast integer versions of trained LSTM models☆503Updated 5 months ago
- 中华经典古籍精校、诗词,四书五经、四大名著、诗经、楚辞、全唐诗、全宋词、唐诗三百首、宋詞三百首、二十四史......☆86Updated 3 years ago
- ☆584Updated 4 months ago
- CnSTD: 基于 PyTorch/MXNet 的 中文/英文 场景文字检测(Scene Text Detection)、数学公式检测(Mathematical Formula Detection, MFD)、篇章分析(Layout Analysis)的Python3 包☆704Updated last week
- AI-OCR是基于PaddleOCR的OCR桌面客户端程序,支持Windows、Linux、MacOS等操作系统。 技术架构 前端界面:Electron + Reactjs + ArcoDesign OCR引擎:PaddleOCR + Pyinstaller 打包 前端和O…☆24Updated 2 years ago
- A carefully-designed OCR pipeline for universal boarded table recognition and reconstruction.☆171Updated 2 years ago
- 支持中文和拼音的 SQLite fts5 全文搜索扩展 | A SQLite3 fts5 tokenizer which supports Chinese and PinYin☆631Updated 3 weeks ago
- Best (most accurate) trained LSTM models.☆1,276Updated 10 months ago
- 🔎📖对中文PDF进行OCR | OCR for Chinese PDF file using API from DayBreak-u/chineseocr_lite☆90Updated 6 months ago
- ☆270Updated last month
- simple and fast dictionary tool☆113Updated 11 years ago
- ❤️中华民族二十四史:史记,汉书,后汉书,三国志等。☆17Updated last year
- 图片搜索引擎,很简单。三步构建属于你自己的图片搜索引擎,掌握向量数据库和以图搜图、文本搜索图片。☆115Updated last year
- 使用 spleeter 将视频中的人声提取出来(去除背景音),再对视频中的声音进行分析,分成静音部分和非静音部分,分别施加不同的速度,最后合成到一个新视频。☆149Updated 3 years ago
- 一个简单快速的分词、命名实体识别工具☆561Updated 6 months ago
- A simple way to deploy PaddleOCR based on FastAPI. (PaddleOCR 的 FastAPI 快速部署方案)☆98Updated 2 weeks ago