XLPRUtils / pyxllibLinks
厦门理工模式识别团队通用python代码工具库
☆16Updated this week
Alternatives and similar repositories for pyxllib
Users that are interested in pyxllib are comparing it to the libraries listed below
Sorting:
- 中文论文、证券类、财报类PDF数据☆36Updated last year
- ✅Deploy PaddleOCR with flask | 利用Flask对PaddleOCR进行部署,方便调用☆43Updated 3 years ago
- 一个微博毒舌AI,疯狂 diss 微博博主☆15Updated last year
- 本项目借助飞桨平台,构建起一套创新的多模型协同系统,实现 PDF 文件到 Markdown 文件的高效、精准转换。☆27Updated 10 months ago
- Based on RapidOCR, extract the PDF content☆185Updated 9 months ago
- Analysis of Chinese and English layouts 中英文版面分析☆260Updated this week
- 🚀 本代码仓致力于分享AI领域的核心知识,涵盖了AI-Agent、RAG(Retrieval-Augmented Generation)、GraphRAG、大模型、大模型微调以及多模态等多个热点话题。这里将提供丰富的代码实例、理论解析和实战技巧,帮助你更好地理解和应用人工…☆12Updated last year
- 🚀 Fine-tune Large Language Models on AWS SageMaker using LLaMA Factory - End-to-end pipeline for distributed LLM training, evaluation & …☆18Updated last year
- 文档图像处理工具(Document image processing tool),包括漂白 / 文字方向矫正 / 清晰增强 / 笔记去噪美化 / 去阴影 / 扭曲矫正 / 切边增强(DocBleach / TextOrientationCorrection / DocSha…☆119Updated last year
- 浏览器AI插件,一键把网页文章内容生成为思维导图,很方便。☆26Updated last year
- 📝 针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。☆207Updated last year
- 文档方向分类☆222Updated last week
- 这里将paddle中的ocr等模型转为onnx格式,并利用java版深度框架djl加载这些onnx模型进行推理预测尝试。☆13Updated 3 years ago
- 【间隙·树·排序算法】 对OCR结果或PDF提取的文本进行版面分析,按人类阅读顺序进行排序。☆162Updated last year
- ✨🦋 illufly - 【幻蝶】基于记忆蒸馏、资料检索的自我进化智能体☆77Updated 2 months ago
- Examples for QinYan GLMs☆13Updated last year
- ☆12Updated last year
- Recognition of Various Common Seal Scans in Complex Environments☆47Updated last year
- A high-performance, open-source PDF data extraction tool. 一站式开源高性能数据提取工具,将复杂 PDF 文档转换为 Markdown 和 JSON 格式,使用onnx模型。☆98Updated last month
- Python3 package for Chinese/English OCR,use paddleocr-v5 onnx model(~20MB), with ultra-fast inference speed. 基于ppocr-v5-onnx模型推理,中英文OCR开源…☆124Updated 2 weeks ago
- ☆20Updated last year
- 一个LLM-Agent与PPT项目,支持基于对话式需求进行操作PPT的原生AI应用项目。模型为DeepSeek,基于LLM+VBA调用进行文档操作,轻量级ChatPPT服务。An LLM-Agent and PPT project that supports native …☆26Updated last year
- AI Agent实现的自动化的长视频切片工具;Automated long - video slicing tool implemented by AI Agent☆19Updated 3 months ago
- ☆15Updated last year
- bisheng-unstructured library☆57Updated 8 months ago
- llms related stuff , including code, docs☆13Updated 11 months ago
- zlai☆23Updated last year
- 该项目主要是为了识别图片里面的表格数据,并将表格数据抽取处理,导出成csv的文件。整个项目会使用streamlit进行部署和展示。使用的技术:paddleocr,PPStructure,streamlit☆34Updated 3 years ago
- AI写作小工具方案:让2个智能体合作写出真正可用的图文并茂的帖子(微信公众号,小红书,博客)。1,写作智能体,2,知识库智能体。☆19Updated 8 months ago
- Mojuan: Write your own AI application.☆16Updated last year