liuhuapiaoyuan / MinerU-PDFScanner
基于MinerU的桌面应用程序,MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。
☆77Updated 6 months ago
Alternatives and similar repositories for MinerU-PDFScanner:
Users that are interested in MinerU-PDFScanner are comparing it to the libraries listed below
- MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。☆174Updated 4 months ago
- ☆136Updated last week
- EZ-Work AI文档翻译,人人可用的开源AI文档翻译助手,可以快速低成本调用OpenAI等大语言模型api,帮助您实现txt/markdown/word/csv/excel/pdf/ppt的文档翻译。☆229Updated 3 weeks ago
- Make Office/WPS more powerful and easier to use with AI, similar to Office Copilot and WordGPT.☆194Updated this week
- A Flexible Multi-Model Orchestration API with OpenAI Compatibility☆277Updated 2 weeks ago
- GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆166Updated 3 weeks ago
- Using GPT to parse PDF☆94Updated 7 months ago
- FisherAI 是一款为提高学习效率而设计的Chrome插件,通过一键操作,支持自动摘要、网页及视频翻译、多轮对话等功能。此外,FisherAI 支持多种大语言模型,包括但不限于openai/gemini/deepseek/openrouter/siliconflow/…☆144Updated this week
- 视频转图文 AI跨平台客户端(win mac linux)☆269Updated 6 months ago
- coze-微信AI机器人一键运行包,下载exe双击直接使用。(该项目已停止维护,使用微信机器人请关注我的新项目(技术更合规,使用更简单) :https://github.com/ImGoodBai/GoodWeBot)☆154Updated 6 months ago
- 一个把长文转款成摘要卡片/图片的前端应用,使用 Kimi 对文章进行结构化总结。☆99Updated 4 months ago
- WiseMind AI 是一款由 AI 驱动的高效学习助手,支持众多热门的 AI 模型,内置丰富 AI 插件☆35Updated this week
- 利用 LLM 大模型辅助阅读 PDF 与观看视频,用以提升语言能力。☆144Updated 6 months ago
- 这是一个基于 `PyQt5` 和 `Python` 的网络信息抓取工具,可自动从互联网搜索引擎中抓取与关键词相关的内容,并将结果保存至本地文件,同时支持文本复制到剪贴板。支持的搜索引擎包括 Google, Bing, Baidu, 和 Sogou。This is a web…☆25Updated 10 months ago
- 文档全文翻译器:英文PDF/MD论文 → (PDF Doc2X识别) → 翻译(GPT deepseek ollama google deepL deepLX)→ 中文文档(Markdown/Word)☆82Updated 2 months ago
- 无缝集成处理和调度 Dify & Dify on WeChat,Web 可视化多用户管理/一键启动 ChatBot,简化了令人惊叹且响应迅速的 ChatBot 应用程序的创建。☆63Updated 7 months ago
- 为 Cherry Studio 提供一个API 服务,将Cherry Studio 作为一个客户端,维护RAG和模型信息,然后API服务可以对外提供服务☆85Updated 3 months ago
- 🚀 讯飞星火大模型逆向API【特长:办公助手】,支持高速流式输出、智能体对话、联网搜 索、AI绘图、长文档解读、图像解析、多轮对话,零配置部署,多路token支持,自动清理会话痕迹,仅供测试,如需商用请前往官方开放平台。。☆136Updated 4 months ago
- ☆59Updated 5 months ago
- 基于whisper的实时语音识别 网页和桌面客户端☆172Updated 6 months ago
- 🚀 聆心智能 Emohaa情感陪伴大模型逆向API【特长:共情能力】,支持高速流式输出、多轮对话,零配置部署,多路token支持,自动清理会话痕迹,仅供测试,如需商用请前往官方开放平台。☆123Updated 4 months ago
- 通过LLM进行进行字幕断句分割,处理和优化字幕文件,将自动语音识别(ASR)数据的分段合并与拆分,☆100Updated 4 months ago
- ☆84Updated last week
- This is an open-source RSS crawler with an LLM interface, and it can use LLM to analyze news feeds☆131Updated last month
- 一站式短视频拼接软件 无依赖,点击即用,自动去黑边,自动帧同步,自动调整分辨率,批量变更视频为横屏/竖屏☆446Updated 5 months ago
- Integrates search APIs with GPT models for real-time web access, enabling intelligent Q&A and information retrieval similar to New Bing. …☆39Updated 9 months ago
- 一个基于 cloudflare worker 的 LLM API 反向代理,支持 OpenAI, Gemini, Groq 等平台。接口兼容 OpenAI API 规范,可以直接使用 OpenAI SDK 调用。☆201Updated 6 months ago
- 这是一个用于监控和检测 Ollama 服务可用性和性能的系统。它提供了一个现代化的 Web 界面,支持多语言(中文/英文),并具有实时检测和数据展示功能。☆293Updated this week
- 一个基于 Funasr 的离线字幕生成工具~☆66Updated last week
- GraphRAG-Ollama-UI + GraphRAG4OpenWebUI 融合版(有gradio webui配置生成RAG索引,有fastapi提供RAG API服务)☆105Updated 7 months ago