基于MinerU的桌面应用程序,MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。
☆139Oct 17, 2024Updated last year
Alternatives and similar repositories for MinerU-PDFScanner
Users that are interested in MinerU-PDFScanner are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。☆318Dec 3, 2024Updated last year
- Cursor rules: RIPER-5, A more efficient Chinese translation version.☆24Jun 27, 2025Updated 10 months ago
- PDF识别助手(PDFInsight)是一个高效的Python工具,用于从在线PDF文档中提取文本内容。无论是文字型PDF还是以图片形式嵌入的PDF,PDFInsight都能轻松应对,有效地从中提取出文本信息。🚀☆35Dec 18, 2023Updated 2 years ago
- MinerU免安装部署一键启动整合包☆19Oct 24, 2025Updated 6 months ago
- 基于cnstd+cnocr作为基础,封装的一个ocr的web服务☆10Nov 21, 2021Updated 4 years ago
- Deploy to Railway using AI coding agents - Free Credits Offer • AdUse Claude Code, Codex, OpenCode, and more. Autonomous software development now has the infrastructure to match with Railway.
- MinerU API server☆87Dec 20, 2024Updated last year
- .NET Core API with Elasticsearch for searching e-book documents☆15Aug 25, 2021Updated 4 years ago
- 基于RulesEngineEditor的规则引擎编辑器☆18Jul 9, 2022Updated 3 years ago
- GRPC based Micro-Service Framework (.net core 2.0)☆15Dec 20, 2018Updated 7 years ago
- 计算机毕业设计Python+知识图谱大模型AI医疗问答系统 健康膳食推荐系统 食谱推荐系统 医疗大数据 机器学习 深度学习 人工智能 爬虫 大数据毕业设计☆17Dec 12, 2024Updated last year
- .net core实现Grpc通信,并实现Consul的服务注册,服务发现,健康检查,负载均衡☆37Aug 30, 2018Updated 7 years ago
- 使用大模型自动构建课程知识图谱☆10Aug 9, 2024Updated last year
- 使用大模型自动构建课程知识图谱☆38May 26, 2025Updated 11 months ago
- A curated list of free resources. 收集免费资源(适合创业小团队、个人学习等使用)☆19Feb 7, 2022Updated 4 years ago
- Serverless GPU API endpoints on Runpod - Get Bonus Credits • AdSkip the infrastructure headaches. Auto-scaling, pay-as-you-go, no-ops approach lets you focus on innovating your application.
- 适配PC、mac、嵌入式设备☆30Mar 17, 2025Updated last year
- Build An Agent Application☆29Jul 22, 2025Updated 9 months ago
- 🔥ORM framework, support databases: MySQL, MariaDB, TiDB, OceanBase, SQL Server, Oracle, SQLite, DuckDB, MS Access, Firebird, PostgreSql,…☆16Apr 9, 2026Updated last month
- Text2Neo4j 是一个遍历文档、从文本中提取关系并将其保存到 Neo4j 数据库中以形成知识图谱的工具。本项目结合了 Dify 和 LLaMA3.1(8B 模型)来高效处理和提取复杂关系。☆24Aug 31, 2024Updated last year
- 对话集提取器是一个基于chatglm模型的工具,用于从文本中提取对话集。该工具可以帮助用户从小说、剧本等文本中自动提取出对话,以便进行分析、标注或其他应用。☆12Nov 22, 2024Updated last year
- 陶弘景中医药大模型,包括命名实体识别,关系抽取,知识图谱构建,大模型增量微调,RAG☆18Jul 28, 2025Updated 9 months ago
- 这是一个使用 [Telegraf](https://telegraf.js.org/) 框架和 [Axios](https://axios-http.com/) 库构建的 Telegram 机器人。该机器人可以接收消息,并将消息内容保存到你的 blinko。☆16Dec 24, 2024Updated last year
- Face++ 是一款基于 Android 平台开发的创新性 AI 面相分析应用。它巧妙地将中国传统面相学理论(如“三庭五眼”和“十二宫”)与现代人工智能技术相结合,为用户提供一份专业、详尽且富有洞察力的面相分析报告☆22Jul 14, 2025Updated 9 months ago
- One file gets dynamic pages to static pages, supports .NET CORE 3.1, and supports MVC and PageModel.☆23Sep 25, 2024Updated last year
- 1-Click AI Models by DigitalOcean Gradient • AdDeploy popular AI models on DigitalOcean Gradient GPU virtual machines with just a single click. Zero configuration with optimized deployments.
- 基于序列表格识别算法推理库,集成PP-Structure和modelscope等表格识别算法。☆417Apr 23, 2026Updated 2 weeks ago
- 此版本是之前版本的3.0,同时使用.NetCore全部重写☆55Jul 30, 2018Updated 7 years ago
- 微信小程序 Asp.net Core SignalR Client 代码片段演示☆28May 15, 2019Updated 6 years ago
- Transforms complex documents like PDFs and Office docs into LLM-ready markdown/JSON for your Agentic workflows.☆61,724Apr 29, 2026Updated last week
- conversion doc(pdf/html/doc/docx/ppt/pptx)to markdown☆49Jul 23, 2024Updated last year
- 77,370条敏感文本和22,823个敏感词的高质量数据集,并进行分类☆17Mar 18, 2025Updated last year
- 把poe转换成openai格式的API☆13Mar 4, 2025Updated last year
- 树莓派qwen-omni语音助手免TTS/STT☆18Apr 4, 2025Updated last year
- 面向大学生创业的筹众平台☆23May 3, 2017Updated 9 years ago
- Deploy on Railway without the complexity - Free Credits Offer • AdConnect your repo and Railway handles the rest with instant previews. Quickly provision container image services, databases, and storage volumes.
- SSL Assistant 是一个基于 Go 语言开发的跨平台证书部署管理助手,主要功能是通过主动获取、更新证书信息,并通过命令行执行。该工具支持 Windows 和 Linux 平台,可以自动寻找 Nginx 服务对应站点的配置文件,获取域名和证书信息,并将证书信息保存到…☆25Sep 16, 2025Updated 7 months ago
- VerbaAurea: 一个文档预处理工具,专注于为知识库构建提供高质量的文本数据。☆136Dec 22, 2025Updated 4 months ago
- A Tampermonkey script for a fully-featured text-to-speech tool using the OpenAI TTS API.一个使用openai tts api的朗读工具的油猴脚本,功能完善。☆13Dec 12, 2023Updated 2 years ago
- ☆17Jul 9, 2025Updated 10 months ago
- TorcDB: A Low-Latency Graph Database on RAMCloud☆20Apr 27, 2019Updated 7 years ago
- dow新协议接口☆21Jun 2, 2025Updated 11 months ago
- ☆10May 8, 2025Updated last year