liuhuapiaoyuan / MinerU-webui
MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。
☆55Updated 3 weeks ago
Related projects ⓘ
Alternatives and complementary repositories for MinerU-webui
- generate ppt with llm☆65Updated 8 months ago
- GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆115Updated this week
- Sample GLM4V + ChatTTS AI assistant☆84Updated 5 months ago
- GraphRAG-Ollama-UI + GraphRAG4OpenWebUI 融合版(有gradio webui配置生成RAG索引,有fastapi提供RAG API服务)☆88Updated 3 months ago
- AI Q&A Search Engine ➡️ 基于LangChain和SearXNG打造的开源AI搜索引擎☆108Updated 2 months ago
- 使用文心一言+Python-pptx ,一键生成你的专属PPT☆75Updated 10 months ago
- ☆12Updated 5 months ago
- ChatPPT is powered by chatgpt/ollama, it could help you to generate PPT/slide. It supports output in English and Chinese☆231Updated 7 months ago
- 记录大模型相关的一些知识和方法☆107Updated last week
- Using GPT to parse PDF☆72Updated 2 months ago
- ☆90Updated 3 weeks ago
- 文本语料转训练集工具,txt转dataset☆78Updated 6 months ago
- Agentica: Build Multi-Agent Workflow with 3 lines code. 三行代码打造个人助手智能体。☆89Updated this week
- 阿里SenseVoice的fastpi封装,采用onnx发布,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆46Updated 2 months ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆93Updated 3 months ago
- An open-source LLM based automatically daily news collecting workflow showcase powered by Agently AI application development framework.☆444Updated last month
- 基于Dify自主创建的AI应用DSL工作流,你可以免费获取,无论是出于个人需求还是学习目的,它都能为您开启一段充满无限可能的智能之旅。☆32Updated last week
- 基于Dify的企业微信知识库机器人,基于企微gpt知识库的bot机器人,能够自动回复企业微信中收到的消息。这个机器人能够处理私聊和群聊,还可以记住与用户的聊天内容,从而做出更加贴合上下文的回应。此外,您还可以设置白名单来控制机器人与哪些用户或群组交互。如需自己dify网站版…☆315Updated 2 months ago
- 本数据集属于 根因分析与练习系统(Root Cause Analysis and Exercises for Mathematics, RCAE) 的基础子项目之一。旨在可以高效的发现学生数学、生物学业错误的根本原因。☆41Updated last month
- bge-large-zh api service☆20Updated 10 months ago
- ✏️0成本LLM微调上手项目,⚡️一步一步使用colab训练法律LLM,基于microsoft/phi-1_5、chatglm3,包含lora微调,全参微调☆56Updated 10 months ago
- 📝 针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。☆152Updated 3 weeks ago
- VideoFinder is an advanced video analysis tool powered by multimodal AI, designed to help users easily locate and identify specific objec…☆63Updated 2 weeks ago
- Analysis of Chinese and English layouts 中英文版面分析☆128Updated last month
- ☆61Updated 4 months ago
- Awada 是一个基于微信场景的团队知识助理智能体。它可以从群聊、公众号、网站等来源中进行在线自主学习(同时也接受自主文档上传),打造团队私域知识库,并为团队成员提供问答、资料查找以及写作(Word)服务。☆182Updated last week
- DataWhale 5月 GPT应用开发Hackathon比赛TOP1项目, 拿到107.5/120的最高分! 斩获最佳创新奖和最佳应用奖两个最佳奖项!☆71Updated 11 months ago
- 实时STT,连接OpenAI接口/智谱AI(流式LLM)和GPT-SOVITS/Edge-TTS,通过网页的方式,进行跨网络的服务调用,实现实时对话的效果☆255Updated 4 months ago
- A python wrapper for the Doc2X API and comes with native texts processing (to improve PDF recall in RAG). | Doc2X API的python封装,同时附带本地的文本处…☆200Updated this week
- 添加🚀流式 Web 服务到 GraphRAG,兼容 OpenAI SDK,支持可访问的实体链接🔗,支持建议问题,兼容本地嵌入模型,修复诸多问题。Add streaming web server to GraphRAG, compatible with OpenAI SD…☆198Updated 2 weeks ago