XJF2332 / GOT-OCR-2-GUI
GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能
☆169Updated this week
Alternatives and similar repositories for GOT-OCR-2-GUI:
Users that are interested in GOT-OCR-2-GUI are comparing it to the libraries listed below
- MinerU是一款 开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。☆187Updated 5 months ago
- 📝 针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。☆193Updated 6 months ago
- Analysis of Chinese and English layouts 中英文版面分析☆205Updated last month
- GraphRAG-Ollama-UI + GraphRAG4OpenWebUI 融合版(有gradio webui配置生成RAG索引,有fastapi提供RAG API服务)☆107Updated 8 months ago
- 基于MinerU的桌面应用程序,MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。☆79Updated 6 months ago
- 文本语料转训练集工具,txt转dataset☆92Updated last year
- 研究GOT-OCR-项目落地加速,不限语言☆60Updated 6 months ago
- 一个中文语音转文字项目,封装自FireRedASR☆46Updated 2 months ago
- generate ppt with llm☆91Updated last year
- 阿里SenseVoice的fastpi封装,采用onnx发布,体积更小,附带量化模型,支持GPU。支持从URL文件进行语音识别。☆80Updated 8 months ago
- 一个用于CosyVoice的api接口项目☆275Updated 3 months ago
- Unsloth框架在Windows平台微调训练Qwen2大模型,非WSL☆59Updated 10 months ago
- 基于OpenVoice和Melotts整合的中文版webui,添加resemble_enhance音频增强功能☆91Updated last year
- 这是一个 ChatTTS 音频仓库,包含用不同 seed 生成的不同音色,你可以方便地挑选你喜欢的 seed。☆48Updated 11 months ago
- Based on RapidOCR, extract the PDF content☆165Updated this week
- 支持中文🇨🇳🇨🇳🇨🇳 的 microsoft/graphrag☆44Updated last month
- EZ-Work AI文档翻译,人人可用的开源AI文档翻译助手,可以快速低成本调用OpenAI等大语言模型api,帮助您实现txt/markdown/word/csv/excel/pdf/ppt的文档翻译。☆231Updated last month
- 如需体验TextIn文档解析,请访问 https://cc.co/16YSIy☆133Updated last month
- Using GPT to parse PDF☆96Updated 8 months ago
- Bert-vits2转写和标注独立整合Webui,整合阿里FunAsr,必剪Asr以及Whisper大模型☆177Updated 9 months ago
- 基于SenseVoice的funasr版本进行的api发布,可以无缝对接oneapi☆56Updated 8 months ago
- Phi3 中文后训练模型仓库☆321Updated 5 months ago
- 如需体验textin文档解析,请点击https://cc.co/16YSIy☆92Updated 5 months ago
- An common framework for voice and text interactions with LLMs☆93Updated 5 months ago
- 基于序列表格识别算法推理库,集成PP-Structure和modelscope等表格 识别算法。☆278Updated last month
- 实时STT,连接OpenAI接口/智谱AI(流式LLM)和GPT-SOVITS/Edge-TTS,通过网页的方式,进行跨网络的服务调用,实现实时对话的效果☆372Updated 4 months ago
- doc2x docs☆57Updated 5 months ago
- Dify 新闻聚合插件-多平台新闻热榜获取☆31Updated last month
- Sample GLM4V + ChatTTS AI assistant☆84Updated 11 months ago
- 文档方向分类☆217Updated 5 months ago