NoEdgeAI / doc2x-docLinks
doc2x docs
☆61Updated 6 months ago
Alternatives and similar repositories for doc2x-doc
Users that are interested in doc2x-doc are comparing it to the libraries listed below
Sorting:
- A python wrapper for the Doc2X API and comes with native texts processing (to improve PDF recall in RAG). | Doc2X API的python封装,同时附带本地的文本处…☆270Updated last week
- 通过paddle ocr实现pdf转markdown☆72Updated 8 months ago
- 📝 针对文档类图像做内容提取,将文档类图像一比一输出到Word或者Txt中,便于进一步使用或处理。后续计划支持输入PDF/图像,输出对应json格式、Txt格式、Word格式和Markdown格式。☆197Updated 7 months ago
- ☆112Updated 10 months ago
- Using GPT to parse PDF☆98Updated 9 months ago
- Analysis of Chinese and English layouts 中英文版面分析☆218Updated last week
- MinerU API server☆62Updated 6 months ago
- 利用免费的大模型api来结合你的私域数据来生成sft训练数据(妥妥白嫖)支持llamafactory等工具的训练数据格式synthetic data☆168Updated 7 months ago
- GOT-OCR的GUI版本,提供OCR、导出PDF、批处理等功能,但不提供训练功能☆174Updated last month
- ☆66Updated 9 months ago
- GraphRAG-Ollama-UI + GraphRAG4OpenWebUI 融合版(有gradio webui配置生成RAG索引,有fastapi提供RAG API服务)☆110Updated 10 months ago
- ☆41Updated 2 years ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆130Updated 10 months ago
- PDF解析(文字,章节,表格,图片,参考),基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答,摘要,信息抽取☆202Updated last year
- ☆68Updated last year
- Create your own GPT intelligent assistants using Azure OpenAI, Ollama, and local models, build and manage local knowledge bases, and expa…☆96Updated 10 months ago
- MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。☆209Updated 6 months ago
- 如需体验textin文档解析,请点击https://cc.co/16YSIy☆103Updated 7 months ago
- a useful PDF Translate tool base on LLM/ 一个基于大语言模型的PDF翻译程序☆68Updated 10 months ago
- 可能是免费中最好的搜索引擎API,支持Google,Bing,DuckDuckGo,Yahoo☆126Updated 2 years ago
- Here is a demo for PDF parser (Including OCR, object detection tools)☆35Updated 8 months ago
- 基于MinerU的桌面应用程序,MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。☆89Updated 8 months ago
- 本项目致力于为大模型领域的初学者提供全面的知识体系,包括基础和高阶内容,以便开发者能迅速掌握大模型技术栈并全面了解相关知识。☆61Updated 5 months ago
- 中文论文、证券类、财报类PDF数据☆32Updated last year
- An AI-powered content conversion tool that transforms text, web content, or HTML code into beautifully designed card images.一款基于AI的内容转换工…☆23Updated 2 months ago
- Based on RapidOCR, extract the PDF content☆172Updated last month
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆124Updated last year
- 如需体验TextIn文档解析,请访问 https://cc.co/16YSIy☆148Updated last week
- ragflow中的ocr部分,非官方项目☆44Updated 10 months ago
- ☆61Updated 4 months ago