Shangliyuan / PDFInsightLinks
PDF识别助手(PDFInsight)是一个高效的Python工具,用于从在线PDF文档中提取文本内容。无论是文字型PDF还是以图片形式嵌入的PDF,PDFInsight都能轻松应对,有效地从中提取出文本信息。🚀
☆32Updated last year
Alternatives and similar repositories for PDFInsight
Users that are interested in PDFInsight are comparing it to the libraries listed below
Sorting:
- PDF 批量翻译,翻译后的PDF格式基本不变。导出PDF和Docx。优化并精简了来自于QPromise 的 EasyTrans。优化了通过百度翻译API稳定进行长翻译!☆143Updated last year
- 一个批量转换caj到pdf的脚本☆20Updated 3 years ago
- 知网论文数据爬虫☆58Updated last year
- 视频转图文并茂的pdf—videotopdf:打工人(会议记录)和学生党(网课笔记)等必备!使用地址:https://zjrwtxtechstudio-video-to-pdf.hf.space☆46Updated 10 months ago
- 第三方Doc2X桌面应用,支持Linux(X11,Wayland)/Windows☆38Updated last year
- 基于人工智能 把 pdf 转 txt(pdf 文字识别)☆17Updated 3 years ago
- PDF解析(文字,章节,表格,图片,参考),基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答,摘要,信息抽取☆209Updated 2 years ago
- 📚中国近代革命历史知识图谱系统 🌈提供了知识图谱可视化、知识检索、关系检索、时空检索、时空演化、语料检索、知识抽取、知识问答等丰富而有效的中国近代革命历史知识服务。☆67Updated last year
- 打开视频文件进行按照不同画面自动截图,适用于众多PPT讲解视频截取PPT图片☆24Updated 5 years ago
- ☆393Updated 3 months ago
- 使用python写的,根据word文档模板,自动生成合同材料,相关的输入信息通过UI界面来输入。☆49Updated 5 years ago
- Umi-OCR Linux 运行环境☆139Updated 6 months ago
- 基于深度学习与Neo4j的军事装备知识图谱网页应用构建。本项目是一个军事武器知识图谱网页应用软件原型系统。该系统由数据爬虫、数据管理、数据处理、知识问答、新闻热点、词条查询和图谱展示七个功能模块组成。系统从互联网上爬取数据,并基于百度文心ERNIE 3.0模型对数据进行实体…☆137Updated 2 years ago
- 以 node 为主要工具,通过百度翻译 API,批量翻译外文 pdf 文件,并提取摘要、关键词、结论等关键信息,助力科研工作。☆31Updated 4 years ago
- MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。☆263Updated 10 months ago
- OpenAI-Translator 是一个开源的 PDF 翻译工具,为将英文 PDF 文档翻译为中文而设计。此工具基于 OpenAI 的 GPT-4、GPT-3 以及 GPT-3.5 Turbo 大型语言模型构建,并采用 Python 实现,确保其设计灵活、模块化且面向对象…☆45Updated 2 years ago
- 降AIGC率,降低知网、维普、格子达平台的AIGC检测率,降知网AI,降维普AI,降格子达AI。☆49Updated 2 months ago
- doc2x docs☆70Updated 10 months ago
- 基于大语言模型API(本地或商用API)的外挂知识库问答系统(附neo4j实现知识图谱)☆45Updated 4 months ago
- 基于红楼梦知识内容的简易问答系统☆17Updated 3 years ago
- 使用 安娜的档案 提供的资源,下载书籍(包括 Z-Library 等),并重命名。☆88Updated 10 months ago
- 基于医疗领域知识图谱的问答系统,同时使用了chatGPT、chatGLM4等方式生成医学知识图谱。☆58Updated last year
- 用最简单的代码带你实现基于大模型的本地知识库问答系统☆33Updated 2 years ago
- 基于知识图谱的古诗词问答系统,包复现,建议收藏。☆30Updated 6 months ago
- 印章提取, 公章提取, 背景透明, 电子章☆113Updated 4 years ago
- NoSQL可视化人脉图谱项目:非关系型数据库作为更符合人脑记忆的数据展现形式,在未来理论会成为应用界的主流,希望该项目能够成为推动HelpDesk、数据可视化、数据看板等IT基础能力持续降低上手门槛的起点。☆45Updated 3 years ago
- 通过paddle ocr实现pdf转markdown☆74Updated last year
- 封装百度文心一言网页版 API☆71Updated 2 years ago
- 关于本地离线翻译程序,支持文本翻译,下划线翻译,屏幕截图翻译,语音(音频文件)翻译,视频翻译,txt文件,PPT,Word,PDF,Excel,图片翻译。资源☆279Updated last year
- 易用AI,好用的OCR文字识别和翻译跨平台软件。支持Windows,Mac。目前功能是类似天若OCR,PandaOCR,Bob等软件核心功能的交集。也基于PaddleOCR,chineseocr_lite 实现了离线识别。☆28Updated 2 years ago