Shangliyuan / PDFInsightLinks
PDF识别助手(PDFInsight)是一个高效的Python工具,用于从在线PDF文档中提取文本内容。无论是文字型PDF还是以图片形式嵌入的PDF,PDFInsight都能轻松应对,有效地从中提取出文本信息。🚀
☆35Updated 2 years ago
Alternatives and similar repositories for PDFInsight
Users that are interested in PDFInsight are comparing it to the libraries listed below
Sorting:
- 知网论文数据爬虫☆61Updated 2 years ago
- 视频转图文并茂的pdf—videotopdf:打工人(会议记录)和学生党(网课笔记)等必备!最新版已经迁移到 https://github.com/zjrwtx/Wise-Will-agent☆52Updated last month
- Convert Markdown to Word (.docx). / 将 markdown 文件转换为 Word(.docx)☆114Updated 4 years ago
- 基于人工智能 把 pdf 转 txt(pdf 文字识别)☆19Updated 3 years ago
- PDF解析(文字,章节,表格,图片,参考),基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答,摘要,信息抽取☆213Updated 2 years ago
- PDF 批量翻译,翻译后的PDF格式基本不变。导出PDF和Docx。优化并精简了来自于QPromise 的 EasyTrans。优化了通过百度翻译API稳定进行长翻译!☆143Updated 2 years ago
- A tutorial and implement of disease centered Medical knowledge graph and qa system based on it。知识图谱构建,自动问答,基于kg的自动问答。以疾病为中心的一定规模医药领域知识图谱…☆258Updated 2 years ago
- 智能简历解析系统,支持多维度信息提取☆118Updated 11 months ago
- 以 node 为主要工具,通过百度翻译 API,批量翻译外文 pdf 文件,并提取摘要、关键词、结论等关键信息,助力科研工作。☆31Updated 4 years ago
- 超过1000+精品PPT模板 🍔 个人多年私藏宝藏分享 ☀️ 持续更新中 🐂 你的star是我更新的最大动力 🚀☆269Updated 3 years ago
- a collection of NLP projects&tools. 自然语言处理方向项目和工具集合。☆237Updated last year
- 用最简单的代码带你实现基于大模型的本地知识库问答系统☆33Updated 2 years ago
- 知网爬虫,作者、摘要、题目、发表期刊等主要内容的获取☆37Updated 11 months ago
- 招聘网站爬虫:1.使用Python爬取智联招聘等网站。2.使 用XPath、BeautifulSoup等包解析网页。3.保存到MongoDB数据库中。☆16Updated 6 years ago
- 一个批量转换caj到pdf的脚本☆21Updated 4 years ago
- 基于大语言模型API(本地或商用API)的外挂知识库问答系统(附neo4j实现知识图谱)☆46Updated 7 months ago
- 基于大语言模型的专属知识库☆44Updated 2 years ago
- 打开视频文件进行按照不同画面自动截图,适用于众多PPT讲解视频截取PPT图片☆27Updated 5 years ago
- 自动读取本地pdf文献并提取标题、作者、摘要和结论生成综述。Read and translate English literature to generate review automatically.☆172Updated 4 years ago
- PDF全文翻译器:英文PDF论文→Mathpix识别→翻译(腾讯百度deepL)→中文PDF☆63Updated 10 months ago
- 根据模板和数据批量生成文档,这就是你想要的文档。Producing documents with given template and data. This is The Very Document yoU Want (TTVDUW)☆21Updated last year
- Neo4j graph construction from unstructured data☆321Updated last year
- marp主题,目前有公司浅蓝主题、浙大蓝学术主题☆77Updated 2 years ago
- 数据科学教程、大模型实践案例☆147Updated 7 months ago
- 通过paddle ocr实现pdf转markdown☆79Updated last year
- A Multi-Modal Dataset of Chinese Governmental Docunments☆39Updated 5 years ago
- ☆60Updated 10 months ago
- MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。☆299Updated last year
- 🚀 KIMI AI 长文本大模型白嫖服务,支持高速流式输出、联网搜索、长文档解读、图像解析、多轮对话,零配置部署,多路token支持,自动清理会话痕迹。☆53Updated last year
- 利用python脚本实现微信、支付宝账单的合并,并保存到excel文件实现自动记账,可查看可视化图表。☆12Updated 4 years ago