Shangliyuan / PDFInsight
PDF识别助手(PDFInsight)是一个高效的Python工具,用于从在线PDF文档中提取文本内容。无论是文字型PDF还是以图片形式嵌入的PDF,PDFInsight都能轻松应对,有效地从中提取出文本信息。🚀
☆26Updated last year
Alternatives and similar repositories for PDFInsight:
Users that are interested in PDFInsight are comparing it to the libraries listed below
- 基于人工智能 把 pdf 转 txt(pdf 文字识别)☆13Updated 2 years ago
- PDF 批量翻译,翻译后的PDF格式基本不变。导出PDF和Docx。优化并精简了来自于QPromise 的 EasyTrans。优化了通过百度翻译API稳定进行长翻译!☆140Updated last year
- 📚中国近代革命历史知识图谱系统 🌈提供了知识图谱可视化、知识检索、关系检索、时空检索、时空演化、语料检索、知识抽取、知识问答等丰富而有效的中国近代革命历史知识服务。☆65Updated last year
- 视频转图文并茂的pdf—videotopdf: 打工人(会议记录)和学生党(网课笔记)等必备!使用地址:https://zjrwtxtechstudio-video-to-pdf.hf.space☆38Updated 5 months ago
- 文本自动摘要☆94Updated 2 years ago
- 知网论文数据爬虫☆54Updated last year
- 一个批量转换caj到pdf的脚本☆18Updated 3 years ago
- 基于知识图谱的问答系统设计与实现,附带一个可视化的demo☆123Updated last year
- 汽车知识图谱☆78Updated 4 years ago
- 基于医疗领域知识图谱的问答系统,同时使用了chatGPT、chatGLM4等方式生成医学知识图谱。☆50Updated last year
- 知识图谱可视化javascript库,基于d3.js,面向网页前端知识图谱展示☆155Updated 3 years ago
- 赛博医生项目——”赛博华佗“,基于多模态大模型的多功能智能体,一键搭建本地多模态大模型。接入医疗健康相关的知识图谱和知识库后可以进行疾病初诊,病历分析,专业知识问答等功能,成为你的私人医生。赛博华佗项目能帮助实现医疗资源的跨地域传播,让更多人借助大模型改善健康水平。"Cyb…☆120Updated 2 months ago
- ☆81Updated last year
- 使用Pytorch框架对NLP方向上的文本分类、实体识别、三元组抽取做代码实战☆179Updated last year
- 基于中医药知识图谱智能问答☆168Updated 4 years ago
- PDF解析(文字,章节,表格,图片,参考),基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答,摘要,信息抽取☆197Updated last year
- 基于Flask框架进行前后端交互、存储采用Neo4j图 数据库。功能包括金融股票、股东、概念详细信息查询,以及多轮对话问答机制。☆44Updated 2 years ago
- MinerU是一款开源的高质量PDF解析工具,基于深度学习技术,可自动提取PDF文档中的文字、表格、图片、公式等内容,并提供丰富的分析、统计、搜索等功能。 本项目为其提供一个简化版本的WebUI,方便用户上传PDF文件,并实时展示提取结果。☆191Updated 5 months ago
- ☆47Updated 2 years ago
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆50Updated 2 months ago
- 基于深度学习与Neo4j的军事装备知识图谱网页应用构建。本项目是一个军事武器知识图谱网页应用软件原型系统。该系统由数据爬虫、数据管理、数据处理、知识问答、新闻热点、词条查询和图谱展示七个功能模块组成。系统从互联网上爬取数据,并基于百度文心ERNIE 3.0模型对数据进行实体…☆123Updated last year
- 知网爬虫,专利、论文项目。仅供学习交流,严禁盈利☆47Updated 2 years ago
- ChatGPT WebUI using gradio. 给 LLM 对话和检索知识问答RAG提供一个简单好用的Web UI界面☆129Updated 8 months ago
- 税收政策服务--政策爬虫,从国税总局,及其他税务相关机构的网站,爬取税收政策、解读、条约等信息,以备后续处理☆24Updated 5 years ago
- 基于Fasttext的中文医疗问答系统☆40Updated last year
- 中国常用法律查询手册 | Law-Book☆48Updated 2 years ago
- 知网爬虫,作者、摘要、题目、发表期刊等主要内容的获取☆24Updated 2 months ago
- NoSQL可视化人脉图谱项目:非关系型数据库作为更符合人脑记忆的数据展现形式,在未来理论会成为应用界的主流,希望该项目能够成为推动HelpDesk、数据可视化、数据看板等IT基础能力持续降低上手门槛的起点。☆45Updated 3 years ago
- 基于scrapy的层次优先队列方法爬取中文维基百科,并自动抽取结构和半结构数据☆150Updated 2 years ago
- 降AIGC率,降低知网、维普、格子达平台的AIGC检测率,降知网AI,降维普AI,降格子达AI。☆32Updated last month