hbh112233abc / pdfplumberLinks
Plumb a PDF for detailed information about each char, rectangle, line, et cetera — and easily extract text and tables.
☆57Updated last year
Alternatives and similar repositories for pdfplumber
Users that are interested in pdfplumber are comparing it to the libraries listed below
Sorting:
- 360LayoutAnaylsis, a series Document Analysis Models and Datasets deleveped by 360 AI Research Institute☆299Updated last year
- clueai工具包: 3行代码3分钟,自定义需要的API!☆231Updated 2 years ago
- SMP 2023 ChatGLM金融大模型挑战赛 60 分baseline思路介绍☆186Updated 2 years ago
- "桃李“: 国际中文教育大模型☆183Updated last year
- 雅意信息抽取大模型:在百万级人工构造的高质量信息抽取数据上进行指令微调,由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)☆311Updated last year
- 语言模型中文认知能力分析☆237Updated 2 years ago
- PDF解析(文字,章节,表格,图片,参考),基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答,摘要,信息抽取☆206Updated last year
- TechGPT: Technology-Oriented Generative Pretrained Transformer☆226Updated 2 years ago
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆208Updated last year
- change pdf to txt☆68Updated 2 years ago
- basic framework for rag(retrieval augment generation)☆85Updated last year
- unified embedding model☆869Updated 2 years ago
- 夫子•明察司法大模型是由山东大学、浪潮云、中国政法大学联合研发,以 ChatGLM 为大模型底座,基于海量中文无监督司法语料与有监督司法微调数据训练的中文司法大模型。该模型支持法条检索、案例分析、三段论推理判决以及司法对话等功能,旨在为用户提供全方位、高精准的法律咨询与解答…☆356Updated last month
- 本项目旨在收集开源的表格智能任务数据集(比如表格问答、表格-文本生成等),将原始数据整理为指令微调格式的数据并微调LLM,进而增强LLM对于表格数据的理解,最终构建出专门面向表格智能任务的大型语言模型。☆616Updated last year
- 基于sentence transformers和chatglm实现的文档搜索工具☆157Updated 2 years ago
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆641Updated 2 years ago
- 活字通用大模型☆392Updated last year
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆129Updated 2 years ago
- ☆194Updated 7 months ago
- ChatGLM2-6B 全参数微调,支持多轮对话的高效微调。☆400Updated 2 years ago
- ☆353Updated last year
- QA based on local knowledge and LLM.☆237Updated 8 months ago
- PromptCLUE, 全中文任务支持零样本学习模型☆664Updated 2 years ago
- 国内首个全参数训练的法律大模型 HanFei-1.0 (韩非)☆124Updated last year
- ☆67Updated last year
- chatglm多gpu用deepspeed和☆412Updated last year
- Humanable Chat Generative-model Fine-tuning | LLM微调☆207Updated 2 years ago
- kbqa,langchain,large langauge model, chatgpt☆81Updated 11 months ago
- 本项目是针对RAG中的Retrieve阶段的召回技术及算法效果所做评估实验。使用主体框架为LlamaIndex.☆276Updated last month
- Alpaca Chinese Dataset -- 中文指令微调数据集☆214Updated 11 months ago