RuilinXu / GovDoc-CNLinks
A Multi-Modal Dataset of Chinese Governmental Docunments
☆35Updated 4 years ago
Alternatives and similar repositories for GovDoc-CN
Users that are interested in GovDoc-CN are comparing it to the libraries listed below
Sorting:
- 国内首个全参数训练的法律大模型 HanFei-1.0 (韩非)☆124Updated last year
- 中文原生检索增强生成测评基准☆122Updated last year
- "桃李“: 国际中文教育大模型☆183Updated last year
- LLM for NER☆82Updated last year
- 基于qlora对baichuan-7B大模型进行指令微调。☆23Updated 2 years ago
- 基于Qwen2模型进行通用信息抽取【实体/关系/事件抽取】☆35Updated last year
- SearchGPT: Building a quick conversation-based search engine with LLMs.☆47Updated 8 months ago
- 大模型预训练中文语料清洗及质量评估 Large model pre-training corpus cleaning☆69Updated last year
- 中文纠错☆93Updated 3 years ago
- llama信息抽取实战☆100Updated 2 years ago
- pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicRank、TextRank等算法,开箱即用。☆208Updated last year
- 骆驼QA,中文大语言阅读理解模型。☆75Updated 2 years ago
- 通用版面分析 | 中文文档解析 |Document Layout Analysis | layout paser☆47Updated last year
- deep training task☆30Updated 2 years ago
- 基于sentence transformers和chatglm实现的文档搜索工具☆157Updated 2 years ago
- PDF解析(文字,章节,表格,图片,参考),基于大模型(ChatGLM2-6B, RWKV)+langchain+streamlit的PDF问答,摘要,信息抽取☆206Updated last year
- ChatGLM2-6B微调, SFT/LoRA, instruction finetune☆109Updated 2 years ago
- Legal-Eagle-InternLM 是一个基于商汤科技和上海人工智能实验室推出的书生浦语大模型InternLM的法律问答机器人。旨在为用户提供符合3H(即Helpful 、Honest、Harmless)原则的专业、智能、全面的法律服务的法律领域大模型。☆60Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆53Updated 6 months ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆115Updated last year
- ☆67Updated 11 months ago
- 雅意信息抽取大模型:在百万级人工构造的高质量信息抽取数据上进行指令微调,由中科闻歌算法团队研发。 (Repo for YAYI Unified Information Extraction Model)☆309Updated last year
- 利用LLM+敏感词库,来自动判别是否涉及敏感词。☆127Updated 2 years ago
- ☆23Updated 2 years ago
- TianGong-AI-Unstructure☆69Updated 2 months ago
- 使用qlora对中文大语言模型进行微调,包含ChatGLM、Chinese-LLaMA-Alpaca、BELLE☆90Updated 2 years ago
- ☆61Updated 6 months ago
- TechGPT: Technology-Oriented Generative Pretrained Transformer☆226Updated 2 years ago
- 中文世界的NLP自动标注开源工具,简单样本,交给LabelFast。☆76Updated 8 months ago
- 大语言模型训练和服务调研☆36Updated 2 years ago