WangLaoShi / NLP-Resources-MaterialForChinese
中文 NLP 资源库,语料库,相关的框架,文章收集。
☆22Updated 2 years ago
Related projects ⓘ
Alternatives and complementary repositories for NLP-Resources-MaterialForChinese
- 仇恨言论语料库☆14Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆44Updated last year
- 爬取各种数据的爬虫的样例(百度百科、知乎、微博、简书、搜狗词库),可用于自然语言处理语料收集☆11Updated 4 years ago
- 中文、分词、词表、核心词典、事件词表、停用词、敏感词、问答、问答数据、知识图谱、文本语料。☆147Updated 3 years ago
- SikuBERT:四库全书的预训练语言模型(四库BERT) Pre-training Model of Siku Quanshu☆115Updated last year
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆29Updated 2 years ago
- CINO: Pre-trained Language Models for Chinese Minority (少数民族语言预训练模型)☆215Updated last year
- 爬取自互联网的古诗词语料库,包含先秦至当代诗词,共计1014508首诗☆26Updated 2 years ago
- mirror of dongxiexidian/Chinese☆285Updated 5 years ago
- A Chinese medical question answering dataset☆60Updated 4 years ago
- Mimix: A Text Generation Tool and Pretrained Chinese Models☆152Updated 3 weeks ago
- 自然语言处理NLP(自然语言生成NLG、自然语言理解NLU)、自然语言学术会议大盘点、自然语言大佬介绍、NLP研究机构、NLP资料分享、NLP学习资源分享、NLP学术论文介绍☆176Updated 6 months ago
- This is updated version of the dataset for Chinese community medical question answering.☆308Updated 5 years ago
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆108Updated 4 years ago
- 基于GPT2的中文摘要生成模型☆413Updated last year
- OpenTextClassification is all you need for text classification! Open text classification for everyone, enjoy your NLP journey! 这可能是目前为止最全…☆193Updated 6 months ago
- 术语词典数据集/分词词典/专业词表语料库/词汇知识库/领域词表下载/主题词表/词库/自然语言处理/数据挖掘/深度学习☆22Updated 3 years ago
- 根据维基中文语料库预训练 GloVe 中文词向量;Pre-train GloVe word-embedding From Chinese Wiki corpus☆67Updated last year
- A collection of papers, codes, projects, tutorials ... for Knowledge Graph and other NLP methods☆72Updated last month
- 端到端的长本文摘要模型(法研杯2020司法摘要赛道)☆387Updated 5 months ago
- Some Cool NLP and CV Repositories and Solutions (收集NLP中常见任务的开源解决方案、数据集、工具、学习资料等)☆155Updated 3 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆113Updated 9 months ago
- 中文语料库:包括情感词典 情感分析 文本分类 单轮对话 中文词典 知乎☆116Updated 6 years ago
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆166Updated 5 years ago
- 律知, 法律咨询大模型☆34Updated last year
- [COLING 2022] CSL: A Large-scale Chinese Scientific Literature Dataset 中文科学文献数据集☆569Updated last year
- Unilm for Chinese Chitchat Robot.基于Unilm模型的夸夸式闲聊机器人项目。☆157Updated 3 years ago
- 收集的各类字典,欢迎大家提交。(专业、中草药、中药、交通、停用词、动物、健康、国家、地名、学校、植物、汽车品牌)☆70Updated 4 years ago
- Modify Chinese text, modified on LaserTagger Model. 文本复述,基于lasertagger做中文文本数据增强。☆318Updated 10 months ago