murufeng / ChineseNlpCorpus
搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。
☆67Updated 5 years ago
Alternatives and similar repositories for ChineseNlpCorpus:
Users that are interested in ChineseNlpCorpus are comparing it to the libraries listed below
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆172Updated 6 years ago
- 中文NLP数据集☆153Updated 5 years ago
- 使用bert做领域分类、意图识别和槽位填充任务☆75Updated 4 years ago
- ☆347Updated 4 years ago
- 基于检索的任务型多轮对话☆77Updated 4 years ago
- A trial of kbqa based on bert for NLPCC2016/2017 Task 5 (基于BERT的中文知识库问答实践,代码可跑通)☆269Updated 5 years ago
- 端到端的长本文摘要模型(法研杯2020司法摘要赛道)☆393Updated 9 months ago
- Some Cool NLP and CV Repositories and Solutions (收集NLP中常见任务的开源解决方案、数据集、工具、学习资料等)☆158Updated 4 years ago
- Bert预训练 模型fine-tune计算文本相似度☆101Updated last year
- 搜集、整理、发布 中文 自然语言处理 语料/数据集,与 有志之士 共同 促进 中文 自然语言处理 的 发展。☆95Updated 6 years ago
- 中文自然语言的实体抽取和意图识别(Natural Language Understanding),可选Bi-LSTM + CRF 或者 IDCNN + CRF☆183Updated 6 years ago
- pytorch中文语言模型预训练☆390Updated 4 years ago
- NER(命名实体识别)中文语料,一站式获取☆128Updated 5 years ago
- SimCSE在中文上的复现,有监督+无监督☆274Updated last month
- 本人项目进行中搜集的数据集,包含原始数据和经过处理后的数据,项目持续更新。☆111Updated 4 years ago
- Modify Chinese text, modified on LaserTagger Model. 文本复述,基于lasertagger做中文文本数据增强。☆318Updated last year
- 天池大赛疫情文本挑战赛线 上第三名方案分享☆229Updated 4 years ago
- ☆136Updated 3 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆130Updated 3 years ago
- SimBERT升级版(SimBERTv2)!☆441Updated 3 years ago
- 中国法研杯CAIL2019要素抽取任务第三名方案分享☆139Updated 4 years ago
- 基于ltp的简单评论观点抽取模块☆116Updated 6 years ago
- Chinese Embedding collection incling token ,postag ,pinyin,dependency,word embedding.中文自然语言处理向量合集,包括字向量,拼音向量,词向量,词性向量,依存关系向量.共5种类型的向量☆453Updated 6 years ago
- NLP句子编码、句子embedding、语义相似度:BERT_avg、BERT_whitening、SBERT、SmiCSE☆176Updated 3 years ago
- some baselines for lic2020 (http://lic2020.cipsc.org.cn/)☆218Updated 4 years ago
- 中国中文信息学会社会媒体处理专业委员会举办的2019届中文人机对话之自然语言理解竞赛☆74Updated 4 years ago
- ☆76Updated 4 years ago
- 基于词汇信息融合的中文NER模型☆165Updated 2 years ago
- 基于Pytorch的文本分类框架,支持TextCNN、Bert、Electra等。☆61Updated 2 years ago
- Law Crime Mining Based on Corpus build and content analysis by NLP methods. 基于领域语料库构建与NLP方法的裁判文书与犯罪案例文本挖掘项目☆330Updated 6 years ago