moronism189 / chinese-nlp-stepbystep
从jieba分词到BERT-wwm,一步步带你进入中文NLP的世界
☆13Updated 2 years ago
Related projects ⓘ
Alternatives and complementary repositories for chinese-nlp-stepbystep
- 各大文本摘要模型-中文文本可运行 的解决方案☆63Updated last year
- 中国知网论文数据集,24000+篇论文信息。自然语言处理、信息管理、文本分类、文本摘要、关键词抽取、研究热点分析、数据挖掘、数据分析☆44Updated last year
- Sentence-Transformers Information Retrieval example on Chinese☆29Updated 8 months ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆68Updated 6 months ago
- deep training task☆29Updated last year
- 基于PaddleNLP开源的抽取式UIE进行医学命名实体识别(torch实现)☆42Updated 2 years ago
- 基于pytorch的百度UIE命名实体识别。☆53Updated last year
- 一个基于预训练的句向量生成工具☆132Updated last year
- experiments of some semantic matching models and comparison of experimental results.☆159Updated last year
- 使用sentence-transformers(SBert)训练自己的文本相似度数据集并进行评估。☆45Updated 3 years ago
- 基于向量召回的检索式对话系统解决方案,dense retrieval,FAQ……☆32Updated 3 years ago
- ChineseTextualInference project including chinese corpus build and inferecence model, 中文文本推断项目,包括88万文本蕴含中文文本蕴含数据集的翻译与构建,基于深度学习的文本蕴含判定模型构建…☆165Updated 5 years ago
- 基于深度学习的FAQ式问答系统☆34Updated 3 years ago
- 基于T5模型的中文文本纠错☆25Updated last week
- This is some summary code and model☆39Updated 2 years ago
- 基于Pytorch的知识蒸馏(中文文本分类)☆16Updated last year
- ChatGLM2-6B微调, SFT/LoRA, instruction finetune☆106Updated last year
- A Python toolkit for file processing, text cleaning and data splitting. 文件处理,文本清洗和数据划分的python工具包。☆29Updated 2 years ago
- 专业领域词库构建/中文新词发现/专业词库发现☆28Updated 4 years ago
- 收集经常用到的一些python代码☆44Updated last month
- 微调预训练语言模型(BERT、Roberta、XLBert等),用于计算两个文本之间的相似度(通过句子对分类任务转换),适用于中文文本☆90Updated 4 years ago
- 文本自动摘要☆89Updated last year
- ☆23Updated last year
- Topic Extraction baseline for Dialogue Text Analysis Task of nlpcc 2022☆13Updated 2 years ago
- 使用Mask LM预训练任务来预训练Bert模型。训练垂直领域语料的模型表征,提升下游任务的表现。☆41Updated last year
- 千问14B和7B的逐行解释☆51Updated last year
- 天池比赛作品整理。实现从pdf中提取出姓名、出生年月、性别、电话、最高学历、籍贯、落户市县、政治面貌、毕业院校、工作单位、工作内容、职务、项目名称、项目责任、学位、毕业时间、工作时间、项目时间共18个字段。☆109Updated 3 months ago
- 去除weiboNER_2nd_conll数据集的分词信息,只保留实体信息,制作成conll格式☆8Updated 2 years ago
- 🌈 NERpy: Implementation of Named Entity Recognition using Python. 命名实体识别工具,支持BertSoftmax、BertSpan等模型,开箱即用。☆112Updated 8 months ago