xuzf-git / WordSegment-and-PosTagLinks
基于Hmm模型和Viterbi算法实现中文分词及词性标注,使用最大概率算法进行优化。人民日报语料:分词(F1:96.189%);词性标注(F1:97.934%)
☆26Updated 2 years ago
Alternatives and similar repositories for WordSegment-and-PosTag
Users that are interested in WordSegment-and-PosTag are comparing it to the libraries listed below
Sorting:
- A PyTorch implementation of a BiLSTM \ BERT \ Roberta (+ BiLSTM + CRF) model for Chinese Word Segmentation (中文分词) .☆210Updated 3 years ago
- 基于pytorch + bert的多标签文本分类(multi label text classification)☆108Updated 2 years ago
- 中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法☆192Updated 4 years ago
- All NLP you Need Here. 目前包含15个NLP demo的pytorch实现(大量代码借鉴于其他开源项目,原先是自己玩的,后来干脆也开源出来)☆288Updated this week
- NLP常见任务实现(pytorch版)☆128Updated 5 years ago
- Chinese-Text-Classification Project including bert-classification, textCNN and so on.☆161Updated 3 years ago
- NLP实战项目☆102Updated 2 years ago
- 零基础入门NLP - 新闻文本分类 正式赛第一名方案☆235Updated 4 years ago
- 自然语言处理NLP(自然语言生成NLG、自然语言理解NLU)、自然语言学术会议大盘点、自然语言大佬介绍、NLP研究机构、NLP资料分 享、NLP学习资源分享、NLP学术论文介绍☆185Updated 5 months ago
- NLP文本增强的两种方式:同义词替换(利用word2vec词表)和回译☆77Updated 4 years ago
- 基于pytorch+bert的中文文本分类☆88Updated 2 years ago
- SimCSE中文语义相似度对比学习模型☆88Updated 3 years ago
- smp ewect code☆77Updated 4 years ago
- 基于GOOGLE T5中文生成式模型的摘要生成/指代消解,支持batch批量生成,多进程☆227Updated last year
- 基于Pytorch+BERT+CRF的NLP序列标注模型,目前包括分词,词性标注,命名实体识别等☆62Updated 2 years ago
- CWS中文分词 HMM BiLSTM+CRF pytorch 细致实现☆48Updated 4 years ago
- 基于BERT的中文命名实体识别☆44Updated 3 years ago
- ☆19Updated 5 years ago
- 基于Pytorch的文本分类框架,支持TextCNN、Bert、Electra等。☆63Updated 2 years ago
- SimCSE在中文上的复现,有监督+无监督☆278Updated 6 months ago
- 自然语言处理中的基础任务,包含但不限于文本表示,文本分类,命名实体识别,关系抽取,文本生成,文本摘要等,基于tensorflow2或Pytorch,所有代码均经过测试,项目中也包含相关数据。☆150Updated 2 years ago
- 基于pytorch_bert的中文多标签分类☆91Updated 3 years ago
- 文本相似度,语义向量,文本向量,text-similarity,similarity, sentence-similarity,BERT,SimCSE,BERT-Whitening,Sentence-BERT, PromCSE, SBERT☆74Updated 9 months ago
- 基于scrapy的层次优先队列方法爬取中文维基百科,并自动抽取结构和半结构数据☆156Updated 2 years ago
- 基于Pytorch的Bert应用,包括命名实体识别、情感分析、文本分类以及文本相似度等☆801Updated 4 years ago
- NLP 领域常见任务的实现,包括新词发现、以及基于pytorch的词向量、中文文本分类、实体识别、摘要文本生成、句子相似度判断、三元组抽取、预训练模型等。☆533Updated 2 years ago
- 基于PyTorch的BERT中文文本分类模型(BERT Chinese text classification model implemented by PyTorch)☆193Updated last year
- Using Bert/Roberta + LSTM/GRU/BiLSTM/TextCNN to do the sentiment analysis on the imdb datasets.☆144Updated 2 years ago
- 超长文本分类(大于1000字);文档级/篇章级文本分类;主要是解决长距离依赖问题☆132Updated 3 years ago
- THUCNews中文文本分类数据集,该数据集包含84万篇新闻文档,总计14类;在该模型的基础上测试多个版本bert分类效果。☆65Updated 4 years ago