BenDerPan / toutiao-text-classfication-dataset
今日头条中文新闻(文本)分类数据集
☆63Updated 6 years ago
Alternatives and similar repositories for toutiao-text-classfication-dataset:
Users that are interested in toutiao-text-classfication-dataset are comparing it to the libraries listed below
- THUCNews中文文本分类数据集,该数据集包含84万篇新闻文档,总计14类;在该模型的基础上测试多个版本bert分类效果。☆58Updated 4 years ago
- 基于word2vec预训练词向量; textCNN 模型 ;charCNN 模型 ;Bi-LSTM模型;Bi-LSTM + Attention 模型 ;Transformer 模型 ;ELMo 预训练模型 ;BERT 预训练模型的文本分类项目☆116Updated 4 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。基于Transformer2.0库中的中文Bert模型,对新闻语料进行三分类。☆106Updated 5 years ago
- 自然语言处理NLP在中文文本上的一些应用,如文本分类、情感分析、命名实体识别等☆209Updated 3 years ago
- 基于CNN、RNN、GCN、BERT的中文文本分类☆43Updated last year
- 中文文本聚类☆122Updated 2 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆195Updated 5 years ago
- 基于word2vec使用wiki中文语料库实现词向量训练模型☆58Updated 5 years ago
- 毕业设计,基于事理图谱的事件推理系统☆67Updated 4 years ago
- TF-IDF+Word2vec做文本相似度计算,最好是长文本☆24Updated 5 years ago
- 基于LSTM网络与自注意力机制对中文评论进行细粒度情感分析☆55Updated 3 years ago
- 利用bert预训练模型生成句向量或词向量☆28Updated 4 years ago
- 文本热点挖掘,基于DBSCAN聚类模型,对文本的热点事件进行挖掘☆40Updated 4 years ago
- multi-label-classification-4-event-type☆132Updated last year
- 多标签文本分类☆53Updated 5 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆45Updated 5 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆194Updated 6 months ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆59Updated 4 years ago
- 一个BERT+BiLSTM的情感分析 BaseLine☆25Updated 4 years ago
- 本项目主要是利用LSTM来对中文文本进行情感分类,包含四个类别(愤怒,焦虑,抑郁,伤感)☆54Updated 5 years ago
- CNN 实现文本分类☆180Updated 2 years ago
- 用gensim训练LDA模型,进行新闻文本主题分析☆76Updated 5 years ago
- 本项目采用Keras和Keras-bert实现文本多标签分类任务,对BERT进行微调。☆66Updated 3 years ago
- NLP 相关的项目 如:词向量,文本分类,文本匹配,NER,信息抽取,文本生成以及NLP在电商中的应用☆33Updated last year
- 使用pytorch搭建textCNN实现中文文本分类☆127Updated 5 years ago
- 一个基本的多层lstm rnn模型,能实现中英文文本的二分类或多分类☆46Updated 6 years ago
- 基于预训练模型(BERT,BERT-wwm)的文本分类模板,CCF BDCI新闻情感分析A榜4/2735。☆261Updated 4 years ago
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体 特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆25Updated 2 years ago
- 基于Pytorch实现的一些经典自然语言处理模型中文短文本分类任务,包含TextCNN,TextRCNN,FastText,BERT,ROBERT以及ERNIE☆52Updated 4 years ago
- 基于TF-IDF和余弦定理计算文本相似度☆36Updated 6 years ago