BenDerPan / toutiao-text-classfication-datasetLinks
今日头条中文新闻(文本)分类数据集
☆70Updated 7 years ago
Alternatives and similar repositories for toutiao-text-classfication-dataset
Users that are interested in toutiao-text-classfication-dataset are comparing it to the libraries listed below
Sorting:
- 中文文本聚类☆123Updated 3 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。基于Transformer2.0库中的中文Bert模型,对新闻语料进行三分类。☆117Updated 6 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆201Updated 6 years ago
- 自然语言处理NLP在中文文本上的一些应用,如文本分类、情感分析、命名实体 识别等☆213Updated 4 years ago
- 文本聚类(Kmeans、DBSCAN、LDA、Single-pass)☆354Updated 4 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆196Updated last year
- 毕业设计,基于事理图谱的事件推理系统☆72Updated 5 years ago
- 基于scikit-learn实现对新浪新闻的文本分类,数据集为100w篇文档,总计10类,测试集与训练集1:1划分。分类算法采用SVM和Bayes,其中Bayes作为baseline。☆110Updated 7 years ago
- 练手项目:Comment of Interest 电商文本评论数据挖掘 (爬虫 + 观点抽取 + 句子级和观点级情感分析)☆104Updated 5 years ago
- 利用bert预训练的中文模型进行文本分类 数据集中文情感分析语料chnsenticorp☆360Updated 6 years ago
- 中文商品评论短文本分类器,可用于情感分析☆368Updated 4 years ago
- 基于word2vec预训练词向量; textCNN 模型 ;charCNN 模型 ;Bi-LSTM模型;Bi-LSTM + Attention 模型 ;Transformer 模型 ;ELMo 预训练模型 ;BERT 预训练模型的文本分类项目☆124Updated 5 years ago
- 自然语言处理中的基础任务,包含但不限于文本表示,文本分类,命名实体识别,关系抽取,文本生成,文本摘要等,基于tensorflow2或Pytorch,所有代码均经过测试,项目中也包含相关数据。☆151Updated 3 years ago
- 中文微博语料库 情感二分类☆279Updated 5 years ago
- NLP 相关的项目 如:词向量,文本分类,文本匹配,NER,信息抽取,文本生成以及NLP在电商中的应用☆38Updated 7 months ago
- 基于CNN、RNN、GCN、BERT的中文文本分类☆44Updated 2 years ago
- 一个BERT+BiLSTM的情感分析 BaseLine☆25Updated 5 years ago
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆183Updated 7 years ago
- 用MLP、TextCNN、RNN、LSTM、GRU、Attention、RCNN、BERT做文本分类、情感分析,对比各模型于温泉旅游评论垂类语料下在情感分类任务上的表现☆100Updated 4 years ago
- 零基础入门NLP - 新闻文本分类 正式赛第一名方案☆235Updated 5 years ago
- 基于预训练模型(BERT,BERT-wwm)的文本分类模板,CCF BDCI新闻情感分析A榜4/2735。☆268Updated 5 years ago
- 利用bert预训练模型生成句向量或词向量☆27Updated 5 years ago
- multi-label-classification-4-event-type☆138Updated 2 years ago
- 使用pytorch搭建textCNN实现中文文本分类☆131Updated 6 years ago
- 基于word2vec使用wiki中文语料库实现词向量训练模型☆59Updated 6 years ago
- 本项目用于展示三元组抽取后形成的知识图谱,包括几本小说的实体关系,以及README.md,介绍这方面的一篇文章。☆202Updated 5 years ago
- 基于Transformer的生成式文本摘要☆187Updated 3 years ago
- Tensorflow2.3的文本分类项目,支持各种分类模型 ,支持相关tricks。☆178Updated last year
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 3 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆44Updated 6 years ago