BenDerPan / toutiao-text-classfication-datasetLinks
今日头条中文新闻(文本)分类数据集
☆69Updated 7 years ago
Alternatives and similar repositories for toutiao-text-classfication-dataset
Users that are interested in toutiao-text-classfication-dataset are comparing it to the libraries listed below
Sorting:
- 自然语言处理NLP在中文文本上的一些应用,如文本分类、情感分析、命名实体识别等☆214Updated 4 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆201Updated 6 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。基于Transformer2.0库中的中文Bert模型,对新闻语料进行三分类。☆115Updated 5 years ago
- 中文文本聚类☆123Updated 3 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆197Updated last year
- 基于word2vec预训练词向量; textCNN 模型 ;charCNN 模型 ;Bi-LSTM模型;Bi-LSTM + Attention 模型 ;Transformer 模型 ;ELMo 预训练模型 ;BERT 预训练模型的文本分类项目☆124Updated 5 years ago
- 文本聚类(Kmeans、DBSCAN、LDA、Single-pass)☆348Updated 4 years ago
- 自然语言处理中的基础任务,包含但不限于文本表示,文本分类,命名实体识别,关系抽取,文本生成,文本摘要等,基于tensorflow2或Pytorch,所有代码均经过测试,项目中也包含相关数据。☆151Updated 2 years ago
- 零基础入门NLP - 新闻文本分类 正式赛第一名方案☆236Updated 5 years ago
- 本实验,是用BERT进行中文情感分类,记录了详细操作及完整程序☆376Updated 6 years ago
- 利用bert预训练的中文模型进行文本分类 数据集中文情感分析语料chnsenticorp☆350Updated 6 years ago
- 基于预训练模型(BERT,BERT-wwm)的文本分类模板,CCF BDCI新闻情感分析A榜4/2735。☆271Updated 5 years ago
- 使用pytorch搭建textCNN实现中文文本分类☆132Updated 6 years ago
- multi-label-classification-4-event-type☆138Updated 2 years ago
- 基于word2vec使用wiki中文语 料库实现词向量训练模型☆59Updated 6 years ago
- 中文商品评论短文本分类器,可用于情感分析☆366Updated 3 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆44Updated 6 years ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆61Updated 4 years ago
- 豆瓣书籍,电影类别的知识图谱问答系统☆266Updated 4 years ago
- 多标签文本分类☆53Updated 6 years ago
- 嵌入Word2vec词向量的RNN+ATTENTION中文文本分类☆152Updated 5 years ago
- 中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法☆192Updated 4 years ago
- 基于Transformer的生成式文本摘要☆186Updated 3 years ago
- 基于scikit-learn实现对新浪新闻的文本分类,数据集为100w篇文档,总计10类,测试集与训练集1:1划分。分类算法采用SVM和Bayes,其中Bayes作为baseline。☆108Updated 6 years ago
- 毕业设计,基于事理图谱的事件推理系统☆71Updated 5 years ago
- Tensorflow2.3的文本分类项目,支持各种分类模型,支持相关tricks。☆178Updated 10 months ago
- 新闻文本自动摘要, 以Textrank 为基础,融入 标题特征,单句位置特征,重要实体特征,线索词特征,做句子的综合权重计算,并使用MMR算法,兼顾自动摘要的主题相关性和摘要多样性。☆26Updated 3 years ago
- 练手项目:Comment of Interest 电商文本评论数据挖掘 (爬虫 + 观点抽取 + 句子级和观点级情感分析)☆104Updated 4 years ago
- TextClf :基于Pytorch/Sklearn的文本分类框架,包括逻辑回归、SVM、TextCNN、TextRNN、TextRCNN、DRNN、DPCNN、Bert等多种模型,通过简单配置即可完成数据处理、模型训练、测试等过程。☆244Updated 2 years ago
- 文本二分类任务,是否文档是否属于政治上的出访类事件,利用BERT提取特征,模型采用简单的DNN。☆61Updated 5 years ago