BenDerPan / toutiao-text-classfication-datasetLinks
今日头条中文新闻(文本)分类数据集
☆70Updated 7 years ago
Alternatives and similar repositories for toutiao-text-classfication-dataset
Users that are interested in toutiao-text-classfication-dataset are comparing it to the libraries listed below
Sorting:
- 中文文本聚类☆122Updated 3 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。基于Transformer2.0库中的中文Bert模型,对新闻语料进行三分类。☆116Updated 6 years ago
- 文本聚类(Kmeans、DBSCAN、LDA、Single-pass)☆350Updated 4 years ago
- 自然语言处理NLP在中文文本上的一些应用,如文本分类、情感分析、命名实体识别等☆213Updated 4 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆197Updated last year
- 基于scikit-learn实现对新浪新闻的文本分类,数据集为100w篇文档,总计10类,测试集与训练集1:1划分。分类算法采用SVM和Bayes,其中Bayes作为baseline。☆109Updated 6 years ago
- 中文文本分类实践,基于搜狗新闻语料库,采用传统机器学习方法以及预训练模型等方法