qyfang / TextClassificationLinks
基于scikit-learn实现对新浪新闻的文本分类,数据集为100w篇文档,总计10类,测试集与训练集1:1划分。分类算法采用SVM和Bayes,其中Bayes作为baseline。
☆110Updated 7 years ago
Alternatives and similar repositories for TextClassification
Users that are interested in TextClassification are comparing it to the libraries listed below
Sorting:
- 自然语言处理NLP在中文文本上的一些应用,如文本分类、情感分析、命名实体识别等☆211Updated 4 years ago
- 本实验,是用BERT进行中文情感分类,记录了详细操作及完整程序☆374Updated 6 years ago
- 中文文本聚类☆123Updated 3 years ago
- 基于word2vec预训练词向量; textCNN 模型 ;charCNN 模型 ;Bi-LSTM模型;Bi-LSTM + Attention 模型 ;Transformer 模型 ;ELMo 预训练模型 ;BERT 预训练模型的文本分类项目☆123Updated 5 years ago
- TextCNN Pytorch实现 中文文本分类 情感分析☆636Updated 7 years ago
- 中文文本预处理,Word2Vec训练计算文本相似度。☆44Updated 6 years ago
- 基于word2vec使用wiki中文语料库实现词向量训练模型☆59Updated 6 years ago
- 利用bert预训练的中文模型进行文本分类 数据集中文情感分析语料chnsenticorp☆361Updated 6 years ago
- 基于预训练模型(BERT,BERT-wwm)的文本分类模板,CCF BDCI新闻情感分析A榜4/2735。☆268Updated 5 years ago
- 文本聚类(Kmeans、DBSCAN、LDA、Single-pass)☆353Updated 4 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。基于Transformer2.0库中的中文Bert模型,对新闻语料进行三分类。☆118Updated 6 years ago
- 嵌入Word2vec词向量的CNN中文文本分类☆451Updated 5 years ago
- 毕业论文代码 + 评论文本数据获取+数据清洗+文本数据向量化+将数据放进分类器(KNN+Naive Bayes+SVM)中训练+结果评估☆52Updated 3 years ago
- 中文商品评论短文本分类器,可用于情感分析☆368Updated 4 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆201Updated 6 years ago
- 使用两种方法(抽取式Textrank和概要式seq2seq)自动提取文本摘要☆219Updated 6 years ago
- 使用pytorch搭建textCNN 实现中文文本分类☆131Updated 6 years ago
- 嵌入Word2vec词向量的RNN+ATTENTION中文文本分类☆153Updated 5 years ago
- 基于tensorflow 实现的用textcnn方法做情感分析的项目,有数据,可以直接跑。☆350Updated 6 years ago
- SMP 2020年微博情感分类评测任务 第六名解决方案☆69Updated 3 years ago
- “互联网新闻情感分析”赛题,是CCF大数据与计算智能大赛赛题之一。对新闻情绪进行分类,0代表正面情绪、1代表中性情绪、2代表负面情绪。☆149Updated 6 years ago
- 用LSTM进行文本的情感分析☆190Updated 6 years ago
- Lstm+Cnn 预训练词向量 文本分类☆104Updated 7 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆196Updated last year
- 用MLP、TextCNN、RNN、LSTM、GRU、Attention、RCNN、BERT做文本分类、情感分析,对比各模型于温泉旅游评论垂类语料下在情感分类任务上的表现☆100Updated 4 years ago
- 新闻上的文本分类:机器学习大乱斗☆178Updated 6 years ago
- 用gensim训练LDA模型,进行新闻文本主题分析☆79Updated 6 years ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆65Updated 5 years ago
- 使用三种方法实现中文抽取式自动文摘,分别是TextRank算法、MMR(最大边界相关算法)算法和TextRank+Word2vec方法;最后使用Rouge评价方法,将生成的摘要和标准摘要进行比较,输出p、r、f值。☆35Updated 5 years ago
- CNN 实现文本分类☆183Updated 3 years ago