15625103741 / Text-MiningLinks
近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的智慧政务系统已经是社会治理创新发展的新趋势,对提升政府的管理水平和施政效率具有极大的推动作用。 本文针对“智慧政务”中的居民投诉建议文本评论数据,基于向量空间模型算 法提取了文本关键词并我们采用了多种机器学习分类模型进行测试,从最终得到线性支持向量回归算法相对较优的结果,F1-Score评价指标达0.86。 在挖掘热点问题的前期处理上,使用了余弦相似度计算整理出文本相似的同类主题并加以筛选,通过在SPSS中建立基于因子…
☆33Updated 5 years ago
Alternatives and similar repositories for Text-Mining
Users that are interested in Text-Mining are comparing it to the libraries listed below
Sorting:
- 练手项目:Comment of Interest 电商文本评论数据挖掘 (爬虫 + 观点抽取 + 句子级和观点级情感分析)☆103Updated 4 years ago
- 本项目的数据来自“互联网新闻情感分析”赛题。基于Transformer2.0库中的中文Bert模型,对新闻语料进行 三分类。☆114Updated 5 years ago
- 某电商手机评论的文本挖掘初体验 功能板块:数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序☆121Updated 6 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆164Updated 6 years ago
- 京东评论情感分析模型,主要包括1、数据获取及探索性分析;2、文本预处理、文本分词、文本向量化、特征提取、☆81Updated 6 years ago
- 该库是一个项目集,包括文本分类、多标签分类、细粒度情感分析、命名实体识别,以及部分数据集等☆201Updated 6 years ago
- 对舆情事件进行词云展示,对评论进行情感分析和观点抽取。情感分析基于lstm 的三分类,观点抽取基于AP 算法的聚类和MMR的抽取☆182Updated 6 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆67Updated 4 years ago
- 零基础入门NLP - 新闻文本分类 正式赛第一名方案☆234Updated 4 years ago
- 以nlp中情感分析为例,从没有打过标签的语料开始一步步教你怎么去打标签,然后分别以传统的机器学习模型SVM和深度学习模型LSTM去建模。☆35Updated 6 years ago
- LSTM,TextCNN,fastText情感分析,模型用 tf_serving 和 flask 部署成web应用☆42Updated 5 years ago
- 中文情感分析模型,包含各种主流的情感词典、机器学习、深度学习、预训练模型方法☆105Updated 5 years ago
- 中文商品评论短文本分类器,可用于情感分析☆364Updated 3 years ago
- 用gensim训练LDA模型,进行新闻文本主题分析☆78Updated 6 years ago
- 该工程是利用python3.6进行“特征提取+分类器”来实现美团评论的文本二分类问题。在特征提取部分提取了6种特征,分类器选择了python里面的包xgboost和lightGBM分别实现提升树和GBDT(梯度提升决策树)。☆94Updated 6 years ago
- 自然语言处理NLP在中文文本上的一些应 用,如文本分类、情感分析、命名实体识别等☆215Updated 4 years ago
- Sentiment Classifier base on traditional Maching learning methods, eg Bayes, SVM ,DecisionTree, KNN and Deeplearning method like MLP,CNN,…☆144Updated 7 years ago
- 情感分析三分类☆29Updated 11 months ago
- Python实现中文文本关键词抽取,分别用了TF-IDF、LDA、RNN、LSTM和LR-SGD两类共五种方法,全网最全没有之一。☆60Updated 4 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆107Updated 7 years ago
- bert文本分类,ner, albert,keras_bert,bert4keras,kashgari,fastbert,flask + uwsgi + keras部署模型,时间实体识别,tfidf关键词抽取,tfidf文本相似度,用户情感分析☆195Updated 11 months ago
- 以京东评论作为数据集, 使用常见的机器学习算法如KNN、SVM、逻辑回归、贝叶斯、xgboost等等算法进行分类。使用深度学习中的CNN、RNN、CNN和RNN连接、Bi-GRU、bert模型进行分类。使用fastnlp的框架搭建文本分类。☆32Updated 5 years ago
- 基于scikit-learn实现对新浪新闻的文本分类,数据集为100w篇文档,总计10类,测试集与训练集1:1划分。分类算法采用SVM和Bayes,其中Bayes作为baseline。☆107Updated 6 years ago
- 基于情感字典的情感分析模型☆41Updated 8 years ago
- 一个基本的多层lstm rnn模型,能实现中英文文本的二分类或多 分类☆47Updated 6 years ago
- 基于Word2Vec+SVM对电商的评论数据进行情感分析☆135Updated 6 years ago
- 今日头条中文新闻(文本)分类数据集☆68Updated 7 years ago
- “互联网新闻情感分析”赛题,是CCF大数据与计算智能大赛赛题之一。对新闻情绪进行分类,0代表正面情绪、1代表中性情绪、2代表负面情绪。☆148Updated 5 years ago
- 基于LSTM网络与自注意力机制对中文评论进行细粒度情感分析☆55Updated 3 years ago
- 自然语言处理中的基础任务,包含但不限于文本表示,文本分类,命名实体识别,关系抽取,文本生成,文本摘要等,基于tensorflow2或Pytorch,所有代码均经过测试,项目中也包含相关数据。☆143Updated 2 years ago