markyangcc / Analysis-Gov-Work-Report
利用Python爬取网站近年的政府工作报告,并进行简单的词频分析+词云
☆15Updated last year
Alternatives and similar repositories for Analysis-Gov-Work-Report:
Users that are interested in Analysis-Gov-Work-Report are comparing it to the libraries listed below
- 文本转拼音、提取英文字段、提取数字、提取中文字符、英文转中文、字符型的数字转中文的数字表示、拼音转文本、文本纠错、基于bert转词向量、基于bert转句向量、繁体字转简体、中文数字转阿拉伯数字☆21Updated 4 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆92Updated 3 years ago
- 金融财经类新闻文本主题事件提取☆53Updated 2 years ago
- Chinese Sentiment Classification Tool. 情感极性分类,基于知网、清华、BosonNLP情感词典,易扩展,基准方法,开箱即用。☆92Updated last year
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆53Updated 7 years ago
- [数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表☆30Updated 2 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆161Updated 6 years ago
- 中文文本分析相关资源汇总☆135Updated last week
- 简单的年报分析工具☆36Updated 7 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆106Updated 7 years ago
- Chinese Subjective Dectection based on subjective knowlegebase, 中文主观性计算。基于中文主观性知识库的句子主观性评定方法。☆57Updated last year
- 文本热点挖掘,基于DBSCAN聚类模型,对文本的热点事件进行挖掘☆43Updated 4 years ago
- 中文新词发现算法PNW算法,可以识别任意长度的新词。☆15Updated last year
- 本项目旨在对《红楼梦》这部中国古典小说进行人物关系的可视化分析。通过对小说文本的数据采集、清洗和转换,以及分词处理和词频统计等步骤,最终生成人物关系图,并进行可视化展示。另外,项目还尝试通过数据分析的方法并且可视化来验证《红楼梦》后四十回的作者是否为曹雪芹。☆15Updated last year
- 大连理工大学情感词汇本体库及其他相关操作☆131Updated 7 years ago
- Self complemented sentiment words expansion using seed sentiment words and so-pmi , this method is tested to be effective, 基于情感种子词与so-pmi…☆87Updated 6 years ago
- 中文文本分析库,可对文本进行词频统计、词典扩充、情绪分析、相似度、可读性等☆55Updated 3 years ago
- 京东评论情感分析模型,主要包括1、数据获取及探索性分析;2、文本预处理、文本分词、文本向量化、特征提取、☆79Updated 5 years ago
- 无监督观点聚类。通过依存关系进行观点提取,对观点进行相似度计算,对已经生成的观点聚类☆47Updated 6 years ago
- 在Python中利用情感词典做情感分析☆43Updated 7 years ago
- 这是我2014级本科毕业论文项目,在深交所实习期间完成!☆19Updated 6 years ago
- 第十届大学生服务外包大赛--A01商品短文本分类。基于CNN、Bi-LSTM、Attention、Adversarial等方法实现商品短文本分类任务,并基于Flask开发Web版本的交互演示界面。☆28Updated 2 years ago
- 音乐类语料的意图识别填槽以及槽值纠错模型☆16Updated 2 years ago
- 法律智能 ,NLP技术赋能法律判案☆20Updated 5 years ago
- 基于python gensim 库的LDA算法 对中文进行文本分析,很难得,网上都是英文的,基本上没有中文的,需要安装jieba分词进行分词,然后去除停用词最后才能使用LDA☆136Updated 5 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆33Updated 4 years ago
- 基于 RoBERTa-wwm-ext 模型的微博中文情绪识别☆33Updated 3 years ago
- 本地语料很多?爬到的文档很多?运行出无序结果很多?我们经常面对一些搜索引擎无法检索的文本/或其它程序运行结果,想要对这些内容进行检索、按相关性排序等。MySearch是用python3写的,用于方便中英文检索的小脚本,中文分词基于jieba、pkuseg,相关性排序基于sk…☆20Updated 6 years ago
- 复现了论文《基于主题模型的短文本关键词抽取及扩展》的代码☆30Updated 4 years ago
- 根据褒贬种子词,利用SO-PMI构建情感词典☆25Updated 9 years ago