DavionWu2018 / Word_frequencyLinks
[数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表
☆31Updated 3 years ago
Alternatives and similar repositories for Word_frequency
Users that are interested in Word_frequency are comparing it to the libraries listed below
Sorting:
- [数据+代码] 经典的中文情感词典、情感分析停用词、程度副词、否定词表+中文金融情感词典(包括上市公司文本_正式和股吧社媒文本_非正式)...☆150Updated 3 years ago
- 数据科学基础大作业:实现的技术包括利用python爬虫,爬取关键词搜索的微博正文,特定微博下的评论;预处理微博文本;手写textRank;聚类,kmeans,DBSCAN,层次聚类;情感词典情感分析;pyecharts可视化绘图☆72Updated last year
- 基于LDA主题模型的投资者情绪对股价影响研究☆25Updated 5 years ago
- 中国知网专利爬虫☆18Updated 2 years ago
- 【微信公众号:大邓和他的python】, Python语法快速入门https://www.bilibili.com/video/av44384851 Python网络爬虫快速入门https://www.bilibili.com/video/av72010301…☆100Updated 3 years ago
- 这是一个基金评论与股票市场的情感分析项目,目的是手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行情三个方面出发,使用情感词典与LDA模型进行分析,从而做出是否值的购买基金的决策。带有标签clean的是清洗后的爬虫数据,没有带标签的是原始数据…☆31Updated 4 months ago
- 使用中文情感词汇本体库进行情感分析,之后对每种情感 的文本进行主题分析。Using Chinese Sentiment Dictionary for Sensitive Analysis, Then applying LDA Topic Analysis for each E…☆15Updated 4 years ago
- 自制Python玩具小爬虫,用来爬取失信被执行人、专利等数据☆21Updated 5 years ago
- 本仓库收录了我的毕业论文所使用的全部代码。 毕业论文题目《年报文本语气能预示股价崩盘风险吗?——基于 A 股上市公司年报的文本挖掘》。已被本科生毕业论文相关文献库收录,因此您可以查阅论文的正文。☆15Updated 4 years ago
- 借助Python抓取微博数据,并对抓取的数据进行情绪分析☆371Updated 2 years ago
- 中文情感词典汇总(台湾大学NTUSD简体中文情感词典,清华大学李军中文褒贬义词典,知网Hownet情感词典等)☆199Updated 7 months ago
- 使用python抓取微博数据并对微博文本分析和可视化,LDA(树图)、关系图、词云、时间趋势(折线图)、热度地图、词典情感分析(饼图和3D柱状图)、词向量神经网络情感分析、tfidf聚类、词向量聚类、关键词提取、文本相似度分析等☆918Updated 5 years ago
- 微博爬取“关键词”的程序,并作出了各种优化☆22Updated 2 years ago
- 中文文本分析工具、语料、预训练模型相关资源汇总。☆143Updated last month
- A Chinese financial sentiment word dictionary☆184Updated 4 years ago
- 一个巨潮资讯网年报爬取,下载,并将格式转为TXT文本便于词频分析的小工具☆156Updated 7 months ago
- 根据关键词爬取微博内容并进行情感分析☆16Updated 5 years ago
- 利用Python编程爬虫搜集微博平台上关于大学生网课的评论,使用SPSS、机器学习、自然语言处理等方法,对收集到的文本数据进行分词、数据清洗、词频统计和聚类分析。最后根据所得到的数据进行以及分析,发现目前在线教学 中学生体验的现状、趋势以及一些待解决的问题。☆45Updated 4 years ago
- 微博超级话题爬虫,微博词频统计+情感分析+简 单分类,新增肺炎超话爬取数据☆293Updated 5 years ago
- 與情分析系统,包括爬虫、数据清洗、文本摘要、主题分类、情感倾向性识别以及分析结果数据可视化☆440Updated 3 years ago
- 中文环境领域文本分析包,纯神经网络架构,支持EnvBert,LSTM,RNN,word2vec等模型,支持自定义模型,下游任务包括分类,回归,多选,情感分析,命名实体识别等,专题包括气候变化文本分析,环境知识图谱等。针对领域研究进行了接口的优化,一键使用模型。☆35Updated 2 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专 业情感词典☆93Updated 3 years ago
- 该资源为调用大连理工情感词典实现的情感分析和情绪分类,并与SnowNLP进行对比。基础性文章,希望对您有所帮助~☆102Updated 5 years ago
- 网络舆情态势及情感多维特征分析与可视化,bert用于微博情感分类,geopandas用于绘制情绪地图。项目还提供了轻量级的微博签到爬取,带有坐标。☆77Updated 5 months ago
- 一个比较全面的文本挖掘过程。包含了利用机器学习和文本挖掘技术完成情感分析模型搭建;利用情感极性判断与程度计算来判断情感倾向;利用词频和TF-IDF挖 掘出正负文本中的关键点情况;利用文本挖掘相关算法找到平台中用户讨论的集中点。☆38Updated 6 months ago
- 数据集依据与“新冠肺炎”相关的230个主题关键词进行数据采集,抓取了2020年1月1日—2020年2月20日期间共计100万条微博数据,并对其中10万条数据进行人工标注,标注分为三类,分别为:1(积极),0(中性)和-1(消极)☆18Updated 4 years ago
- 无cookie版微博爬虫,可以连续爬取一个或多个新浪微博用户信息、用户微博及其微博评论转发。☆160Updated 3 years ago
- cntext 是一个专为社会科学实证研究设计的中文文本分析 Python 库。它不仅提供传 统的词频统计和情感分析,还支持词嵌入训练、语义投影计算等高级功能,帮助研究者从大规模非结构化文本中测量抽象构念——如态度、认知、文化观念与心理状态。☆381Updated last month
- ☆31Updated 4 years ago
- 情感分析,微博情感分析,微博水军检测,水军检测,营销粉检测,僵尸粉检测,微博爬虫☆72Updated 4 years ago