wsl1999 / Annual_Report_WordstatsLinks
分两个项目:首先自动爬取巨潮信息网上的年报文件,pdf在线转码成txt格式,再构建词典进行分词
☆11Updated 5 years ago
Alternatives and similar repositories for Annual_Report_Wordstats
Users that are interested in Annual_Report_Wordstats are comparing it to the libraries listed below
Sorting:
- 使用中文情感词汇本体库进行情感分析,之后对每种情感的文本进行主题分析。Using Chinese Sentiment Dictionary for Sensitive Analysis, Then applying LDA Topic Analysis for each E…☆15Updated 4 years ago
- 上市公司年报分析☆12Updated 5 years ago
- [数据+代码] 经典的中文情感词典、情感分析停用词、程度副词、否定词表+中文金融情感词典(包括上市公司文本_正式和股吧社媒文本_非正式)...☆139Updated 2 years ago
- 文本(股吧评论)情感分析☆8Updated 6 years ago
- A Chinese financial sentiment word dictionary☆169Updated 3 years ago
- 【完整视频教程】东财股吧、新浪财经爬虫,情感分析并自动生成发送舆情分析报告☆54Updated 2 years ago
- 中文文本挖掘lda模型,gensim+jieba库☆17Updated 5 years ago
- 金融财经类新闻文本主题事件提取☆53Updated 2 years ago
- 用gensim训练LDA模型,进行新闻文本主题分析☆78Updated 6 years ago
- 📉 金融文本情感分析模型☆347Updated 7 years ago
- 简单的年报分析工具☆39Updated 8 years ago
- 爬取东方财富的宏观研究的研报,基于LSTM进行情感分析,分类为正向、负向和中性三类☆114Updated 3 years ago
- 财经新闻情感分类数据集☆69Updated 6 years ago
- 新浪财经新闻正文和评论爬取并作情感分析☆14Updated 5 years ago
- 文本分类是指在给定分类体系下 , 根据文本的内容自动确定文本类别的过程。首先我们根据scrapy爬虫根据中国知网URL的规律,爬取70多万条2014年公开的发明专利,然后通过数据清洗筛选出了60多万条含标签数据。通过TF-IDF对60多万条本文进行词频提取,依照词频排序提取…☆107Updated 7 years ago
- 京东评论情感分析模型,主要包括1、数据获取及探索性分析;2、文本预处理、文本分词、文本向量化、特征提取、☆80Updated 6 years ago
- 利用文本挖掘技术进行新闻热点关注问题分析☆164Updated 6 years ago
- 中文文本聚类☆123Updated 3 years ago
- 中文情感分析模型,包含各种主流的情感词典、机器学习、深度学习、预训练模型方法☆104Updated 5 years ago
- We apply from rule-based approach to BERT for a sentiment analysis task on financial texts.☆12Updated 3 years ago
- 使用SO_PMI互信息算法、词向量法快速构建不同领域(手机、汽车等)的专业情感词典☆94Updated 3 years ago
- 计算新闻文本类情感分析(采用TF-IDF,余弦距离,情感依存等算法)☆58Updated 7 years ago
- 微博爬取“关键词”的程序,并作出了各种优化☆22Updated 2 years ago
- 使用爬虫获取财经网站的评论、文章;通过tushare库获取股票价格数据;通过jieba库对文本进行词频分析☆94Updated 7 years ago
- 基于LDA主题模型的投资者情绪对股价影响研究☆25Updated 5 years ago
- Topic Analysis of Weibo News Based on Title-Weighted LDA Model ;基于标题加权的LDA模型的微博新闻主题分析;タイトル加重LDAモデルに基づくWeiboニューストピック分析☆14Updated 3 years ago
- 爬取东方财富股吧沪深股票文章、评论及发言用户信息☆52Updated 7 years ago
- 通过将对上市公司招股说明书情绪分析的结果与常用财务指标、企业科研指标等结合,综合使用多种分类模型:传统LR、随机森林、XGB、LGB集成学习模型对新上市公司破发情况进行学习和预测,筛选重要特征,并由此来得到一个新股破发分类器。☆12Updated last year
- sentiment analysis、情感分析、文本分类、基于字典、python、classification☆131Updated 4 years ago
- 基于分布式爬虫,采集互联网公开来源的金融类新闻和文档类文本; 基于文本挖掘技术,进行无监督/半监督学习的数据ETL与特征工程; 基于金融数据挖掘技术,进行宏观经济分析,基本面分析与行业分析☆104Updated 6 years ago