jfbbcom / Fund-review-Crawl-and-analysisLinks
这是一个基金评论与股票市场的情感分析项目,目的是手动爬取天天基金网基民评论与东方财富网股市行情的资讯,从基民评论、重仓股票、市场行情三个方面出发,使用情感词典与LDA模型进行分析,从而做出是否值的购买基金的决策。带有标签clean的是清洗后的爬 虫数据,没有带标签的是原始数据或者某个分析后的结果。具体的工作代码放在了“基于情感词典与LDA模型的基金文本研究.ipynb”中,使用的是python 的jupyter notebook。
☆31Updated 4 months ago
Alternatives and similar repositories for Fund-review-Crawl-and-analysis
Users that are interested in Fund-review-Crawl-and-analysis are comparing it to the libraries listed below
Sorting:
- 【完整视频教程】东财股吧、新浪财经爬虫,情感分析并自动生成发送舆情分析报告☆59Updated 2 years ago
- 基于分布式爬虫,采集互联网公开来源的金融类新闻和文档类文本; 基于文本挖掘技术,进行无监督/半监督学习的数据ETL与特征工程; 基于金融数据挖掘技术,进行宏观经济分析,基本面分析与行业分析☆109Updated 7 years ago
- 與情分析系统,包括爬虫、数据清洗、文本摘要、主题分类、情感倾向性识别以及分析结果数据可视化☆444Updated 3 years ago
- 本仓库收录了我的毕业论文所使用的全部代码。 毕业论文题目《年报文本语气能预示股价崩盘风险吗?——基于 A 股上市公司年报的文本挖掘》。已被本科生毕业论文相关文献库收录,因此您可以查阅论文的正文。☆15Updated 4 years ago
- 基于机器学习的信用风险评估模型,主要使用了Sklearn库,通过逻辑回归,向量机等模型,根据借款人的个人身份信息评估是否应当发放贷款。☆18Updated 3 years ago
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆80Updated 4 years ago
- 股市情感分析☆346Updated 7 years ago
- 基于LDA主题模型的投资者情绪对股价影响研究☆25Updated 5 years ago
- 基于情感字典和机器学习的股市舆情情感分类可视化☆335Updated 6 years ago
- 通过python爬虫获取人民网、新浪等网站新闻作为训练集,基于BERT构建新闻文本分类模型,并结合node.js + vue完成了一个可视化界面。☆41Updated 3 years ago
- 对豆瓣影评进行文本分类情感分析,利用爬虫豆瓣爬取评论,进行数据清洗,分词,采用BERT、CNN、LSTM等模型进行训练,采用tensorboardX可视化训练过程,自然语言处理项目\A project for text classification, based on to…☆167Updated 2 years ago
- 某电商手机评论的文本挖掘初体验 功能板块:数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序☆123Updated 6 years ago
- [数据+代码] 经典的中文情感词典、情感分析停用词、程度副词、否定词表+中文金融情感词典(包括上市公司文本_正式和股吧社媒文本_非正式)...☆151Updated 3 years ago
- 为了通过影评数据反应电影《流浪地球》的口碑以及其造成热度,并核实网络水军恶意对其刷差评现象是否存在,本文利用猫眼PC端接口,通过控制时间参数,动态爬取了,《流浪地球》在2019年3月5日之前的54万余条影评数据。对这些数据进行预处理操作,特征处理,可视化分析后,引入了卷积神…☆27Updated 6 years ago
- 大模型相关实践记录☆157Updated 7 months ago
- 使用爬虫获取财经网站的评论、文章;通过tushare库获取股票价格数据;通过jieba库对文本进行词频分析☆95Updated 7 years ago
- 利用Python编程爬虫搜集微博平台上关于大学生网课的评论,使用SPSS、机器学习、自然语言处理等方法,对收集到的文本数据进行分词、数据清洗、词频统计和聚类分析。最后根据所得到的数据进行以及分析,发现目前在线教学 中学生体验的现状、趋势以及一些待解决的问题。☆46Updated 4 years ago
- 使用python抓取微博数据并对微博文本分析和可视化,LDA(树图)、关系图、词云、时间趋势(折线图)、热度地图、词典情感分析(饼图和3D柱状图)、词向量神经网络情感分析 、tfidf聚类、词向量聚类、关键词提取、文本相似度分析等☆919Updated 5 years ago
- kaggle贷款违约预测 :主要研究如何借助非平衡数据分类的思想对银行等金融机构的历史贷款数据进行分析,并基于随机森林分类模型预测贷款违约的可能性☆22Updated 6 years ago
- 爬取东方财富股吧沪深股票文章、评论及发言用户信息☆51Updated 7 years ago
- [数据+代码] 上市公司年报文本分词、关键词词频统计+数字化转型关键词表