flicck / CninfoDistributedSpiderLinks
针对巨潮资讯网上市公司公告的分布式爬虫,采用scrapy和kafka的分布式架构。可以爬取爬取指定上市公司列表、指定时间段内的所有公告并保存PDF。后续会加入搜索引擎功能
☆19Updated 6 years ago
Alternatives and similar repositories for CninfoDistributedSpider
Users that are interested in CninfoDistributedSpider are comparing it to the libraries listed below
Sorting:
- 本项目致力于开发各种金融数据处理小工具,以实现基本面分析并提供投资建议☆44Updated 7 years ago
- 利用Scikit Learn对秒级股票数据进行建模预测☆54Updated 7 years ago
- scrapy+Fiddler+celery+ redis +mysql实现分布式定时启动并异步快速动态爬取股票数据功能☆60Updated 3 years ago
- 本项目对美股股票的涨跌进行了研究,从问题出发并提出猜想,然后定义了机器学习的实验任务。通过多次实验得到实验数据,最终证明了所提出的猜想:中国股市确实和美国股市存在着一定的联系,并且通过这些隐含的联 系可以预测某些美国股票的涨跌。☆45Updated 9 years ago
- 提取金融相关领域研究报告的主要结论(key idea)☆60Updated 7 years ago
- 抓取同花顺智能选股和level2广告页股票推荐数据,并发送邮件给指定邮箱☆87Updated 9 years ago
- 从雪球, 优矿, 聚宽获取当天的市盈率,市净率,市销率,市现率数据;从集思录获取低风险相关数据☆79Updated 2 years ago
- 雪球网沪深全站股票评论爬虫☆112Updated 8 years ago
- 金融问答平台文本数据采集/爬取,数据源涉及上交所,深交所,全景网及新浪股吧☆39Updated 8 years ago
- 金融新闻数据挖掘分析☆353Updated 7 years ago
- 重新造轮子构建投资组合框架,适合大类资产配置和股票交易。☆52Updated 7 years ago
- 对于一个板块内的股票使用Kmeans聚类剔除垃圾股,利用遗传算法分析上市公司的财务指标,从基本面的角度得出合理的股票选择模型,帮助投资者在某个板块内确定出选择高收益股票的标准,策略样本外回测计效见backtest.png文件。☆74Updated 4 years ago
- 根据东财股吧爬虫数据进行自然语言分析,展示股市热度☆123Updated 6 years ago
- 量化交易经典策略:alpha对冲(股票+期货) ,利用股指期货进行对冲的股票策略☆26Updated 7 years ago
- 基金估值表,深度分析☆36Updated 5 years ago
- QUANTAXIS 的示例demo☆43Updated 6 years ago
- 拍拍贷网贷数据挖掘,风控建模☆49Updated 8 years ago
- 根据股票帐号,自动下载www.cninfo.com.上对应的企业年报(pdf格式),然后将这些pdf格式的文件转换为txt文件,然后从中提取出有用的信息,进行数据分析和图标展示☆53Updated 9 years ago
- 利用情感语义分析和张量数据结构预测股价☆50Updated 8 years ago
- 七月算法 - 量化交易课程 - 机器学习和量化交易课程 课件和源码☆57Updated 7 years ago
- 一套基于SVM与现代投资组合理论的量化框架☆29Updated 5 years ago
- A stock market text sentiment analysis website. A股舆情分析, web-crawler, bayesian algorithm, SQL, django, data-visualization.☆41Updated 5 years ago
- <数据化运营>图书代码☆33Updated 7 years ago
- 量化交易股票预测系统☆41Updated 7 years ago
- 基于Django框架的Tushare股票数据可视化平台☆123Updated 2 years ago
- 使用Tushare下载日线数据并生成K线图☆72Updated 5 years ago
- 获取3775家上市公司近5年财务报表,建立财务报表分析模型,借助pyqt生成窗口化展示页面。☆238Updated 6 years ago
- 该项目通过scrapy爬虫从巨潮网络的服务器获取中国股市的公告☆216Updated 5 years ago
- 极简爬虫工作流☆43Updated 2 years ago
- 基于分布式爬虫,采集互联网公开来源的金融类新闻和文档类文本; 基于文本挖掘技术,进行无监督/半监督学习的数据ETL与特征工程; 基于金融数据挖掘技术,进行宏观经济分析,基本面分析与行业分析☆109Updated 7 years ago