flicck / CninfoDistributedSpider

针对巨潮资讯网上市公司公告的分布式爬虫,采用scrapy和kafka的分布式架构。可以爬取爬取指定上市公司列表、指定时间段内的所有公告并保存PDF。后续会加入搜索引擎功能
19Updated 5 years ago

Related projects

Alternatives and complementary repositories for CninfoDistributedSpider