peopleindreamdontsleep / SparkanSpider
java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES
☆21Updated 5 years ago
Related projects ⓘ
Alternatives and complementary repositories for SparkanSpider
- spring cloud集成全渠道在线客服以及后台管理系统,所有微服务之间的消息传递采用区块链技术,持续更新中~~目标是:第一阶段:采用spring cloud微服务搭建后台管理系统第二阶段:集成在线客服,采用netty实现websocket长连接第三阶段:集成h5、微信、…☆16Updated last year
- 数据处理平台☆16Updated 7 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 6 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)