xjtushilei / ScriptSpiderLinks
A Java componentized distributed crawler framework. 一个Java版本的组件化的分布式通用爬虫
☆163Updated last year
Alternatives and similar repositories for ScriptSpider
Users that are interested in ScriptSpider are comparing it to the libraries listed below
Sorting:
- 一个简单易用的爬虫框架,内置代理管理模块,灵活设置多线程爬取☆62Updated 8 years ago
- 温故而知新,分享知识,快乐编码~☆539Updated 8 years ago
- 🐝 Web vertical crawler framework for fun☆191Updated last year
- 设计模式的总结与例子(有XMind,Uml图和详细代码实现说明)☆272Updated 7 years ago
- 又一个号称高性能的 java 爬虫工具/爬虫框架☆122Updated 6 years ago
- webmagic 爬取我喜欢的网易云歌单+评论☆51Updated 8 years ago
- 这个是我个人网站的项目,欢迎贡献代码,力求能够应用到实际工作中java相关的大多数技术栈。有兴趣请Star一下,非常感谢。qq交流群:587577705 这个项目将不断地更新!生产环境:☆171Updated 5 years ago
- 利用spring boot + webmagic 开发的java爬虫系统☆61Updated 8 years ago
- 天气爬虫(全国城镇天气自动定时抓取更新,并开放RESTful查询接口),附带代理IP池定时更新并检测其可用性☆366Updated 7 years ago
- 使用java+httpclient+httpcleaner,多线程、分布式爬去电商网站商品信息,数据存储在hbase上,并使用solr对商品建立索引,使用redis队列存储一个共享的url仓库;使用zookeeper对爬虫节点生命周期进行监视等。☆230Updated 5 years ago
- clover 1、开发server和client端 定时向zk集群发送心跳数据包,利用Java自带的timer程序实现该功能 2、开发整天的monitor程序,用来定时向zk中获取server和client端的心跳数据信息,如果超过指定时间没有收到最新的数据包,那么任务se…☆195Updated 10 years ago
- Easy Spring Boot blog~☆76Updated 7 years ago
- Lightweight Java Platform Online Mooc Learning Website☆116Updated 5 years ago
- Mybatis Generator Web Tool. 更加简单便捷的生成Mybatis框架代码☆75Updated 8 years ago
- 爬虫代理IP池服务,可供其他爬虫程序通过restapi获取☆115Updated 3 years ago
- 工作中积累的工具类☆85Updated 7 years ago
- 基于poi 通过配置对excel进行导入导出框架☆60Updated 7 years ago
- springMvc4.x系列整理总结☆55Updated 8 years ago
- 用于在Spring Boot项目中轻松集成Druid数据库连接池和监控☆19Updated 8 years ago
- spring-boot + mybatis + redis as second level cache☆195Updated 7 years ago
- 基于WebMagic写的一个csdn博客小爬虫☆91Updated 7 years ago
- 一个简洁漂亮的java blog 基于Spring /MVC+ Hibernate + MySQL + Bootstrap + freemarker. 实现☆186Updated 8 years ago
- 分布式多媒体共享平台,个人毕业设计的系统,采用分布式系统构架,保证服务的稳定性。项目wiki文档:https://github.com/wu560130911/MultimediaDesktop/wiki☆103Updated 7 years ago
- 基于webmagic + springboot + mybatis的Java爬虫,使用Echarts进行数据可视化分析,提供了从爬虫 获取数据到数据持久化、数据可视化分析以及构建简单的代理池等一整套解决方案模板。☆367Updated 8 years ago
- 🎊 Design and implement of lightweight crawler framework.☆316Updated 7 years ago
- 实现定时爬取与IP代理池☆150Updated 7 years ago
- java常用工具类集合☆112Updated 7 years ago
- Exception异常管理平台,支持Java、PHP、Python等多种语言☆85Updated 2 years ago
- 知乎爬虫,基于webmagic框架 .A java web spider base on webmagic.☆69Updated 9 years ago
- 基于JAVA NIO 的轻量级消息传输框架。主要功能包括:文本消息传输、二进制文件传输、文本及二进制混合传输、消息的自定义实现加密传输算法、同步或异步传输、客户端、服务端框架内置心跳监听、服务端认证、支持网络断线客户端自动重连。☆44Updated 8 years ago