canghaiyisu666 / spider
爬虫项目源码整理,使用redis进行url缓存,hbase进行详细信息的存储。使用zookeeper进行爬虫线程的状态监控。
☆19Updated 9 years ago
Alternatives and similar repositories for spider:
Users that are interested in spider are comparing it to the libraries listed below
- dubbo服务间的分布式事物☆11Updated 9 years ago
- 使用kafka实现log4j日志集中管理☆14Updated 4 years ago
- 日志分析器,仿造elk中logstash的简单Java实现,实现监控目录日志,自动解析存入elasticsearch。☆22Updated 9 years ago
- 基于云计算Iaas平台的企业级云计算,一站式解决方案,http://www.springcloud.cn☆28Updated 9 years ago
- 基于spring boot构建的微服务,服务之间调用日志跟踪,基于spring boot的配置日志输出模式,spring-cloud-starter-feign'的扩展日志输出,请求事件的解析和服务调用轨迹追踪☆22Updated 8 years ago
- zookeeper官方提供的分布式锁,选举master,和分布式队列实现☆17Updated 11 years ago
- 简单实用的同步工具,实现mysql数据库中数据定期同步到elasticsearch,只需简单的配置,便能达到非凡的效果,支持elasticsearch 5.X版本☆48Updated 8 years ago
- 大规模分布式系统的跟踪、监控、告警平台☆55Updated 10 years ago
- XLogger 是个基于Netty的日志记录系统☆9Updated 12 years ago
- dubbo日志扩展插件☆25Updated 7 years ago
- 一个集成型框架,包含Redis缓存的自动同步模块,业务规则模块,分库分表模块,及事务、ZK统一配置的支持。☆17Updated 9 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆20Updated 8 years ago
- elasticsearch-jdbc,在elasticsearch-sql的jdbc实验特性基础上完成,可使用sql和rest api的方式执行elasticsearch操作☆19Updated 6 years ago
- 分布式脚手架框架(总结整理)☆15Updated 9 years ago
- 业务风控系统☆11Updated 8 years ago
- 日志实时监控,检索,报警☆20Updated 9 years ago
- DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、HDFS、Hive、OceanBase、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。☆23Updated 3 years ago
- kafka消息中间件的实现☆8Updated 8 years ago
- 基于redis的分布式锁,适用于秒杀,自增ID等web分布式开发场景☆11Updated 8 years ago
- JMay是一款基于Spring、SpringMVC、Mybatis、Atomikos集成框架,用于快速搭建跨数据库、分布式事务(JTA)支持的java web项目☆27Updated 2 years ago
- 点赞机器人,spring4,mybatis,quartz,mongodb,MS消息队列,dubbo☆10Updated 10 years ago
- log4j日志的监控系统,采用web形式展现各模块的运行状态,支持邮件短信报警,适用于一般企业大中型业务生成系统的监控;业务模块定时30秒采用json格式输出到文件,