Glacier759 / newsEyeSpider
抓取各报社报纸信息-采用配置文件形式实现的一个简单的可定制爬虫
☆11Updated 2 years ago
Alternatives and similar repositories for newsEyeSpider:
Users that are interested in newsEyeSpider are comparing it to the libraries listed below
- 网络爬虫☆51Updated 11 years ago
- 关于通过百度地图API采集POI数据,并存储到HBase的项目。☆24Updated 9 years ago
- 利用WebMagic框架进行58同城数据的抓取☆12Updated 10 years ago
- XLogger 是个基于Netty的日志记录系统☆9Updated 12 years ago
- jstorm开发demo,小例子☆23Updated 9 years ago
- 舆情搜索服务框架,其中lucene和solr版本为4.8。☆61Updated 9 years ago
- java 基于selenium抓取搜狗微信公众号文章☆49Updated 9 years ago
- apple-boot启动过程中发布广播,apple-monitor接收广播信息,然后通过jmx自动监控应用☆10Updated 6 years ago
- 各大电商网站数据抓取分析☆33Updated 11 years ago
- 使用扩展的通过数据库维护的IKAnalyzer和分布式搜索搜索服务SolrCloud及SolrJ的ShowCase。☆13Updated 10 years ago
- 日志实时监控,检索,报警☆20Updated 8 years ago
- kafa spring插件☆14Updated 9 years ago
- 并发编程☆30Updated last year
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- 基于Solr4.9.0的搜索系统:包括Solr索引建立、Solr索引查询DUBBO接口等内容。☆29Updated 2 years ago
- exit-web-framework是对常用的java web开发封装实用功能来提高开发效率。exit-web-framework基于Spring 3、Hibernate4框架来对做项目核心三层和MVC的管理。使用 到的新功能有spring缓存工厂、apeche shiro安…☆13Updated 9 years ago
- 爬虫项目源码整理,使用redis进行url缓存,hbase进行详细信息的存储。使用zookeeper进行爬虫线程的状态监控。☆19Updated 9 years ago
- 基于spring boot构建的微服务,服务之间调用日志跟踪,基于spring boot的配置日志输出模式,spring-cloud-starter-feign'的扩展日志输出,请求事件的解析和服务调用轨迹追踪☆22Updated 8 years ago
- 常用开发工具包的封装☆28Updated 6 years ago
- YMP开发框架是一套轻量级的JAVA应用开发框架,具有统一的配置体系结构、系统与业务日志分离、插件化开发模式、简单轻量的MVC和持久化支持等特性;☆33Updated 7 years ago
- 分布式session管理☆11Updated 10 years ago
- 分布式脚手架框架(总结整理)☆15Updated 9 years ago
- 项目脚手架 ExtJS4.2 + Spring3 +Hibernate4☆28Updated 8 years ago
- a mini blog with NoSql,Dubbo and Spring☆11Updated 11 years ago
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆77Updated 11 years ago
- 使用Spring3+Spring JPA+Shiro+ExtJS4 开发项目脚手架。已实现用户、权限、角色,资源、菜单,消息,公告,字典库、日志、excel导入,代码生成器、工作流等功能。☆26Updated 10 years ago
- rpc_learn Spring + Netty + Protostuff + ZooKeeper 实现了一个轻量级 RPC 框架,使用 Spring 提供依赖注入与参数配置,使用 Netty 实现 NIO 方式的数据传输,使用 Protostuff 实现对象序列化,使用 …☆19Updated 9 years ago
- zookeeper官方提供的分布式锁,选举master,和分布式队列实现☆17Updated 11 years ago
- 知乎爬虫,基于webmagic框架 .A java web spider base on webmagic.☆69Updated 8 years ago
- 一个集成型框架,包含Redis缓存的自动同步模块,业务规则模块,分库分表模块,及事务、ZK统一配置的支持。☆17Updated 9 years ago