bruceq / Gather-Platform
☆18Updated 7 years ago
Related projects ⓘ
Alternatives and complementary repositories for Gather-Platform
- 简单实用的同步工具,实现mysql数据库中数据定期同步到elasticsearch,只需简单的配置,便能达到非凡的效果,支持elasticsearch 5.X版本☆48Updated 7 years ago
- 爬虫项目源码整理,使用redis进行url缓存,hbase进行详细信息的存储。使用zookeeper进行爬虫线程的状态监控。☆18Updated 9 years ago
- 网络爬虫☆51Updated 10 years ago
- 蜂巢爬虫系统 是一套只需要定义XPath,就可实现爬取网站,APP的系统, 支持多种解析方式(XPath,正则表达式),多种下载方式(HttpClient库, PhantomJs, Selenium),多种输出方式(Excel,MongoDB)。 可不做任何修改发布到Yar…☆5Updated 7 years ago
- The Crawler Proxy IP Pool Component☆65Updated 2 years ago
- spring整合webmagic,mybatis,dungproxy☆29Updated last year
- 反网页爬虫系统☆38Updated 9 years ago
- 大规模分布式系统的跟踪、监控、告警平台☆55Updated 10 years ago
- 基于词典的负面舆情信息评分算法。☆25Updated 9 years ago
- 基于Drools的规则引擎☆133Updated 8 years ago
- 舆情搜索服务框架,其中lucene和solr版本为4.8。☆60Updated 8 years ago
- 数据虫巢官网(mite8.com)站点源码,包括站点基础数据爬取代码,以及重构的NLP分词工具等。☆48Updated 7 years ago
- 铜板街轻量级JDBC层分库分表框架☆46Updated 11 months ago
- ☆28Updated 8 years ago
- 日志分析器,仿造elk中logstash的简单Java实现,实现监控目录日志,自动解析存入elasticsearch。☆22Updated 8 years ago
- 基于Solr4.9.0的搜索系统:包括Solr索引建立、Solr索引查询DUBBO接口等内容。☆29Updated last year
- java 基于selenium抓取搜狗微信公众号文章☆47Updated 9 years ago
- A distributed real-time stock picking system base on flume,kafka,jstorm,esper,and mysql☆160Updated 7 years ago
- rank是一个seo工具,用于分析网站的搜索引擎收录排名。☆66Updated 7 years ago
- 使用SpringBoot,Scala開發的自動化測試平台☆38Updated 7 years ago
- 基于Drools的规则引擎系统☆97Updated 11 years ago