yangguang2014 / distributedCrawler
华南理工大学高英实验室进行的分布式爬虫项目,除了实验室内部人员外,不得私自传播.
☆21Updated 10 years ago
Alternatives and similar repositories for distributedCrawler:
Users that are interested in distributedCrawler are comparing it to the libraries listed below
- java分布式爬虫,主机和从机控制的机制☆14Updated 9 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆20Updated 8 years ago
- DistributeCrawler的Maven版☆10Updated 2 years ago
- 分布式session管理☆11Updated 10 years ago
- Search Engine for Chinese base on Solr(基于solr的中文搜索引擎框架)☆27Updated 12 years ago
- JBFS 是基于facebook haystack 开发的一套分布式海量小文件存储系统☆18Updated 9 years ago
- 模仿Java标准库的一些API实现的算法库,包括了数据结构,字符串处理(StringBuilder),图(有向图)。原来是用Python实现的,但是Python实现的并没有经过完整的测试,不能够保证完全的正确性。 使用Java实现的集合库都经过完整的测试,实际上,我在实现的…☆48Updated 10 years ago
- rpc_learn Spring + Netty + Protostuff + ZooKeeper 实现了一个轻量级 RPC 框架,使用 Spring 提供依赖注入与参数配置,使用 Netty 实现 NIO 方式的数据传输,使用 Protostuff 实现对象序列化,使用 …☆19Updated 9 years ago
- ServiceFramework 示例项目☆10Updated 9 years ago
- 文本去重算法,研究自推荐系统中新闻的去重,采用了雅虎的Near-duplicates and shingling算法,服务端用c实现,客户端用java实现,利用thrift框架进行通信,为了提高扩展性,去重可以在服务端实现,服务器也提供了计算的接口,方便客户端自己扩展☆24Updated 11 years ago
- 基于mybatis + spring + maven + mysql 自动生成的工具☆13Updated 12 years ago
- 读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘☆47Updated 10 years ago
- A self-taught project codes to learn Java.☆8Updated last year
- 基于Spring的轻量级社区☆15Updated 8 years ago
- 参照官方wiki的motan使用demo☆14Updated 9 years ago
- 大规模分布式系统的跟踪、监控、告警平台☆55Updated 10 years ago
- lifelong learning: record and analysis of my knowledge structure☆18Updated 7 years ago
- 微博数据分析服务框架。☆12Updated 9 years ago
- java设计模式☆10Updated 9 years ago
- 保障服务的持续高可用、高性能及负载均衡☆17Updated 8 years ago
- 一个基于eureka服务发现对微服务应用JVM和WEB请求指标、微服务运行状态的监控,并通过图形化来展示的小型轻量级监控系统。☆18Updated 5 years ago
- 新版代码生成器☆10Updated 7 years ago
- 规则引擎测试☆10Updated 11 years ago
- Some java tracks, experiments, etc.☆10Updated 10 years ago
- class热部署☆11Updated 10 years ago
- 分布式锁,默认是redis实现,可扩展接口增加zk、等其他实现☆10Updated 6 years ago
- 基于canal的mysql slave实现☆12Updated 12 years ago
- 以Spring Boot框架为基础,实现各分布式事务(JTA/消息/TCC)的DEMO☆9Updated 8 years ago
- MyBatis学习的源码,博客地址:http://blog.csdn.net/column/details/smybatis.html☆22Updated 8 years ago
- 用户画像代码,根据算法推算出用户的性别和年龄比率☆11Updated 7 years ago