yangguang2014 / distributedCrawler
华南理工大学高英实验室进行的分布式爬虫项目,除了实验室内部人员外,不得私自传播.
☆21Updated 10 years ago
Alternatives and similar repositories for distributedCrawler:
Users that are interested in distributedCrawler are comparing it to the libraries listed below
- java分布式爬虫,主机和从机控制的机制☆14Updated 9 years ago
- 分布式session管理☆11Updated 10 years ago
- Search Engine for Chinese base on Solr(基于solr的中文搜索引擎框架)☆27Updated 12 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆19Updated 8 years ago
- DistributeCrawler的Maven版☆10Updated 2 years ago
- 读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘☆47Updated 10 years ago
- 模仿Java标准库的一些API实现的算法库,包括了数据结构,字符串处理(StringBuilder),图(有向图)。原来是用Python实现的,但是Python实现的并没有经过完整的测试,不能够保证完全的正确性。 使用Java实现的集合库都经过完整的测试,实际上,我在实现的…☆48Updated 9 years ago
- 基于Flume、Kafka、SparkSql模拟的实时日志分析系统☆12Updated 9 years ago
- JBFS 是基于facebook haystack 开发的一套分布式海量小文件存储系统☆18Updated 8 years ago
- rpc_learn Spring + Netty + Protostuff + ZooKeeper 实现了一个轻量级 RPC 框架,使用 Spring 提供依赖注入与参数配置,使用 Netty 实现 NIO 方式的数据传输,使用 Protostuff 实现对象序列化,使用 …☆19Updated 9 years ago
- 新版代码生成器☆10Updated 6 years ago
- JAVA开源关键词提取框架☆10Updated 10 years ago
- 规则引擎测试☆10Updated 10 years ago
- bboss rpc eclipse project.支持丰富的协议栈(http/netty/mina/jms/webservice/rmi/jgroups/restful) 安全高效,可非常方便地将bboss ioc管理的业务组件发布成RPC服务☆13Updated last week
- 分布式在线聊天系统☆10Updated 10 years ago
- 这是一个统一管理系统权限,设计的目标是给开发者一个完整地权限管理系统,以便你能更专注自己系统业务的开发☆36Updated 8 years ago
- A self-taught project codes to learn Java.☆8Updated last year
- 大规模分布式系统的跟踪、监控、告警平台☆55Updated 10 years ago
- 个性化的促销信息推荐系统☆27Updated 7 years ago
- 推荐系统相关代码☆23Updated 9 years ago
- 基于SpringBoot(2.0.3)的微服务的单应用秒杀、分布式秒杀示例☆11Updated 9 months ago
- 文本去重算法,研究自推荐系统中新闻的去重,采用了雅虎的Near-duplicates and shingling算法,服务端用c实现,客户端用java实现,利用thrift框架进行通信,为了提高扩展性,去重可以在服务端 实现,服务器也提供了计算的接口,方便客户端自己扩展☆23Updated 10 years ago
- 读书笔记系列之JDK,高性能编程☆34Updated 7 years ago
- 常用开发工具包的封装☆28Updated 6 years ago
- 支付订单系统分表分库高并发实现☆13Updated 2 years ago
- Asura Framework 是我们在实际使用过程中,抽取出来的公共组件☆22Updated 5 years ago
- 关注国内外k12先进教育理念的思考与分享☆18Updated 8 years ago
- 国外互联网公司大数据技术架构研究☆19Updated 4 years ago
- 保障服务的持续高可用、高性能及负载均衡☆17Updated 8 years ago
- 参照官方wiki的motan使用demo☆14Updated 8 years ago