yangguang2014 / distributedCrawler
华南理工大学高英实验室进行的分布式爬虫项目,除了实验室内部人员外,不得私自传播.
☆21Updated 10 years ago
Related projects ⓘ
Alternatives and complementary repositories for distributedCrawler
- 读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘☆47Updated 9 years ago
- Search Engine for Chinese base on Solr(基于solr的中文搜索引擎框架)☆27Updated 11 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆19Updated 8 years ago
- 分布式session管理☆11Updated 9 years ago
- A self-taught project codes to learn Java.☆8Updated last year
- it's a simple and easy net framework with nio mode written by java☆41Updated 7 years ago
- 国外互联网公司大数据技术架构研究☆19Updated 3 years ago
- 文本去重算法,研究自推荐系统中新闻的去重,采用了雅虎的Near-duplicates and shingling算法,服务端用c实现,客户端用java实现,利用thrift框架进行通信,为了提高扩展性,去重可以在服务端实现,服务器也提供了计算的接口,方便客户端自己扩展☆22Updated 10 years ago
- 通过web服务器对word分词的资源进行集中统一管理☆17Updated 7 years ago
- 微博情感分析☆12Updated 11 years ago
- 新版代码生成器☆10Updated 6 years ago
- 大规模分布式系统的跟踪、监控、告警平台☆55Updated 10 years ago
- 自定制的精准短文本搜索服务☆18Updated 3 years ago
- dubbo服务间的分布式事物☆11Updated 9 years ago
- 推荐算法☆29Updated 9 years ago
- MyBatis学习的源码,博客地址:http://blog.csdn.net/column/details/smybatis.html☆22Updated 8 years ago
- ☆12Updated 7 years ago
- 微博数据分析服务框架。☆12Updated 9 years ago
- java设计模式☆10Updated 8 years ago
- 网络爬虫☆50Updated 10 years ago
- Ralasafe访问控制中间件(数据级权限管理),是MIT协议开源免费软件产品。它使用图形化方式处理各种数据级权限管理问题,包括数据库行列级、字段内容级权限问题;它还能处理登录控制、 功能级权限控制和URL权限认证。☆30Updated 3 months ago
- 保障服务的持续高可用、高性能及负载均衡☆17Updated 7 years ago