基于hadoop思维的分布式网络爬虫。
☆85Mar 8, 2016Updated 10 years ago
Alternatives and similar repositories for zongtui-webcrawler
Users that are interested in zongtui-webcrawler are comparing it to the libraries listed below
Sorting:
- 分布式网络爬虫架构☆16Sep 26, 2016Updated 9 years ago
- 个性化推荐算法的通用处理框架,基于Mahout和Lucene☆18May 25, 2015Updated 10 years ago
- Strom 实时风控统计☆21Nov 30, 2017Updated 8 years ago
- 视频、音频、图片内容识别、语音转写、语音合成 / easy convert video audio image to text, and revert text to audio(base64)☆24Dec 3, 2025Updated 3 months ago
- swift是一个轻量级的web框架,实现了 IOC、MVC、ORM、AOP、RabbitMQ 功能,并且已经可以使用,满足基本的开发需要和学习使用,适合了解spring的基本原理。 未来将会逐步实现 安全管理 等功能。 如果你想观看源码,可以从 org.swift.fram…☆11Oct 24, 2023Updated 2 years ago
- word,excel转pdf☆11Oct 26, 2018Updated 7 years ago
- 文件微服务,实现基于云服务和本地文件存储的微服务☆10Sep 8, 2016Updated 9 years ago
- 天猫爬虫☆17Feb 4, 2013Updated 13 years ago
- apple-boot启动过程中发布广播,apple-monitor接收广播信息,然后通过jmx自动监控应用☆10Oct 22, 2018Updated 7 years ago
- ☆11May 21, 2018Updated 7 years ago
- data collect and data analysis☆10Aug 10, 2015Updated 10 years ago
- 抓取代理ip,保存有效可用的代理ip☆13Aug 22, 2014Updated 11 years ago
- 个人收集的觉得不错的技术站点或技术博客☆219Feb 1, 2018Updated 8 years ago
- Imitate the Alibaba Machine learning AIPAI demo,仿阿里云机器学习平台PAI实现代码☆10Mar 12, 2021Updated 4 years ago
- springboot邮件发送☆10Dec 8, 2018Updated 7 years ago
- Redis Monitoring Extension for AppDynamics☆17Jan 10, 2025Updated last year
- Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源(包括 Hadoop 和各类文件)和在线数据源(如 Kafka)中攫取数据进行分析。Pinot 被设计是可以进行水平扩展的☆16Nov 8, 2015Updated 10 years ago
- Http proxy server based on netty☆10Sep 17, 2016Updated 9 years ago
- Shaded version of Apache Hive for Presto☆19Updated this week
- poseidonX 是一个 基于jstorm和flink的一体化实时计算服务平台☆56Jul 23, 2018Updated 7 years ago
- 使用一致性哈希consistent-hashing来实现分布式redis,基于spring使用的缓存工具☆14Aug 3, 2017Updated 8 years ago
- 基于逐渐熟悉深入多线程,缓存,数据库,网络编程等相关内容 尝试着积累一些自己研究的工具集合或框架☆10Oct 1, 2016Updated 9 years ago
- EserKnife☆14May 11, 2018Updated 7 years ago
- 开源框架之手写系列,主要手写了springmvc,mybatis,rpc框架的实现,目前是跟着简书上一位博主的博客进行练习,先学习一下后期在做功能性的扩展。有兴趣的同学可以参考博主的博客学习一下,加深一下自己对开源框架底层实现的掌握☆11Jan 3, 2018Updated 8 years ago
- a simple distributed spider in Java. Java编写的一个简单分布式爬虫☆159Jun 18, 2013Updated 12 years ago
- A distributed key-value store☆31Jan 3, 2018Updated 8 years ago
- 微信短视频后端☆14Oct 11, 2023Updated 2 years ago
- 京东商品爬虫服务☆13Jul 23, 2017Updated 8 years ago
- From packpub book☆15Mar 9, 2016Updated 10 years ago
- 用来检测java对象占用内存情况的小工具☆16Mar 1, 2013Updated 13 years ago
- 由java构建的轻量级消息队列,支持订阅和点对点模式☆33Mar 18, 2019Updated 6 years ago
- 一个简易的搜索引擎,采用Java开发☆32Mar 7, 2014Updated 12 years ago
- java分布式爬虫,主机和从机控制的机制☆14May 21, 2015Updated 10 years ago
- Programmable CMDB☆18Jun 15, 2020Updated 5 years ago
- 🔥 DNA微分催化与肽计算, 元基花计算,进化计算,遗传计算,智慧计算,索引计算,元基编码,肽展公式,大数据计算分析☆18Nov 12, 2025Updated 3 months ago
- Drools-开源业务规则引擎☆16Feb 26, 2020Updated 6 years ago
- netty实现的http动态代理服务器☆18Apr 3, 2019Updated 6 years ago
- rpc_learn Spring + Netty + Protostuff + ZooKeeper 实现了一个轻量级 RPC 框架,使用 Spring 提供依赖注入与参数配置,使用 Netty 实现 NIO 方式的数据传输,使用 Protostuff 实现对象序列化,使用 …☆19May 26, 2015Updated 10 years ago
- 学习Tomcat8源码☆19Jan 21, 2022Updated 4 years ago