zongtui / zongtui-webcrawlerView external linksLinks
基于hadoop思维的分布式网络爬虫。
☆85Mar 8, 2016Updated 9 years ago
Alternatives and similar repositories for zongtui-webcrawler
Users that are interested in zongtui-webcrawler are comparing it to the libraries listed below
Sorting:
- 分布式网络爬虫架构☆16Sep 26, 2016Updated 9 years ago
- 爬虫资料汇总☆17Dec 5, 2015Updated 10 years ago
- 个性化推荐算法的通用处理框架,基于Mahout和Lucene☆18May 25, 2015Updated 10 years ago
- 视频、音频、图片内容识别、语音转写、语音合成 / easy convert video audio image to text, and revert text to audio(base64)☆24Dec 3, 2025Updated 2 months ago
- word,excel转pdf☆11Oct 26, 2018Updated 7 years ago
- swift是一个轻量级的web框架,实现了 IOC、MVC、ORM、AOP、RabbitMQ 功能,并且已经可以使用,满足基本的开发需要和学习使用,适合了解spring的基本原理。 未来将会逐步实现 安全管理 等功能。 如果你想观看源码,可以从 org.swift.fram…☆11Oct 24, 2023Updated 2 years ago
- 文件微服务,实现基于云服务和本地文件存储的微服务☆10Sep 8, 2016Updated 9 years ago
- data collect and data analysis☆10Aug 10, 2015Updated 10 years ago
- apple-boot启动过程中发布广播,apple-monitor接收广播信息,然后通过jmx自动监控应用☆10Oct 22, 2018Updated 7 years ago
- 天猫爬虫☆17Feb 4, 2013Updated 13 years ago
- ☆11May 21, 2018Updated 7 years ago
- 抓取代理ip,保存有效可用的代理ip☆13Aug 22, 2014Updated 11 years ago
- Imitate the Alibaba Machine learning AIPAI demo,仿阿里云机器学习平台PAI实现代码☆10Mar 12, 2021Updated 4 years ago
- Redis Monitoring Extension for AppDynamics☆17Jan 10, 2025Updated last year
- springboot邮件发送☆10Dec 8, 2018Updated 7 years ago
- 开源框架之手写系列,主要手写了springmvc,mybatis,rpc框架的实现,目前是跟着简书上一位博主的博客进行练习,先学习一下后期在做功能性的扩展。有兴趣的同学可以参考博主的博客学习一下,加深一下自己对开源框架底层实现的掌握☆11Jan 3, 2018Updated 8 years ago
- 增加视频捕捉的车牌识别,基于ezpr的完善。通过捕捉帧,解决数据转化的难点,进而由Easypr开源库进行一系列识别处理。具体能效可进一步自行优化。☆15May 31, 2017Updated 8 years ago
- Http proxy server based on netty☆10Sep 17, 2016Updated 9 years ago
- EserKnife☆14May 11, 2018Updated 7 years ago
- Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源(包括 Hadoop 和各类文件)和在线数据源(如 Kafka)中攫取数据进行分析。Pinot 被设计是可以进行水平扩展的☆16Nov 8, 2015Updated 10 years ago
- poseidonX 是一个基于jstorm和flink的一体化实时计算服务平台☆56Jul 23, 2018Updated 7 years ago
- 使用一致性哈希consistent-hashing来实现分布式redis,基于spring使用的缓存工具☆14Aug 3, 2017Updated 8 years ago
- a simple distributed spider in Java. Java编写的一个简单分布式爬虫☆159Jun 18, 2013Updated 12 years ago
- 京东商品爬虫服务☆13Jul 23, 2017Updated 8 years ago
- 用来检测java对象占用内存情况的小工具☆16Mar 1, 2013Updated 12 years ago
- 网络舆情爬虫 实现元搜索(MetaSearch)和随机URL(主要是五大门户网站)的抓取。☆13Sep 26, 2016Updated 9 years ago
- 微信短视 频后端☆14Oct 11, 2023Updated 2 years ago
- 一个简易的搜索引擎,采用Java开发☆32Mar 7, 2014Updated 11 years ago
- 由java构建的轻量级消息队列,支持订阅和点对点模式☆33Mar 18, 2019Updated 6 years ago
- 我的vim配置☆17Jul 31, 2019Updated 6 years ago
- Drools-开源业务规则引擎☆16Feb 26, 2020Updated 5 years ago
- 🔥 DNA微分催化与肽计算, 元基花计算,进化计算,遗传计算,智慧计算,索引计算,元基编码,肽展公式,大数据计算分析☆18Nov 12, 2025Updated 3 months ago
- Programmable CMDB☆18Jun 15, 2020Updated 5 years ago
- java分布式爬虫,主机和从机控制的机制☆14May 21, 2015Updated 10 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Jun 1, 2015Updated 10 years ago
- netty实现简单的http代理☆15Sep 15, 2015Updated 10 years ago
- 使用Apache Thrift作为容器,Google Protobuf作为协议的一个RPC框架。☆19Jun 2, 2018Updated 7 years ago
- rpc_learn Spring + Netty + Protostuff + ZooKeeper 实现了一个轻量级 RPC 框架,使用 Spring 提供依赖注入与参数配置,使用 Netty 实现 NIO 方式的数据传输,使用 Protostuff 实现对象序列化,使用 …☆19May 26, 2015Updated 10 years ago
- 学习Tomcat8源码☆19Jan 21, 2022Updated 4 years ago