codingdie / Digger
一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目
☆14Updated 6 years ago
Related projects ⓘ
Alternatives and complementary repositories for Digger
- 电商+大数据+spark机器学习☆16Updated 6 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆84Updated 6 years ago
- 1、支持网页爬虫 2、多线程、线程池 3、支持全文搜索 4、支持Hadoop分布式平台、HDFS/MapReduce、Zookeeper、HBase 5、支持redis分布式缓存 6、集成微信公众号开发 7、Spring4新特性 8、ActiveMQ 9、Nginx详细配置…☆16Updated 2 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆74Updated 2 years ago
- 信托数据仓库及商业智能☆32Updated 6 years ago
- 大数据建模分析平台☆60Updated 5 years ago
- SparkSQL数据分析案例☆23Updated 7 years ago
- Spark Sql进行离线日志分析,Java Web+Echarts+Ajax进行数据可视化展示☆27Updated 6 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 6 years ago
- 大数据招聘信息分析平台☆40Updated 8 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆34Updated last year
- 蜂鸟数据分析平台帮助企业快速完成多数据整合,建立统一数据口径,支持自助式数据准备(ETL), 并提供可视化分析,帮助企业构建贴合自身业务的企业洞察,并将数据决策覆盖各层员工及应用场景☆21Updated 5 years ago
- 数据仓库KETTLE ETL资源库☆14Updated 9 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆29Updated 6 years ago
- 以慕课网日志分析为例 进入大数据 Spark SQL 的世界☆15Updated 6 years ago
- 易观开源大数据互联网百亿级记录互传Backquarter项目☆18Updated 2 years ago
- spark机器学习算法研究和源码分析☆32Updated 7 years ago
- A big data platform for analyzing web access logs☆52Updated last year
- 数据挖掘大作业基于协同过滤推荐算法的电 影推荐☆27Updated 10 years ago
- Flink电商项目,实时统计分析 + 风控☆23Updated 4 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆65Updated 7 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆52Updated last year
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆21Updated 5 years ago
- 主要学习大数据生态内容,一步步搭建大数据框架。☆23Updated 6 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆19Updated 8 years ago
- 分布式数据仓库最佳实践☆57Updated 6 years ago
- 商品关联关系挖掘,使用Spring Boot开发框架和Spark MLlib机器学习框架,通过FP-Growth算法,分析用户的购物车商品数据,挖掘商品之间的关联关系。项目对外提供RESTFul接口。☆34Updated 3 years ago
- 大数据框架 Spark MLlib 机器学习库基础算法全面讲解,附带齐全的测试文件☆37Updated 8 months ago