codingdie / DiggerLinks
一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目
☆14Updated 7 years ago
Alternatives and similar repositories for Digger
Users that are interested in Digger are comparing it to the libraries listed below
Sorting:
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆87Updated 8 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- 模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏…☆138Updated 5 years ago
- spark机器学习算法研究和源码分析☆31Updated 8 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆69Updated 8 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆68Updated 3 years ago
- 大数据招聘信息分析平台☆46Updated 9 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆215Updated 2 years ago
- hadoop_storm_spark结合实验的例子,模拟淘宝双11节,根据订单详细信息,汇总出总销售量,各个省份销售排行,以及后期的SQL分析,数据分析,数据挖掘等。 --------大概流程------- 第一阶段(storm实时报表) 第二阶段(离线报表)第三阶段(大规…☆326Updated 10 years ago
- A big data platform for analyzing web access logs☆54Updated 3 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 3 years ago
- 使用Spark GraphX基于PageRank算法构建一个仿微博用户好友的分布式推荐系统。☆24Updated 7 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 10 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆66Updated 7 years ago
- hbase + spark 实现常用推荐算法(主要用于精准广告投放和推荐系统)☆69Updated 9 years ago
- hive仓库元数据管理系统☆167Updated 9 years ago
- 用户画像相关的参考代码☆156Updated 3 years ago
- 基于wifi抓取信息的大数据查询分析系统☆111Updated 8 years ago
- SparkSQL数据分析案例☆23Updated 9 years ago
- 微博数据展示与舆情监控系统后台API☆66Updated 7 years ago
- 使用Spark Graphx 分析金庸”射雕三部曲“☆46Updated 5 years ago
- 分布式数据仓库最佳实践☆58Updated 7 years ago
- Spark 学习之路,包含 Spark Core,Spark SQL,Spark Streaming,Spark mllib 学习笔记☆145Updated 7 years ago
- 系统从互联网爬取资讯,对热点公共事件进行检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆100Updated 7 years ago
- 电商大数据项目-推荐系统(java和scala语言)☆204Updated 2 years ago
- 清华大数据作业MapReduce处理几百个G的JSON数据☆50Updated 9 years ago
- spark全示例代码(java、scala) Spark most full instance code DEMO (java、scala)☆85Updated 5 years ago
- 基于 Spark Streaming + ALS 的餐饮推荐系统☆87Updated 7 years ago
- 阿里巴巴大数据竞赛☆63Updated 11 years ago
- 基于WIFI探针的商业大数据分析技术☆300Updated 3 years ago