Roc-J / HadoopLinks
主要学习大数据生态内容,一步步搭建大数据框架。
☆24Updated 6 years ago
Alternatives and similar repositories for Hadoop
Users that are interested in Hadoop are comparing it to the libraries listed below
Sorting:
- spark算子使用例子, spark RDD的算子挺多,有时候如何灵活的使用,该如何用一下子想不起来,这一段时间将spark的算子如何使用的例子给记录了下来,下面是spark RDD 的一些常用算子的使用 这些算子包括有java的,也有scala的语言(博客中才有),由于精…☆36Updated 6 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆86Updated 7 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- spark机器学习算法研究和源码分析☆32Updated 8 years ago
- 阿里巴巴大数据竞赛☆62Updated 11 years ago
- hbase + spark 实现常用推荐算法(主要用于精准广告投放和推荐系统)☆67Updated 8 years ago
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 8 years ago
- Spark机器学习书代码☆25Updated 7 years ago
- 按知识领域整理面试题,包括C++、Java、Hadoop、机器学习等☆21Updated 8 years ago
- 大数据招聘信息分析平台☆43Updated 9 years ago
- Flink电商项目,实时统计分析 + 风控☆25Updated 5 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- 使用Spark GraphX基于PageRank算法构建一个仿微博用户好友的分布式推荐系统。☆24Updated 6 years ago
- 总结了一些Spark学习过程中的例子(附代码详细注释)☆23Updated 6 years ago
- 一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目☆14Updated 7 years ago
- 基于 Spark Streaming + ALS 的餐饮推荐系统☆88Updated 6 years ago
- Spark混合推荐系统大数据监控平台☆11Updated 7 years ago
- 自助搭建的 hadoop + spark + kafka + zookeeper + storm + hbase + hive + flume 集群,一主两从。☆30Updated 6 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆34Updated 2 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆65Updated 6 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- Spark Streaming + kafka + hbase☆15Updated 6 years ago
- Spark Sql进行离线日志分析,Java Web+Echarts+Ajax进行数据可视化展示☆27Updated 6 years ago
- 大数据生态圈学习☆18Updated 2 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 2 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- 同步Hive数据仓库数据到Elasticsearch的小工具☆21Updated 7 years ago
- Hadoop离线计算. 使用hadoop MR 进行数据清洗,再使用shell 脚本执行hive 进行数据统计,维度分析☆12Updated 6 years ago