xiaohei-info / spark-demo
spark高级数据分析
☆20Updated 8 years ago
Alternatives and similar repositories for spark-demo:
Users that are interested in spark-demo are comparing it to the libraries listed below
- Spark机器学习书代码☆25Updated 7 years ago
- Spark源代码中文注释☆42Updated 6 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 2 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- Use Scala API to read/write data from different databases,HBase,MySQL,etc.☆24Updated 7 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 5 years ago
- Spark MLlib Learning☆71Updated 8 years ago
- spark 机器学习:利用jupyter工作来讲解算法原理并运行相关例子☆104Updated 8 years ago
- 基于Spark MLlib ALS的音乐推荐系统☆29Updated 8 years ago
- Spark Streaming + kafka + hbase☆15Updated 6 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃 度等模型☆66Updated 7 years ago
- 本项目记录我学习hadoop和spark等开源框架的代码,因为也是最近才用github,之前都是荒废状态,故部分都是是之前写好的,现在上传至github☆85Updated 7 years ago
- 基于Spark的实时推荐系统,使用MovieLens作为测试数据集☆28Updated 2 years ago
- spark MLlib机器学习实践源码☆10Updated 8 years ago
- ☆31Updated 6 years ago
- hbase + spark 实现常用推荐算法(主要用于精准广告投放和推荐系统)☆66Updated 8 years ago
- Deep Learning Pipelines for Apache Spark☆58Updated 7 years ago
- High Performance Spark Streaming with Direct Kafka in Java☆39Updated 8 years ago
- spark机器学习算法研究和源码分析☆32Updated 8 years ago
- Spark 编程指南简体中文版☆33Updated 8 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆65Updated 6 years ago
- graphx知识图谱、图计算相关☆64Updated 7 years ago
- 基于Spark SQL,可通过输入SQL语句操作HBase表,目前提供对HBase表的查询、创建、删除以及数据插入(需要自己指定rowKey生成规则)的功能,数据删除,分布式导入大规模数据相关功能正在开发中☆12Updated 6 months ago
- spark将hdfs数据高性能灌入kafka,然后spark streaming/structured streaming高速消费,关注性能,欢迎提供性能/代码优化建议☆33Updated 6 years ago
- spark算子使用例子, spark RDD的算子挺多,有时候如何灵活的使用,该如何用一下子想不起来,这一段时间将spark的算子如何使用的例子给记录了下来,下面是spark RDD 的一些常用算子的使用 这些算子包括有java的,也有scala的语言(博客中才有),由于精…☆36Updated 6 years ago
- 总结了一些Spark学习过程中的例子(附代码详细注释)☆23Updated 6 years ago
- hbase+solr实现hbase的二级索引☆48Updated this week
- 基于 spark 推荐系统, 基于内容标签 CBCF 实现,协同过滤 UBCF 实现,协同过滤 IBCF 实现☆46Updated 8 years ago
- SparkStreaming中利用MySQL保存Kafka偏移量保证0数据丢失☆45Updated 7 years ago
- 大数据【企业级360°全方位用户画像】标签开发部分源码☆19Updated 4 years ago