sev7e0 / wow-spark
spark自学手册,包含了例如spark core、spark sql、spark streaming、spark-kafka、delta-lake,以及scala基础练习,还有一些例如master、shuffle源码分析,总结及翻译。
☆18Updated last year
Related projects: ⓘ
- Encapsulated spark 与其他组件的结合api,方便使用,例如 es,hbase,kudu,kafka,mq等☆35Updated 4 years ago
- 记录Spark、Flink研究经验☆25Updated 5 years ago
- spark将hdfs数据高性能灌入kafka,然后spark streaming/structured streaming高速消费,关注性能,欢迎提供性能/代码优化建议☆33Updated 5 years ago
- 简单易用的ETL工具☆17Updated 5 years ago
- spark算子使用例子, spark RDD的算子挺多,有时候如何灵活的使用,该如何用一下子想不起来,这一段时间将spark的算子如何使用的例子给记录了下来,下面是spark RDD 的一些常用算子的使用 这些算子包括有java的,也有scala的语言(博客中才有),由于精…☆35Updated 6 years ago
- 基于SparkSQL的电影分析项目实战☆38Updated 3 years ago
- Learning Flink : Flink CEP,Flink Core,Flink SQL☆71Updated 2 years ago
- Spark(multi versions) + Streaming/Hive/SQL/UDF Demos☆15Updated 6 years ago
- A web application for submitting spark application☆8Updated 3 years ago
- SparkStreaming中利用MySQL保存Kafka偏移量保证0数据丢失☆45Updated 7 years ago
- SparkSQL数据分析案例☆23Updated 7 years ago
- A playground for Spark jobs.☆44Updated 5 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆35Updated 6 years ago
- ☆24Updated this week
- Flink Sql 教程☆34Updated 2 years ago
- Spark1.6和spark2.2的示例,包含kafka,flume,structuredstreaming,jedis,elasticsearch,mysql,dataframe☆15Updated 6 years ago
- 易观开源大数据互联网百亿级记录互传Backquarter项目☆18Updated 2 years ago
- 基于flink的用户行为分析☆50Updated last year
- A HBase datasource implementation for Spark and [MLSQL](http://www.mlsql.tech).☆13Updated 11 months ago
- 大数据框架 Spark MLlib 机器学习库基础算法全面讲解,附带齐全的测试文件☆37Updated 5 months ago
- ☆33Updated 5 years ago
- kafka传数据到Flink存储到mysql之Flink使用SQL语句聚合数据流(设置时间窗口,EventTime)☆31Updated 6 years ago
- Spark Streaming + kafka + hbase☆15Updated 5 years ago
- 使用Flink实现用户行为分析☆10Updated 4 years ago
- 总结了一些Spark学习过程中的例子(附代码详细注释)☆24Updated 6 years ago
- ☆30Updated this week
- 基于Spark SQL,可通过输入SQL语句操作HBase表,目前提供对HBase表的查询、创建、删除以及数据插入(需要自己指定rowKey生成规则)的功能,数据删除,分布式导入大规模数据相关功能正在开发中☆12Updated last week
- An easy-to-use, scalable spark streaming ETL tool and sdk☆12Updated 7 years ago
- 《Spark大数据分析源码解析与实例详解》图书配套实例资源☆38Updated 2 years ago
- 因现有的datax、sqoop满足不了需求,使用spark封装了一个数据同步工具。☆9Updated 5 years ago