guofei1219 / SparkSQLLinks
SparkSQL数据分析案例
☆23Updated 8 years ago
Alternatives and similar repositories for SparkSQL
Users that are interested in SparkSQL are comparing it to the libraries listed below
Sorting:
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Updated 7 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- Streaming 相关项目☆15Updated 8 years ago
- 四川大学拓思爱诺用户session行为数据离线分析项目☆67Updated 3 years ago
- Spark structured-streaming 消费kafka数据写入hbase☆33Updated 6 years ago
- kafka传数据到Flink存储到mysql之Flink使用SQL语句聚合数据流(设置时间窗口,EventTime)☆32Updated 7 years ago
- 使用spark streaming 导入kafka数据到hbase☆25Updated 9 years ago
- SparkStreaming中利用MySQL保存Kafka偏移量保证0数据丢失☆45Updated 7 years ago
- hbase+solr实现hbase的二级索引☆48Updated 3 months ago
- Spark Streaming监控平台,支持任务部署与告警、自启动☆128Updated 7 years ago
- Use Scala API to read/write data from different databases,HBase,MySQL,etc.☆24Updated 7 years ago
- 同步Hive数据仓库数据到Elasticsearch的小工具☆21Updated 7 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆96Updated 2 years ago
- 分布式数据仓库最佳实践☆57Updated 7 years ago
- Learning Flink : Flink CEP,Flink Core,Flink SQL☆72Updated 3 years ago
- 易观开源大数据互联网百亿级记录互传Backquarter项目☆19Updated 3 years ago
- spark将hdfs数据高性能灌入kafka,然后spark streaming/structured streaming高速消费,关注性能,欢迎提供性能/代码优化建议☆33Updated 6 years ago
- Spark Streaming + kafka + hbase☆15Updated 6 years ago
- 因现有的datax、sqoop满足不了需求,使用spark封装了一个数据同步工具。☆9Updated 6 years ago
- Flink 案例代码☆43Updated 3 years ago
- 总结了一些Spark学习过程中的例子(附代码详细注释)☆23Updated 6 years ago
- spark算子使用例子, spark RDD的算子挺多,有时候如何灵活的使用,该如何用一下子想不起来,这一段时间将spark的算子如何使用的例子给记录了下来,下面是spark RDD 的一些常用算子的使用 这些算子包括有java的,也有scala的语言(博客中才有),由于精…☆36Updated 6 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆30Updated 7 years ago
- 手动管理spark streaming集成kafka的数据偏移量到zookeeper中☆22Updated 7 years ago
- 使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装☆33Updated 8 years ago
- 基于CDH5.x parcles安装,一键卸载脚本☆38Updated 2 years ago
- Encapsulated spark 与其他组件的结合api,方便使用,例如 es,hbase,kudu,kafka,mq等☆35Updated 5 years ago
- 基于袋鼠云提供的开源flinkStreamSQL项目,对其实时sql进行可视化功能开发;通过tcpip通信,前端页面选择需要连接的数据库信息,并写sql语句,点击提交后,后端自动执行集群启动和JobGraph提交,并返回结果给前端页面。实现了使用者即使不了解Kafka、fl…☆11Updated 6 years ago
- The Best Practice of HDP,企业级大数据平台实践指南☆10Updated 7 years ago
- 信托数据仓库及商业智能☆32Updated 7 years ago