JasonWiki / dw_etlLinks
dw etl 工具 mysql 增量、全量抽取 to hive. 合并 hive 数据表, 等数据平台清洗工具
☆9Updated 8 years ago
Alternatives and similar repositories for dw_etl
Users that are interested in dw_etl are comparing it to the libraries listed below
Sorting:
- 用户画像代码,根据算法推算出用户的性别和年龄比率☆11Updated 7 years ago
- spark流数据处理,可以从flume-ng,kafka接收数据☆11Updated 9 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- Spark Mllib 1.6.0版本算法封装☆11Updated 8 years ago
- Spark Streaming + kafka + hbase☆15Updated 6 years ago
- 大数据【企业级360°全方位用户画像】标签开发部分源码☆19Updated 4 years ago
- 使用spark streaming 导入kafka数据到hbase☆25Updated 9 years ago
- 蜂鸟数据分析平台帮助企业快速完成多数据整合,建立统一数据口径,支持自助式数据准备(ETL), 并提供可视化分析,帮助企业构建贴合自身业务的企业洞察,并将数据决策覆盖各层员工及应用场景☆21Updated 6 years ago
- 简单易用的ETL工具☆17Updated 6 years ago
- hbase + spark 实现常用推荐算法(主要用于精准广告投放和推荐系统)☆67Updated 8 years ago
- 总结了一些Spark学习过程中的例子(附代码详细注释)☆23Updated 6 years ago
- 【易车】- Spark、flink、HBase、Hive、flume集成了一些Hadoop的原生api的一些demo(如HDFS、MapReduce:目前就这两个);同时测试一些异常功能☆16Updated 6 years ago
- ☆11Updated 8 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 8 years ago
- 易观开源大数据互联网百亿级记录互传Backquarter项目☆19Updated 2 years ago
- 同步Hive数据仓库数据到Elasticsearch的小工具☆21Updated 7 years ago
- Spark1.6和spark2.2的示例,包含kafka,flume,structuredstreaming,jedis,elasticsearch,mysql,dataframe☆15Updated 7 years ago
- 基于袋鼠云提供的开源flinkStreamSQL项目,对其实时sql进行可视化功能开发;通过tcpip通信,前端页面选择需要连接的数据库信息,并写sql语句,点击提交后,后端自动执行集群启动和JobGraph提交,并返回结果给前端页面。实现了使用者即使不了解Kafka、fl…☆11Updated 5 years ago
- conbine flume,spark-streaming and redis for real-time computing☆22Updated 10 years ago
- Kafka, Storm, Zookeeper, and Openfire running in Docker☆14Updated 9 years ago
- 分布式大数据SQL查询可视化界面!☆68Updated 9 years ago
- 基于 spark 混合查询平台,支持不同源数据库的联合查询,mysql hive presto ...☆14Updated 7 years ago
- 使用Spark的MLlib、Hbase作为模型、Hive作数据清洗的核心推荐引擎,在Spark on Yarn测试通过☆30Updated 8 years ago
- 基于Spark和Kubernetes的机器学习平台☆30Updated 7 years ago
- 微博情感分析☆12Updated 11 years ago
- ☆21Updated 8 years ago
- 基于Spark MLlib ALS的音乐推荐系统☆29Updated 9 years ago
- 自助搭建的 hadoop + spark + kafka + zookeeper + storm + hbase + hive + flume 集群,一主两从。☆30Updated 6 years ago
- 新零售大数据平台-运维监控平台的开发☆14Updated 6 years ago
- 一个比Spark-Parquet还快5~100倍的存储格式☆12Updated 9 years ago