thegodofwar / MR_HBase
hadoop中Map/Reduce使用示例,输入(DBInputFormat),输出(DBOutputFormat)为MySql数据库表、日志分析Grep、单词排序Sort...对HBase的基本操作,增、删、查、改,使用Map/Reduce批量导入数据到HBase表中...
☆14Updated 11 years ago
Alternatives and similar repositories for MR_HBase:
Users that are interested in MR_HBase are comparing it to the libraries listed below
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 6 years ago
- 用户画像代码,根据算法推算出用户的性别和年龄比率☆11Updated 7 years ago
- A basic java word count for spark☆15Updated 10 years ago
- 【易车】- Spark、flink、HBase、Hive、flume集成了一些Hadoop的原生api的一些demo(如HDFS、MapReduce:目前就这两个);同时测试一些异常功能☆16Updated 5 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆29Updated 6 years ago
- 数据仓库KETTLE ETL资源库☆14Updated 9 years ago
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- HBase数据库源代码学习研究(包括代码注释、文档、用于代码分析的测试用例)☆10Updated 7 years ago
- POC for all the stack of big data (kafka, spark, cassandra, hdfs, docker, springboot)☆12Updated 2 years ago
- 优化flink的多流操作(例如join),优化点不限于数据丢失问题,以及性能问题☆11Updated 5 years ago
- 业务风控系统☆11Updated 8 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆23Updated 2 years ago
- 数据处理平台☆16Updated 8 years ago
- spring+spark streaming+kafka 10版本集成 和异常问题处理☆17Updated 7 years ago
- dw etl 工具 mysql 增量、全量抽取 to hive. 合并 hive 数据表, 等数据平台清洗工具☆9Updated 8 years ago
- 基于袋鼠云提供的开源flinkStreamSQL项目,对其实时sql进行可视化功能开发;通过tcpip通信,前端页面选择需要连接的数据库信息,并写sql语句,点击提交后,后端自动执行集群启动和JobGraph提交,并返回结果给前端页面。实现了使用者即使不了解Kafka、fl…☆11Updated 5 years ago
- The Best Practice of HDP,企业级大数据平台实践指南☆10Updated 7 years ago
- Spark Sql进行离线日志分析,Java Web+Echarts+Ajax进行数据可视化展示☆27Updated 6 years ago
- json或SQL语言转为flink或者spark流/批任务☆12Updated 2 years ago
- docker-hadoop-spark-hive 快速构建你的大数据环境☆21Updated 5 years ago
- 数据库访问中间件,统一的标准sql查询,底层可以是不同的数据库包括mysql、ElasticSearch、kylin、presto等。☆15Updated 6 years ago
- 易观开源大数据互联网百亿级记录互传Backquarter项目☆19Updated 2 years ago
- SparkSQL数据分析案例☆23Updated 8 years ago
- Spark Streaming + kafka + hbase☆15Updated 6 years ago
- storm kafka hdfs examples☆21Updated 8 years ago
- tools for bigData☆37Updated 6 years ago
- 蜂鸟数据分析平台帮助企业快速完成多数据整合,建立统一数据口径,支持自助式数据准备(ETL), 并提供可视化分析,帮助企业构建贴合自身业务的企业洞察,并将数据决策覆盖各层员工及应用场景☆21Updated 5 years ago
- spark流数据处理,可以从flume-ng,kafka接收数据☆11Updated 9 years ago
- Streaming 相关项目☆15Updated 8 years ago
- 基于Spark的实时推荐系统,使用MovieLens作为测试数据集☆28Updated 2 years ago