thegodofwar / MR_HBase
hadoop中Map/Reduce使用示例,输入(DBInputFormat),输出(DBOutputFormat)为MySql数据库表、日志分析Grep、单词排序Sort...对HBase的基本操作,增、删、查、改,使用Map/Reduce批量导入数据到HBase表中...
☆14Updated 12 years ago
Alternatives and similar repositories for MR_HBase
Users that are interested in MR_HBase are comparing it to the libraries listed below
Sorting:
- HBase数据库源代码学习研究(包括代码注释、文档、用于代码分析的测试用例)☆10Updated 8 years ago
- 业务风控系统☆11Updated 8 years ago
- POC for all the stack of big data (kafka, spark, cassandra, hdfs, docker, springboot)☆12Updated 2 years ago
- The Best Practice of HDP,企业级大数据平台实践指南☆10Updated 7 years ago
- A HBase datasource implementation for Spark and [MLSQL](http://www.mlsql.tech).☆14Updated last year
- 【易车】- Spark、flink、HBase、Hive、flume集成了一些Hadoop的原生api的一些demo(如HDFS、MapReduce:目前就这两个);同时测试一些异常功能☆16Updated 6 years ago
- 数据处理平台☆16Updated 8 years ago
- Spark混合推荐系统大数据监控平台☆11Updated 7 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- 直接在Hadoop执行SQL,不依赖于Hive和Hbase,纯SQL转MapReduce操作。☆12Updated 8 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆29Updated 7 years ago
- phoenix 操作hbase和springboot的整合☆11Updated 7 years ago
- json或SQL语言转为flink或者spark流/批任务☆12Updated 2 years ago
- 微博数据分析服务框架。☆12Updated 9 years ago
- java分布式爬虫,主机和从机控制的机制☆14Updated 9 years ago
- flink-docker-compose-demo☆10Updated 6 years ago
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- 文本去重算法,研究自推荐系统中新闻的去重,采用了雅虎的Near-duplicates and shingling算法,服务端用c实现,客户端用java实现,利用thrift框架进行通信,为了提高扩展性,去重可以在服务端实现,服务器也提供了计算的接口,方便客户端自己扩展☆24Updated 11 years ago
- 优化flink的多流操作(例如join),优化点不限于数据丢失问题,以及性能问题☆11Updated 6 years ago
- SpringBoot + Apache Mahout 推荐引擎 基于用户评分数据推荐相关电影☆11Updated 6 years ago
- 分布式爬虫框架,基于webdrvier模拟用户请求,kafka消息传递,分布式网页存储使用hbase,task异步任务多线程解析,提供基础服务如:proxy ip服务和号码验证服务等, proxy page使用H5和we版进行接入☆13Updated 9 years ago
- 数据库访问中间件,统一的标准sql查询,底层可以是不同的数据库包括mysql、ElasticSearch、kylin、presto等。☆15Updated 7 years ago
- zookeeper官方提供的分布式锁,选举master,和分布式队列实现☆17Updated 11 years ago
- 拉比克是一个开源大数据平台构建方案,已稳定应用于生产集群。融合Hadoop、Hive、Hbase、zookeeper等如CDH☆14Updated 6 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆23Updated 2 years ago
- 就是想看看与自己写的搜索与lucene差距有多大? java与C++的性能方面差距有多大?而造的搜索引擎轮子☆8Updated 9 years ago
- 大数据生态圈学习☆18Updated 2 years ago
- A basic java word count for spark☆15Updated 10 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆20Updated 8 years ago
- 用户行为分析系统☆12Updated 9 years ago