使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装
☆33May 6, 2017Updated 8 years ago
Alternatives and similar repositories for sparkForDB
Users that are interested in sparkForDB are comparing it to the libraries listed below
Sorting:
- 此工程采用SpringBoot + Mybatis + SparkSQL + Hive框架进行集成,支持Kerberos认证。☆21Mar 19, 2018Updated 7 years ago
- 基于springbook+spark的机器学习应用开发☆12Nov 21, 2022Updated 3 years ago
- 专注大数据 Spark ML 机器学习:监督学习、无监督学习,主要有:分类算法、回归算法、聚类算法、推荐算法、频繁模式挖掘算法☆17Nov 6, 2020Updated 5 years ago
- 一个基于ElasticSearch的业务日志记录工具☆10Nov 5, 2018Updated 7 years ago
- 在规格文件上直接执行SQL,无数据库依赖,基于Java8的流计算和Lamdba表达式。☆10Jun 15, 2017Updated 8 years ago
- POC for all the stack of big data (kafka, spark, cassandra, hdfs, docker, springboot)☆12Dec 16, 2022Updated 3 years ago
- 基于sqoop封装的一个通用的抽取工具,方便数据平台界面提交任务以及数据源管理☆10May 2, 2017Updated 8 years ago
- ☆13Aug 13, 2018Updated 7 years ago
- ☆12May 11, 2016Updated 9 years ago
- SparkStreaming中利用MySQL保存Kafka偏移量保证0数据丢失☆44Aug 2, 2017Updated 8 years ago
- better performance for kylin query☆15Jun 14, 2019Updated 6 years ago
- 测试 Spring 事务的各种传播行为☆13Apr 27, 2014Updated 11 years ago
- a syslog server&client which is used to receive/convert/send the logs.☆12Dec 14, 2022Updated 3 years ago
- SpringBoot + Apache Mahout 推荐引擎 基于用户评分数据推荐相关电影☆11Jun 7, 2018Updated 7 years ago
- 基于redis的分布式锁,适用于秒杀,自增ID等web分布式开发场景☆11Mar 21, 2017Updated 8 years ago
- Showing the relationship between ImageNet ID and labels and pytorch pre-trained model output ID and labels☆10Oct 11, 2020Updated 5 years ago
- SpringBoot + OpenNLP + Neo4j + Spark朴素贝叶斯分类器实现石油相关论文的智能分析问答系统☆30Nov 6, 2018Updated 7 years ago
- Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源(包括 Hadoop 和各类文件)和在线数据源(如 Kafka)中攫取数据进行分析。Pinot 被设计是可以进行水平扩展的☆16Nov 8, 2015Updated 10 years ago
- 企业级通用报表系统☆15Feb 2, 2024Updated 2 years ago
- 在公司接了一个任务,完成一个项目数据同步的模块。要求是不能操作项目的数据库。怕操作不当,数据丢失。所以想到的方案是使用log4jdbc记录数据源的SQL语句到日志文件。然后按行读取日志文件中的数据,记录读取的Point,以便下次继续读取。读取的数据进入bigqueue队列,…☆12Aug 10, 2017Updated 8 years ago
- 基于canal.deployer-1.1.1-SNAPSHOT.tar,canal连接kafka,springboot消费kafka数据入hbase和ElasticSearch☆15Dec 19, 2018Updated 7 years ago
- 拉比克是一个开源大数据平台构建方案,已稳定应用于生产集群。融合Hadoop、Hive、Hbase、zookeeper等如CDH☆14Mar 11, 2019Updated 6 years ago
- sql 解析引擎 探索☆16Dec 29, 2017Updated 8 years ago
- 电商+大数据+spark机器学习☆17Dec 5, 2017Updated 8 years ago
- Kafka, Spark Streaming, Kudu integration examples☆17Dec 22, 2017Updated 8 years ago
- 监控维度:1.监控内容信息采集;2.监控对象Url,Spring,数据源,异常,jvm,服务信息;3.监控策略处理☆12Nov 2, 2018Updated 7 years ago
- 天池大数据淘宝穿衣搭配算法☆12Oct 14, 2015Updated 10 years ago
- Spark structured-streaming 消费kafka数据写入hbase☆33Jan 22, 2019Updated 7 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆95Jul 18, 2022Updated 3 years ago
- 【易车】- Spark、flink、HBase、Hive、flume集成了一些Hadoop的原生api的一些demo(如HDFS、MapReduce:目前就这两个);同时测试一些异常功能☆16Apr 4, 2019Updated 6 years ago
- elasticsearch-jdbc,在elasticsearch-sql的jdbc实验特性基础上完成,可使用sql和rest api的方式执行elasticsearch操作☆18Mar 8, 2019Updated 6 years ago
- 人大数据挖掘中心主页☆19Apr 12, 2023Updated 2 years ago
- rocketmq后台管理,从阿里开源修改。换成rest风格访问,增加拦截器登录配置☆15Jul 1, 2016Updated 9 years ago
- Encapsulated spark 与其他组件的结合api,方便使用,例如 es,hbase,kudu,kafka,mq等☆35Dec 18, 2019Updated 6 years ago
- 视频教育网站☆17Sep 25, 2018Updated 7 years ago
- Streaming 相关项目☆15Mar 27, 2017Updated 8 years ago
- Zdal是支付宝自主研发的数据中间件产品,采用标准的JDBC规范,可以在分布式环境下看上去像传统数据库一样提供海量数据服务,是一种通用的分库分表数据库访问框架,解决单库单表数据库访问压力,Zdal主要提供分库分表,结果集合并,sql解析,数据库failover动态切换等功能…☆18Dec 17, 2018Updated 7 years ago
- spark streaming从kafka读取消息,offset写入Redis,spark计算单词出现频率,最后写入hive表☆17Jul 30, 2019Updated 6 years ago
- spring+spark streaming+kafka 10版本集成和异常问题处理☆17Jul 21, 2017Updated 8 years ago