cjl84914 / eplison
基于springbook+spark的机器学习应用开发
☆12Updated 2 years ago
Alternatives and similar repositories for eplison
Users that are interested in eplison are comparing it to the libraries listed below
Sorting:
- Zdal是支付宝自主研发的数据中间件产品,采用标准的JDBC规范,可以在分布式环境下看上去像传统数据库一样提供海量数据服务,是一种通用的分库分表数据库访问框架,解决单库单表数据库访问压力,Zdal主要提供分库分表,结果集合并,sql解析,数据库failover动态切换等功能…☆18Updated 6 years ago
- 专注大数据 Spark ML 机器学习:监督学习、无监督学习,主要有:分类算法、回归算法、聚类算法、推荐算法、频繁模式挖掘算法☆16Updated 4 years ago
- The Best Practice of HDP,企业级大数据平台实践指南☆10Updated 7 years ago
- 一个基于ElasticSearch的业务日志记录工具☆10Updated 6 years ago
- 【易车】- Spark、flink、HBase、Hive、flume集成了一些Hadoop的原生api的一些demo(如HDFS、MapReduce:目前就这两个);同时测试一些异常功能☆16Updated 6 years ago
- 在公司接了一个任务,完成一个项目数据同步的模块。要求是不能操作项目的数据库。怕操作不当,数据丢失。所以想到的方案是使用log4jdbc记录数据源的SQL语句到日志文件。然后按行读取日志文件中的数据,记录读取的Point,以便下次继续读取。读取的数据进入bigqueue队列,…☆12Updated 7 years ago
- 基于TBSchedule开发的一个分布式任务调度框架,可以解析任务间的依赖,并执行任务(执行Shell、bat脚本)☆12Updated 8 years ago
- DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、HDFS、Hive、OceanBase、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。☆23Updated 3 years ago
- 使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装☆32Updated 8 years ago
- 个人学习xxl-job源码 核心部分加上了中文注释☆16Updated 6 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆23Updated 2 years ago
- 大型分布式系统实时监控平台☆28Updated 2 years ago
- 线程池、任务、任务组、任务池,定时任务的类库☆23Updated 3 months ago
- 新零售大数据平台-运维监控平台的开发☆14Updated 6 years ago
- 数据处理平台☆16Updated 8 years ago
- 分布式、高可用的延迟调度系统、可以配合消息队列实现延迟任务队列☆12Updated last year
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆21Updated 6 years ago