cjl84914 / eplison
基于springbook+spark的机器学习应用开发
☆12Updated 2 years ago
Alternatives and similar repositories for eplison:
Users that are interested in eplison are comparing it to the libraries listed below
- Zdal是支付宝自主研发的数据中间件产品,采用标准的JDBC规范,可以在分布式环境下看上去像传统数据库一样提供海量数据服务,是一种通用的分库分表数据库访问框架,解决单库单表数据库访问压力,Zdal主要提供分库分表,结果集合并,sql解析,数据库failover动态切换等功能…☆18Updated 6 years ago
- 专注大数据 Spark ML 机器学习:监督学习、无监督学习,主要有:分类算法、回归算法、聚类算法、推荐算法、频繁模式挖掘算法☆16Updated 4 years ago
- DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、HDFS、Hive、OceanBase、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。☆23Updated 3 years ago
- 基于TBSchedule开发的一个分布式任务调度框架,可以解析任务间的依赖,并执行任务(执行Shell、bat脚本)☆12Updated 8 years ago
- 用户画像代码,根据算法推算出用户的性别和年龄比率☆11Updated 7 years ago
- 基于jsqlparser 进行sql语句解析,得到字段间的血缘关系(即所查询字段来源于哪张表中的哪个字段)☆16Updated last year
- 基于Drools的 规则引擎+CEP+事件流☆23Updated 7 years ago
- The Best Practice of HDP,企业级大数据平台实践指南☆10Updated 7 years ago
- 使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装☆32Updated 7 years ago
- 【易车】- Spark、flink、HBase、Hive、flume集成了一些Hadoop的原生api的一些demo(如HDFS、MapReduce:目前就这两个);同时测试一些异常功能☆16Updated 5 years ago
- 一个优秀的大数据查询平台,提供hive异步任务查询、LDAP用户、数据权限控制、历史查询任务与结果存储、邮件通知、excel下载等功能。☆24Updated 7 years ago
- 蓝泰源大数据基础平台☆17Updated 6 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆34Updated 2 years ago
- Big data performance test analysis platform (including WebUI display)。 BigDataAnalysisWeb Analyze storm, spark, and flink throughput chan…☆20Updated 5 years ago
- 个人学习xxl-job源码 核心部分加上了中文注释☆16Updated 6 years ago
- spring+spark streaming+kafka 10版本集成和异常问题处理☆17Updated 7 years ago
- 大型分布式系统实时监控平台☆27Updated 2 years ago
- 数据的导出(支持DB2、MySQL、Oracle、Teradata数据库的数据导出)、合并(支持将多个小数据文件合并成一个大的数据文件)、传输(支持FTP、SFTP数据传输)程序,适用于向指定FTP服务器供数的情况,常见于多个源系统以数据文件的形式向数据仓库集中供数。该程序…☆25Updated 9 years ago
- 基于Kafka和MongoDB的结构化日志异步记录和预警框架☆10Updated 8 years ago
- 数据库访问中间件,统一的标准sql查询,底层可以是不同的数据库包括mysql、ElasticSearch、kylin、presto等。☆15Updated 6 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆29Updated 6 years ago
- 在公司接了一个任务,完成一个项目数据同步的模块。要求是不能操作项目的数据库。怕操作不当,数据丢失。所以想到的方案是使用log4jdbc记录数据源的SQL语句到日志文件。然后按行读取日志文件中的数据,记录读取的Point,以便下次继续读取。读取的数据进入bigqueue队列,…☆12Updated 7 years ago
- 线程池、任务、任务组、任务池,定时任务的类库☆23Updated last month
- 使用flink快速构建实时监控系统报警☆19Updated 5 years ago
- java性能采集工具☆51Updated 6 years ago
- 以Spring Boot框架为基础,实现各分布式事务(JTA/消息/TCC)的DEMO☆9Updated 8 years ago
- springboot项目使用脚手架,集成redis、mysql、pg,hbase、elasticsearch、kafka等常用组件功能☆20Updated 2 years ago
- 风控系统设计demo☆23Updated 7 years ago
- Zipkin 是一款Twitter开源的分布式实时数据追踪系统(Distributed Tracking System),此库是为国内著名服务治理框架dubbo编写的zipkin instrument library,支持对dubbo调用的全链路实时调用数据统计与依赖分析。…☆20Updated 8 years ago
- 数据分析快速开发平台:包含统一数据访问接口,数据建模,数据治理,数据展现☆22Updated 6 years ago