cjl84914 / eplison
基于springbook+spark的机器学习应用开发
☆12Updated 2 years ago
Alternatives and similar repositories for eplison:
Users that are interested in eplison are comparing it to the libraries listed below
- 专注大数据 Spark ML 机器学习:监督学习、无监督学习,主要有:分类算法、回归算法、聚类算法、 推荐算法、频繁模式挖掘算法☆16Updated 4 years ago
- Zdal是支付宝自主研发的数据中间件产品,采用标准的JDBC规范,可以在分布式环境下看上去像传统数据库一样提供海量数据服务,是一种通用的分库分表数据库访问框架,解决单库单表数据库访问压力,Zdal主要提供分库分表,结果集合并,sql解析,数据库failover动态切换等功能…☆18Updated 6 years ago
- 使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装☆32Updated 7 years ago
- 一个基于ElasticSearch的业务日志记录工具☆10Updated 6 years ago
- Livy REST API封装,批处理模式☆19Updated 6 years ago
- 基于jsqlparser 进行sql语句解析,得到字段间的血缘关系(即所查询字段来源于哪张表中的哪个字段)☆17Updated last year
- 大型分布式系统实时监控平台☆28Updated 2 years ago
- 【易车】- Spark、flink、HBase、Hive、flume集成了一些Hadoop的原生api的一些demo(如HDFS、MapReduce:目前就这两个);同时测试一些异常功能☆16Updated 6 years ago
- 线程池、任务、任务组、任务池,定时任务的类库☆23Updated 3 months ago
- 基于袋鼠云提供的开源flinkStreamSQL项目,对其实时sql进行可视化功能开发;通过tcpip通信,前端页面选择需要连接的数据库信息,并写sql语句,点击提交后,后端自动执行集群启动和JobGraph提交,并返回结果给前端页面。实现了使用者即使不了解Kafka、fl…☆11Updated 5 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆21Updated 6 years ago
- 在公司接了一个任务,完成一个项目数据同步的模块。要求是不能操作项目的数据库。怕操作不当,数据丢失。所以想到的方案是使用log4jdbc记录数据源的SQL语句到日志文件。然后按行读取日志文件中的数据,记录读取的Point,以便下次继续读取。读取的数据进入bigqueue队列,…☆12Updated 7 years ago
- DataX 是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括 MySQL、Oracle、HDFS、Hive、OceanBase、HBase、OTS、ODPS 等各种异构数据源之间高效的数据同步功能。☆23Updated 3 years ago
- 一个优秀的大数据查询平台,提供hive异步任务查询、LDAP用户、数据权限控制、历史查询任务与结果存储、邮件通知、excel下载等功能。☆24Updated 7 years ago
- The Best Practice of HDP,企业级大数据平台实践指南☆10Updated 7 years ago
- 做个简单易用的SpringBootCMS BackEnd后台:SpringBoot2 + MybatisPlus3 + Freemarker AdminUI管理页面:LayMini2(based on LayUI) FrontEndUI前端页面:Bootstrap3/4☆16Updated 11 months ago
- spring cloud集成全渠道在线客服以及后台管理系统,所有微服务之间的消息传递采用区块链技术,持续更新中~~目标是:第一阶段:采用spring cloud微服务搭建后台管理系统第二阶段:集成在线客服,采用netty实现websocket长连接第三阶段:集成h5、微信、…☆17Updated 2 years ago
- 基于hbase的oss系统☆10Updated 6 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆23Updated 2 years ago
- 蓝泰源大数据基础平台☆17Updated 7 years ago
- 基于Kafka和MongoDB的结构化日志异步记录和预警框架☆10Updated 8 years ago
- 数据的导出(支持DB2、MySQL、Oracle、Teradata数据库的数据导出)、合并(支持将多个小数据文件合并成一个大的数据文件)、传输(支持FTP、SFTP数据传输)程序,适用于向指定FTP服务器供数的情况,常见于多个源系统以数据文件的形式向数据仓库集中供数。该程序…☆24Updated 9 years ago
- 个人学习xxl-job源码 核心部分加上了中文注释☆16Updated 6 years ago
- ☆16Updated 2 years ago
- springboot项目使用脚手架,集成redis、mysql、pg,hbase、elasticsearch、kafka等常用组件功能☆20Updated 2 years ago
- 用于数据迁移、缓存预热,springboot架构。支持数据区间分割、动态调整线程池配置、任务进度实时查看等特性☆45Updated 7 years ago
- 数据库访问中间件,统一的标准sql查询,底层可以是不同的数据库包括mysql、ElasticSearch、kylin、presto等。☆15Updated 7 years ago
- Zipkin 是一款Twitter开源的分布式实时数据追踪系统(Distributed Tracking System),此库是为国内著名服务治理框架dubbo编写的zipkin instrument library,支持对dubbo调用的全链路实时调用数据统计与依赖分析。…☆20Updated 8 years ago
- 日志实时监控,检索,报警☆20Updated 8 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆34Updated 2 years ago