analysisdatalab / spark_mllib_demo_pro
专注大数据 Spark ML 机器学习:监督学习、无监督学习,主要有:分类算法、回归算法、聚类算法、推荐算法、频繁模式挖掘算法
☆16Updated 4 years ago
Alternatives and similar repositories for spark_mllib_demo_pro:
Users that are interested in spark_mllib_demo_pro are comparing it to the libraries listed below
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆34Updated 2 years ago
- 基于flink的推荐系统,实时获取kafka数据进行数据清洗,离线计算进行文件读取(文件,mongodb,hbase)运用协同过滤算法进行计算得出推荐数据☆18Updated 2 years ago
- 基于springbook+spark的机器学习应用开发☆12Updated 2 years ago
- AMS实时推荐系统☆16Updated 2 years ago
- 数据分析快速开发平台:包含统一数据访问接口,数据建模,数据治理,数据展现☆22Updated 6 years ago
- 基于Hadoop和HBase的大规模海量数据去重☆29Updated 6 years ago
- 基于Spark和Kubernetes的机器学习平台☆30Updated 6 years ago
- 在公司接了一个任务,完成一个项目数据同步的模块。要求是不能操作项目的数据库。怕操作不当,数据丢失。所以想到的方案是使用log4jdbc记录数据源的SQL语句到日志文件。然后按行读取日志文件中的数据,记录读取的Point,以便下次继续读取。读取的数据进入bigqueue队列,…☆12Updated 7 years ago
- spark流式计算电商商品关注度+推荐系统/关联系统☆15Updated 7 years ago
- Zdal是支付宝自主研发的数据中间件产品,采用标准的JDBC规范,可以在分布式环境下看上去像传统数据库一样提供海量数据服务,是一种通用的分库分表数据库访问框架,解决单库单表数据库访问压力,Zdal主要提供分库分表,结果集合并,sql解析,数据库failover动态切换等功能…☆18Updated 6 years ago
- Spark混合推荐系统大数据监控平台☆11Updated 6 years ago
- 用户行为分析系统☆12Updated 9 years ago
- 数据的导出(支持DB2、MySQL、Oracle、Teradata数据库的数据导出)、合并(支持将多个小数据文件合并成一个大的数据文件)、传输(支持FTP、SFTP数据传输)程序,适用于向指定FTP服务器供数的情况,常见于多个源系统以数据文件的形式向数据仓库集中供数。该程序…☆25Updated 9 years ago
- 万联物联网平台,基于Java8,Spring Boot2.2.13 ,SpringMVC,AdminLTE等开发。支持物模型管理,多种设备,多种厂家,统一管理。统一设备连接管理,多协议适配(TCP,MQTT,HTTP等),灵活接入不同厂家不同协议等设备。实时数据处理,设备告…☆18Updated 10 months ago
- 电商+大数据+spark机器学习☆16Updated 7 years ago
- 大数据【企业级360°全方位用户画像】标签开发部分源码☆19Updated 4 years ago
- 基于Flink+ClickHouse实时计算平台☆31Updated 2 years ago
- 基于java实现的有限状态自动机,轻松,快捷,高效的关联状态的扭转☆14Updated 5 years ago
- 使用spark对hive、hbase、ES的读写, 实现一次配置可对不同数据库进行导入导出,并对ES、hbase进行封装☆32Updated 7 years ago
- 以知乎日报为数据源,全流程实践一个机器学习过程,从数据获取到数据分析,对知乎日报进行聚类、分类,并可视化这一过程☆17Updated 8 years ago
- 新零售大数据平台-运维监控平台的开发☆14Updated 6 years ago
- SpringBoot + Apache Mahout 推荐引擎 基于用户评分数据推荐相关电影☆11Updated 6 years ago
- 用户画像代码,根据算法推算出用户的性别和年龄比率☆11Updated 7 years ago
- springboot项目使用脚手架,集成redis、mysql、pg,hbase、elasticsearch、kafka等常用组件功能☆20Updated 2 years ago
- JEECMS是一款基于JAVA技术研发的站群管理系统。 1、支持大规模网站群管理; 2、跨站全文检索、数据共享; 3、微官网/手机网站同步建设; 4、高效二次开发的插件化管理 5、支持可视化模板制作;☆25Updated 8 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆20Updated 6 years ago
- mumu-mahout是一个学习项目,主要通过这个项目来学习mahout的功能和使用方式。mahout是一款开源的机器学习算法,主要包括协同过滤推荐、聚类、分类等三大块内容。 推荐可以基于用户的推荐和基于物品的推荐,可以给用户推荐一些数据,智能化数据。☆21Updated 6 years ago
- 大数据组件学习;包括dataflow,spring cloud stream;elasticsearch;flink;spark;kafka;phoenix;Hive;Hbase;☆23Updated 2 years ago
- 基于Kettle的MySQL数据库同步☆26Updated 6 years ago
- 蓝泰源大数据基础平台☆17Updated 6 years ago