mumuhadoop / mumu-spark
mumu-spark是一个学习项目,主要通过这个项目来了解和学习spark的基本使用方式和工作原理。mumu-spark主要包括弹性数据集rdd、spark sql、机器学习语言mlib、实时工作流streaming、图形数据库graphx。通过这些模块的学习,初步掌握spark的使用方式。
☆14Updated 2 years ago
Alternatives and similar repositories for mumu-spark:
Users that are interested in mumu-spark are comparing it to the libraries listed below
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 7 years ago
- 流程化 机器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆65Updated 6 years ago
- spark流式计算电商商品关注度+推荐系统/关联系统☆15Updated 7 years ago
- ☆21Updated 8 years ago
- 基于Spark和Kubernetes的机器学习平台☆30Updated 7 years ago
- 自助搭建的 hadoop + spark + kafka + zookeeper + storm + hbase + hive + flume 集群,一主两从。☆30Updated 6 years ago
- SpringBoot + Apache Mahout 推荐引擎 基于用户评分数据推荐相关电影☆11Updated 6 years ago
- 中文地址匹配以及经纬度匹配☆40Updated 8 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 6 years ago
- ☆11Updated 7 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆34Updated 2 years ago
- kafka + structured streaming + phoenix + elasticsearch 基于行为日志实现热门推荐,用户偏好推荐,召回融合策略实现。☆15Updated last year
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 5 years ago
- spark机器学习算法研究和源码分析☆32Updated 8 years ago
- 专注大数据 Spark ML 机器学习:监督学习、无监督学习,主要有:分类算法、回归算法、聚类算法、推荐算法、频繁模式挖掘算法☆16Updated 4 years ago
- 大数据精准营销中搜狗用户画像挖掘☆36Updated 8 years ago
- 信托数据仓库及商业智能☆32Updated 6 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆74Updated 2 years ago
- 常用文本聚类算法java实现☆15Updated 10 years ago
- 数据可视化, 数据挖掘, 数据处理 ETL分析☆167Updated 3 years ago
- 商品关联关系挖掘,使用Spring Boot开发框架和Spark MLlib机器学习框架,通过FP-Growth算法,分析用户的购物车商品数据,挖掘商品之间的关联关系。项目对外提供RESTFul接口。☆34Updated 3 years ago
- hbase + spark 实现 常用推荐算法(主要用于精准广告投放和推荐系统)☆66Updated 8 years ago
- 一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目☆14Updated 7 years ago
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- mml是类似于阿里云的机器学习平台☆54Updated 2 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆20Updated 8 years ago
- AMS实时推荐系统☆17Updated 2 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- Spark混合推荐系统大数据监控平台☆11Updated 6 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆35Updated 7 years ago