mumuhadoop / mumu-sparkLinks
mumu-spark是一个学习项目,主要通过这个项目来了解和学习spark的基本使用方式和工作原理。mumu-spark主要包括弹性数据集rdd、spark sql、机器学习语言mlib、实时工作流streaming、图形数据库graphx。通过这些模块的学习,初步掌握spark的使用方式。
☆14Updated 2 years ago
Alternatives and similar repositories for mumu-spark
Users that are interested in mumu-spark are comparing it to the libraries listed below
Sorting:
- ☆21Updated 8 years ago
- 基于Spark和Kubernetes的机器学习平台☆30Updated 7 years ago
- 流程化 机 器学习框架 基于 scala java语言 ,一站式自动机器学习平台 ,主要包括数据分析 特征工程 ,机器模型,自动部署,超参数优化,模型自动优化,自动扩容分配创建功能,类似第四范式、阿里PAI平台、google autoMl、亚马逊SageMaker☆65Updated 6 years ago
- spark流式计算电商商品关注度+推荐系统/关联系统☆15Updated 7 years ago
- 基于spark-ml,spark-mllib,spark-streaming的推荐算法实现☆96Updated 6 years ago
- 数据可视化, 数据挖掘, 数据处理 ETL分析☆167Updated 3 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆34Updated 2 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- 常用文本聚类算法java实现☆15Updated 10 years ago
- hbase + spark 实现常用推荐算法(主要 用于精准广告投放和推荐系统)☆68Updated 8 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 8 years ago
- 信托数据仓库及商业智能☆32Updated 7 years ago
- ☆11Updated 8 years ago
- 实现中文文本分类,支持文件、文本分类,基于多项式分布的朴素贝叶斯分类器。由于工作实际应用是二分类,加之考虑到每个分类属性都建立map存储词语向量可能引起的内存问题,所以目前只支持二分类。当然,直接复用这个结构扩展到多分类也是很容易。之所以自己写,主要原因是没有仔细研读mah…☆22Updated 8 years ago
- 封装了一个简易的hbase-orm框架☆27Updated 7 years ago
- 深度学习基础学习以及工作项目☆21Updated 7 years ago
- kafka + structured streaming + phoenix + elasticsearch 基于行为日志实现热门推荐,用户偏好推荐,召回融合策略实现。☆15Updated last year
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- 基于 spark 推荐系统, 基于内容标签 CBCF 实现,协同过滤 UBCF 实现,协同过滤 IBCF 实现☆46Updated 8 years ago
- 专注大数据 Spark ML 机器学习:监督学习、无监督学习,主要有:分类算法、回归算法、聚类算法、推荐算法、频繁模式挖掘算法☆16Updated 4 years ago
- 四川大学拓思艾诺广告流量实时分析项目☆24Updated 7 years ago
- 飞象大数据分析可视化☆19Updated 7 years ago
- 中文地址匹配以及 经纬度匹配☆40Updated 8 years ago
- 蜂鸟数据分析平台帮助企业快速完成多数据整合,建立统一数据口径,支持自助式数据准备(ETL), 并提供可视化分析,帮助企业构建贴合自身业务的企业洞察,并将数据决策覆盖各层员工及应用场景☆21Updated 6 years ago
- mml是类似于阿里云的机器学习平台☆54Updated 2 years ago
- 大数据平台相关代码(ES/Hive/Hadoop/hdfs/hbase)☆75Updated 2 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆35Updated 7 years ago
- 分布式数据仓库最佳实践☆57Updated 7 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆21Updated 6 years ago