harvardfly / Spark-for-PythonLinks
基于python3使用spark的统计分析,涵盖spark的几大模块,主要有spark core、spark mllib、spark sql及spark streaming等的python实现
☆32Updated 6 years ago
Alternatives and similar repositories for Spark-for-Python
Users that are interested in Spark-for-Python are comparing it to the libraries listed below
Sorting:
- csdn用户画像的源码☆20Updated 7 years ago
- 基于SparkMLLib实现的商品推荐功能,包括:基于用户的协同过滤,基于物品的协同过滤,基于ALS交替最小二乘的协同过滤。☆37Updated 6 years ago
- 基于 Spark Streaming + ALS 的餐饮推荐系统☆88Updated 6 years ago
- 第二届全国大数据比赛-个性化新闻推荐☆69Updated 9 years ago
- 基于Spark的行为日志分析系统☆16Updated 2 years ago
- 基于Spark2.2新闻网大数据实时系统项目☆61Updated 6 years ago
- 基于Hadoop和Django开发的用户画像系统☆23Updated 6 years ago
- 一个简单的Hive项目,使用了Sqoop、Hadoop、Hive、MySQL,对电商数据进行分析☆50Updated 6 years ago
- 本项目旨在建立一个基于大数据处理的大学生就业方向分析预测系统,通过爬虫技术获取各大公司和著名招聘网站的大量招聘信息,然后将获取的数据进行清洗分类后储存在数据库中,最后从大学生的就业角度出发,通过算法分析数据,建立一个帮助大学生明确就业方向与社会需求的平台☆110Updated 6 years ago
- 基于豆瓣影视数据(不完整)的影视大数据分析平台。爬虫(影视数据和用户数据),推荐系统(基于用户的协同过滤算法),后台(flask实现的简易后台)。☆34Updated 7 years ago
- 毕业设计源码-基于Spark的Kmeans聚类算法优 化☆18Updated 8 years ago
- hbase + spark 实现常用推荐算法(主要用于精准广告投放和推荐系统)☆67Updated 8 years ago
- 基于Django Restframework的异常检测系统,分析服务为Spark SQL和Spark Mllib,每天通过自动跑定时job从全量数据中导入正常数据供算法模型训☆50Updated 2 years ago
- 基于用户画像的音乐推荐系统☆14Updated 6 years ago
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆58Updated 6 years ago
- 利用用户画像数据、物品元数据、用户行为数据为特征构建推荐系统,使用CB和CF算法做推荐召回,使用 Redis数 据库做缓存处理,结合机器学习LR算法推荐排序,达到粗排、精排效果,实现推荐引擎搭建。☆45Updated 4 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 8 years ago
- 基于Spark MLlib ALS的音乐推荐系统☆29Updated 9 years ago
- 此项目是对大学生的一卡通消费数据、图书借阅记录和图书馆门禁数据在spark集群的大数据框架环境之下进行聚类、关联分析,分析出学生的消费水平、生活规律、学习强度等聚类结果,以及将聚类结果进行FPGrowth关联分析得出学生聚类之间存在的关联性,此项目是使用scala语言,利用…☆64Updated 8 months ago
- 使用Spark GraphX基于PageRank算法构建一个仿微博用户好友的分布式推荐系统。☆24Updated 6 years ago
- 大数据精准营销中搜狗用户画像挖掘☆36Updated 8 years ago
- 电影评分推荐系统☆14Updated 10 years ago
- 使用 Spark MLlib 的 ALS 算法的电影推荐系统☆41Updated 8 years ago
- 基于PySpark库,使用SparkSql连接MYSQL数据库并对数据进行统计分析的基础架构☆14Updated 7 years ago
- 基于tornado实现的小型推荐系统的web应用,使用mysql数据库,基于用户的协同过滤算法以及基于内容的分类算法做推荐。☆20Updated 8 years ago
- 一个网站,一个推荐系统☆16Updated 6 years ago
- 参与针对于2019-nCoV数据可视化预测项目,后端完全使用ElasticSearch集群/Redis缓存,利用Flask提供API Server,利用前端/中后/前台的接口配合完成新型冠状病毒的疫情发展的相关信息可视化以及预测,方便观察疫情发展情况,并结合机器学习模型对疫…☆23Updated 5 years ago
- 基于Django和Hadoop集群进行的大数据分析平台☆66Updated 7 years ago
- 模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏…☆127Updated 5 years ago
- 基于RFM和决策树模型构建专家推荐系统。融合了RFM模型和决策树模型,结合专业运营人员的业务经营,发掘潜在用户,进行推荐营销召回。☆88Updated last year