harvardfly / Spark-for-Python
基于python3使用spark的统计分析,涵盖spark的几大模块,主要有spark core、spark mllib、spark sql及spark streaming等的python实现
☆32Updated 6 years ago
Alternatives and similar repositories for Spark-for-Python:
Users that are interested in Spark-for-Python are comparing it to the libraries listed below
- 基于Django Restframework的异常检测系统,分析服务为Spark SQL和Spark Mllib,每天通过自动跑定时job从全量数据中导入正常数据供算法模型训☆50Updated 2 years ago
- 基于 Spark Streaming + ALS 的餐饮推荐系统☆88Updated 6 years ago
- 基于PySpark库,使用SparkSql连接MYSQL数据库并对数据进行统计分析的基础架构☆14Updated 6 years ago
- hbase + spark 实现常用推荐算法(主要用于精准广告投放和推荐系统)☆65Updated 8 years ago
- 基于SparkMLLib实现的商品推荐功能,包括:基于用户的协同过滤,基于物品的协同过滤,基于ALS交替最小二乘的协同过滤。☆34Updated 5 years ago
- 第二届全国大数据比赛-个性化新闻推荐☆68Updated 9 years ago
- 基于Django和Hadoop集群进行的大数据分析平台☆62Updated 7 years ago
- 基于用户行为的推荐算法大赛---第四名(临兵斗列)☆42Updated 8 years ago
- 此项目是对大学生的一卡通消费数据、图书借阅记录和图书馆门禁数据在spark集群的大数据框架环境之下进行聚类、关联分析,分析出学生的消费水平、生活规律、学习强度等聚类结果,以及将聚类结果进行FPGrowth关联分析得出学生聚类之间存在的关联性,此项目是使用scala语言,利用…☆63Updated 3 months ago
- csdn用户画像的源码☆20Updated 7 years ago
- 后端+前端+算法模型,机器学习项目 demo。Flask + vue + ML, full stack machine learning project construction.☆108Updated 2 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活 跃度等模型☆66Updated 7 years ago
- 毕业设计源码-基于Spark的Kmeans聚类算法优化☆18Updated 8 years ago
- 唯品会用户购买行为预测☆27Updated 6 years ago
- 大数据精准营销中搜狗用户画像挖掘☆37Updated 8 years ago
- pyspark+Word2Vec+Tfidf+LSH、文章相似性推荐☆26Updated 4 years ago
- 使用Spark GraphX基于PageRank算法构建一个仿微博用户好友的分布式推荐系统。☆24Updated 6 years ago
- 金融反欺诈模型☆27Updated 7 years ago
- 职位推荐系统☆26Updated 8 years ago
- 基于微信网页版爬虫来对微信中获取到的联系人相关信息Flask,Echarts进行数据分析☆13Updated 5 years ago
- 新闻分类系统&谣言处理系统☆78Updated 7 years ago
- 基于Hadoop和Django开发的用户画像系统☆22Updated 6 years ago
- 使用Django2.2+MySQL+spark实现在线电影推荐系统。其中MySQL部分支持在线计算,spark支持离线计算。☆36Updated 5 years ago
- 基于 python3 ,使用 scrapy 爬取新浪微博和 Twitter 的财报数据,再将数据进行整理和分析并持久化到 json 文件,最终使用 Flask 和 baidu echarts 对数据进行可视化。☆16Updated 6 years ago
- 一个基于 fasttext + faiss 的商品内容相关推荐实现,nginx+uwsgi+flask / gunicorn+uvicorn+fastapi 提供api查询接口,增加Spark实现 Ansj+Word2vec+LSH+Phoenix☆51Updated last year
- 基于Spark MLlib ALS的音乐推荐系统☆29Updated 8 years ago
- 机器学习算法模型的知识图谱(思维导图)构建☆63Updated 6 years ago
- 抓取zol数据,django-haystack实现全文搜索,bokeh进行数据可视化,pandas进行数据分析☆35Updated 2 years ago
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆58Updated 6 years ago
- 基于 spark 推荐系统, 基于内容标签 CBCF 实现,协同过滤 UBCF 实现,协同过滤 IBCF 实现☆46Updated 8 years ago