harvardfly / Spark-for-Python
基于python3使用spark的统计分析,涵盖spark的几大模块,主要有spark core、spark mllib、spark sql及spark streaming等的python实现
☆31Updated 6 years ago
Related projects ⓘ
Alternatives and complementary repositories for Spark-for-Python
- 信用卡违约率分析☆17Updated 5 years ago
- 基于PySpark库,使用SparkSql连接MYSQL数据库并对数据进行统计分析的基础架构☆14Updated 6 years ago
- csdn用户画像的源码☆19Updated 7 years ago
- 《Spark 快速大数据分析》学习笔记☆38Updated 10 months ago
- 大数据精准营销中搜狗用户画像挖掘☆36Updated 7 years ago
- 基于Django和Hadoop集群进行的大数据分析平台☆60Updated 6 years ago
- Spark Streaming + kafka + hbase☆15Updated 5 years ago
- 通过SQL+Python完成购物篮分析☆11Updated 5 years ago
- 基于豆瓣电影数☆28Updated 4 years ago
- 基于某城市移动终端用户的运营商数据预测未来三月内用户是否会终端变迁(用户从当前使用的手机品牌更换为其他手机品牌)。应用xgboost算法和随机森林算法组合成多学习器预测模型。☆53Updated 8 years ago
- spark自学手册,包含了例如spark core、spark sql、spark streaming、spark-kafka、delta-lake,以及scala基础练习,还有一些例如master、shuffle源码分析,总结及翻译。☆18Updated last year
- 基于 Spark Streaming + ALS 的餐饮推荐系统☆86Updated 6 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆65Updated 7 years ago
- 金融反欺诈模型☆26Updated 6 years ago
- 第二届全国大数据比赛-个性化新闻推荐☆67Updated 9 years ago
- 基于Django Restframework的异常检测系统,分析服务为Spark SQL和Spark Mllib,每天通过自动跑定时job从全量数据中导入正常数据供算法模型训☆49Updated last year
- 基于Spark的实时推荐系统,使用MovieLens作为测试数据集☆29Updated last year
- 机器学习文本分类器☆47Updated 8 years ago
- 唯品会用户购买行为预测☆26Updated 6 years ago
- <数据化运营>图书代码☆33Updated 6 years ago
- Spark机器学习书代码☆26Updated 6 years ago
- 使用 python 操作大数据的各种组件☆62Updated last year
- 基于用户行为的推荐算法大赛---第四名(临兵斗列)☆42Updated 8 years ago
- Python数据分析与挖掘实战书中的实例学习☆28Updated 7 years ago
- 基于Hadoop和Django开发的用户画像系统☆22Updated 6 years ago
- 目前任职大数据开发工作,日常开发使用Python作为数据分析工具,在此比较常用的方面知识或难点总结、整理出来,以此分享,谢谢!☆18Updated 6 years ago
- 使用Spark GraphX基于PageRank算法构建一个仿微博用户好友的分布式推荐系统。☆24Updated 6 years ago
- 人工智能工程师直通车第三期 实战项目:广告点击率预测(CTR)。预测用户浏览给定网页的广告点击率,提高广告投放精准度。☆22Updated 6 years ago
- 利用flask进行echarts/pyecharts,Web程序开发,机器学习模型部署☆28Updated last year
- 基于SparkSQL的电影分析项目实战☆38Updated 3 years ago