CowryGolden / PySparkDemo
《Python+Spark2.0+Hadoop机器学习与大数据实战》练习
☆19Updated 5 years ago
Alternatives and similar repositories for PySparkDemo:
Users that are interested in PySparkDemo are comparing it to the libraries listed below
- 根据用户数据以及消费行为数据,使用Python建立分类模型, 通过评估客户流失的风险来预测客户流转情况,找到对客户影响较大的因素,进而挽留客户☆9Updated 4 years ago
- 第二届全国大数据比赛-个性化新闻推荐☆67Updated 9 years ago
- 用户画像练手,,,,☆82Updated 8 years ago
- 根据用户数据及消费行为数据,使用Python对客户进行聚类分群,并给出用户画像。通过数据,分析用户群体的核心特征。☆28Updated 4 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆31Updated 4 years ago
- 数据分析,挖掘建模。☆204Updated 3 years ago
- 某电商手机评论的文本挖掘初体验 功能板块:数据预处理、LDA模型获取特征词、情感极性判断与程度计算、回归模型预测销量排序☆114Updated 5 years ago
- 构建基于逻辑回归的评分卡模型☆44Updated 6 years ago
- 以京东评论作为数据集,使用常见的机器学习算法如KNN、SVM、逻辑回归、贝叶斯、xgboost等等算法进行分类。使用深度学习中的CNN、RNN、CNN和RNN连接、Bi-GRU、bert模型进行分类。使用fastnlp的框架搭建文本分类。☆30Updated 4 years ago
- 简单的实现推荐系统的召回模型和排序模型,其中召回模型使用协同过滤算法,排序模型使用gbdt+lr算法☆59Updated 6 years ago
- 人工智能工程师直通车第三期 实战项目:广告点击率预测(CTR)。预测用户浏览给定网页的广告点击率,提高广告投放精准度。☆22Updated 6 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆53Updated 7 years ago
- 一些经典的个性化推荐算法的实现,从理论推导到实战☆68Updated 4 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆62Updated 4 years ago
- 推荐系统实践(基于近邻和LFM的推荐系统)☆100Updated 6 years ago
- text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880☆62Updated 6 years ago
- 互联网新闻情感分析赛题baseline☆42Updated 5 years ago
- 深度学习用于近日头条用户画像☆27Updated 6 years ago
- 基于互联网金融平台2015年度贷款数据完成信贷违约预测模型,该模型可以作为信贷平台预测违约借款人的参考☆68Updated 6 years ago
- 2019厦门国际银行“数创金融杯”数据建模大赛☆25Updated 3 years ago
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆58Updated 6 years ago
- 3个小项目分别是利用 Python 实现报表自动化、某连锁超市、某银行数据分析,展示了问题分解、数据清洗、数据分析与可视化的过程。☆41Updated 5 years ago
- 利用python进行反欺诈检测☆34Updated 6 years ago
- 银行客户流失预警模型☆42Updated 6 years ago
- 该项目是短文本分类,目前应用于新闻标签的分类☆32Updated 7 years ago
- 本次数据分析基于阿里云天池数据集(用户行为数据集),使用转化漏斗,AARRR模型,对常见电商分析指标,包括转化率,PV,UV,留存率,复购率等进行分析,分析过程中使用python进行数据清洗及可视化。☆26Updated 4 years ago
- 机器学习、深度学习基础知识. 推荐系统及nlp相关算法实现☆67Updated 2 years ago
- 数据分析或者数据挖掘工程师面试题整理☆147Updated 4 years ago
- 拍拍贷AI-第四届魔镜杯大赛☆11Updated 5 years ago
- 慕课网公开课:数据预处理☆73Updated 5 years ago