Kdotm / Python_SeriesLinks
目前任职大数据开发工作,日常开发使用Python作为数据分析工具,在此比较常用的方面知识或难点总结、整理出来,以此分享,谢谢!
☆18Updated 7 years ago
Alternatives and similar repositories for Python_Series
Users that are interested in Python_Series are comparing it to the libraries listed below
Sorting:
- 信用卡违约率分析☆21Updated 6 years ago
- Python数据分析与挖掘实战书中的实例学习☆28Updated 8 years ago
- 爬取知乎用户并对单个用户进行画像分析☆101Updated 6 years ago
- 今日头条爬虫,主要爬取关键词搜索结果,包含编辑距离算法、奇异值分解、k-means聚类。☆72Updated 6 years ago
- 新浪爬虫,基于Python+Selenium。模拟登陆后保存cookie,实现登录状态的保存。可以通过输入关键词来爬取到关键词相关的热门微博。☆29Updated 7 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失预警、活跃度等模型☆66Updated 8 years ago
- 基于RFM和决策树模型构建专家推荐系统。融合了RFM模型和决策树模型,结合专业运营人员的业务经营,发掘潜在用户,进行推荐营销召回。☆88Updated last year
- 第二届全国大数据比赛-个性化新闻推荐☆70Updated 10 years ago
- 猎头招聘数据仓库☆40Updated 7 years ago
- 大数据精准营销中搜狗用户画像挖掘☆36Updated 8 years ago
- 基于 python3 ,使用 scrapy 爬取新浪微博和 Twitter 的财报数据,再将数据进行整理和分析并持久化到 json 文件,最终使用 Flask 和 baidu echarts 对数据进行可视化。☆16Updated 7 years ago
- 使用Spark Graphx 分析金庸”射雕三部曲“☆46Updated 4 years ago
- 《Python数据分析与挖掘实战》随书源码与数据☆291Updated 7 years ago
- R语言游戏数据分析与挖掘☆63Updated 8 years ago
- 数据挖掘,参加Kaggle的一个预测广告点击率的竞赛☆28Updated 9 years ago
- 基于Django和Hadoop集群进行的大数据分析平台☆69Updated 7 years ago
- 数据分析,挖掘建模。☆211Updated 3 years ago
- 基于某城市移动终端用户的运营商数据预测未来三月内用户是否会终端变迁(用户从当前使用的手机品牌更换为其他手机品牌)。应用xgboost算法和随机森林算法组合成多学习器预测模型。☆54Updated 9 years ago
- 拍拍贷网贷数据挖掘,风控建模☆49Updated 8 years ago
- 基于Python+scrapy+redis的分布式爬虫实现框架☆59Updated 5 years ago
- 基于 Spark Streaming + ALS 的餐饮推荐系统☆87Updated 7 years ago
- 参与针对于2019-nCoV数据可视化预测项目,后端完全使用ElasticSearch集群/Redis缓存,利用Flask提供API Server,利用前端/中后/前台的接口配合完成新型冠状病毒的疫情发展的相关信息可视化以及预测,方便观察疫情发展情况,并结合机器学习模型对疫…☆23Updated 5 years ago
- 基于BOSS直聘上海地区岗位信息,利用爬虫对数据进行爬取和存储后,对其进行自然语言分析。提取“职位描述”中的软件技能,并建模预测分析。调参后的最终模型薪资预测误差约±4.3k。☆26Updated 6 years ago
- 基于scrapy-redis实现分布式爬虫,爬取知乎所有问题及对应的回答,集成selenium模拟登录、英文验证码及倒立文字验证码识别、随机生成User-Agent、IP代理、处理302重定向问题等等☆58Updated 6 years ago
- text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880☆62Updated 7 years ago
- 收录古柳(DesertsX)的一些小项目☆282Updated 6 years ago
- 基于python3使用spark的统计分析,涵盖spark的几大模块,主要有spark core、spark mllib、spark sql及spark streaming等的python实现☆32Updated 6 years ago
- csdn用户画像的源码☆20Updated 8 years ago
- 爬取去哪儿景点进行数据分析并生成热力图☆75Updated 6 years ago
- 基于用户行为的用户画像项目☆77Updated 7 years ago