Kdotm / Python_Series
目前任职大数据开发工作,日常开发使用Python作为数据分析工具,在此比较常用的方面知识或难点总结、整理出来,以此分享,谢谢!
☆18Updated 7 years ago
Alternatives and similar repositories for Python_Series:
Users that are interested in Python_Series are comparing it to the libraries listed below
- 大数据精准营销中搜狗用户画像挖掘☆36Updated 8 years ago
- text classfication 大数据精准营销中搜狗用户画像挖掘 rank61/880☆62Updated 6 years ago
- 信用卡违约率分析☆18Updated 6 years ago
- csdn用户画像的源码☆20Updated 7 years ago
- 拍拍贷网贷数据挖掘,风控建模☆48Updated 7 years ago
- 第二届全国大数据比赛-个性化新闻推荐☆69Updated 9 years ago
- 个人实现的基于Django与semantic-ui的语言计算实验平台, 功能包括自然语言综合处理,词语计算,社会热点计算,人物计算,文学画像,职位画像等社会计算功能☆29Updated 7 years ago
- 基于BOSS直聘上海地区岗位信息,利用爬虫对数据进行爬取和存储后,对其进行自然语言分析。提取“职位描述”中的软件技能,并建模预测分析。调参后的最终模型薪资预测误差约±4.3k。☆27Updated 6 years ago
- twitter用户画像☆33Updated 5 years ago
- 基于分布式爬虫,采集互联网公开来源的金融类新闻和文档类文本; 基于文本挖掘技术,进行无监督/半监督学习的数据ETL与特征工程; 基于金融数据挖掘技术,进行宏观经济分析,基本面分析与行业分析☆102Updated 6 years ago
- 爬取知乎用户并对单个用户进行画像分析☆102Updated 6 years ago
- Spark中实现用户画像系统价值度、忠诚度、流失 预警、活跃度等模型☆66Updated 7 years ago
- 机器学习 数据挖掘 案例和竞赛 代码☆8Updated 4 years ago
- Python数据分析与挖掘实战书中的实例学习☆28Updated 7 years ago
- 今日头条爬虫,主要爬取关键词搜索结果,包含编辑距离算法、奇异值分解、k-means聚类。☆71Updated 5 years ago
- 基于 Scrapy 的新闻智能分类微信小程序,是一个文本分类相关的应用,目的是打造出一个可以对新闻进行智能分类的微信小程序。技术栈:Python + Scrapy + MongoDB + scikit-learn + Flask + 微信小程序,涉及爬虫、文本分类、Web …☆62Updated 5 years ago
- 使用scrapy框架爬取微博数据存储到mongodb中,利用numpy/tensorflow等python库对数据进行处理(基于transE算法),形成推荐系统。使用Springboot框架实现系统的可视化。有不同分支,master、transE、spring分别存储不同的…☆16Updated 8 years ago
- 爬取汽车之家的口碑数据,并破解前端js反爬虫措施分析☆62Updated 7 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 6 years ago
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆58Updated 6 years ago
- 数据挖掘,参加Kaggle的一个预测广告点击率的竞赛☆28Updated 9 years ago
- 新浪爬虫,基于Python+Selenium。模拟登陆后保存cookie,实现登录状态的保存。可以通过输入关键词来爬取到关键词相关的热门微博。☆30Updated 6 years ago
- python数据分析基础☆84Updated last year
- 深度学习用于近日头条用户画像☆27Updated 6 years ago
- 通过游戏埋点数据挖掘进行游戏用户流失分析☆23Updated 7 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代 优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆53Updated 7 years ago
- 基于微信网页版爬虫来对微信中获取到的联系人相关信息Flask,Echarts进行数据分析☆13Updated 6 years ago
- 分布式采集拉钩网中杭州爬虫相关职位的数据并使用Flask进行数据的可视化与分析☆37Updated 7 years ago
- 数据挖掘领域十大算法代码实现☆58Updated 8 years ago
- 基于RFM和决策树模型构建专家推荐系统。融合了RFM模型和决策树模型,结合专业运营人员的业务经营,发掘潜在用户,进行推荐营销召回。☆88Updated 10 months ago