zengxiao3p / mark
本项目使用python3.5.2,使用scrapy作为爬取框架,主要爬取银行营销信息的爬虫项目,使用selenium模拟人工操作流程,包括保存登录信息cookies。 模拟人工操作规避ajax请求的动态渲染等问题,主要爬取银行官网,微信搜狗上银行的信息,微小宝上银行信息,银行标书中标易,剑鱼等的来源。使用mysql作为持久化保存数据。
☆18Updated 5 years ago
Related projects ⓘ
Alternatives and complementary repositories for mark
- 本项目为企业工商信息网络爬虫,输入行业关键字,例如“铜箔”,可爬取八方资源网等工商信息网上所有与铜箔有关企业的工商信息。☆23Updated 6 years ago
- 通过搜狗搜索引擎爬取微信公众号文章☆28Updated 6 years ago
- 金融新闻增量式聚焦爬虫☆20Updated 7 years ago
- 💡数据化运营💡:会员数据化运营(RFM模型、营销响应预测)、商品数据化运营、流量数据化运营、内容数据化运营☆45Updated 5 years ago
- 金融问答平台文本数据采集/爬取,数据源涉及上交所,深交所,全景网及新浪股吧☆39Updated 7 years ago
- 爬取汽车之家的口碑数据,并破解前端js反爬虫措施分析☆62Updated 7 years ago
- 舆情分析平台☆33Updated 7 years ago
- 大数据精准营销中搜狗用户画像挖掘☆37Updated 8 years ago
- 依据香港中文大学设计的规则系统,先用小样本评论建立初始关键词库,再结合18种句式逐条匹配评论,能够快速准确地识别评论对象及情感极性。经多次迭代优化关键词库后,达到较高准确率的基础上,使用Tableau进一步分析数据,识别出客户集中关注的商品属性、普遍好评差评的商品属性;通过…☆53Updated 7 years ago
- Python编写的爬虫框架以及特定网站的信息抓取☆17Updated 7 years ago
- 搜索引擎关键词排位爬虫,包括百度,搜狗,360的搜索引擎关键词排位爬虫,关键词从百度热词中取得,排位分别从三个搜索引擎中抓取。☆19Updated 5 years ago
- 项目介绍: 智能交互金融智能聊天。具体实现用户在所有关于股票话题的智能问答。其中难点是问题 分类、数据预处理、参数提取。 ☆个人工作: 实现金融智能聊天,实现所有股票问题的精确回答。通过提取通用特征将5亿+条训练语料缩减为10w条,语料内存占用量从10G减少到2M,并将…☆61Updated 5 years ago
- 拍拍贷网贷数据挖掘,风控建模☆48Updated 7 years ago
- 新浪热门微博爬虫,外加词云分析。☆19Updated 6 years ago
- 爬虫项目,领英、专利、乐捐、好大夫、阿里拍卖、看准网、实习僧、百度百科、51job、智联招聘等近80个网站☆79Updated 4 years ago
- self complemented WeiboIndexSpyder based on Selenium ,新浪微博指数(微指数)采集,包括综合指数,移动端指数,PC端指数☆31Updated 6 years ago
- Python 实战项目:爬取上交所和深交所所有股票的名称和交易信息☆9Updated 6 years ago
- Python实战项目:爬取糗事百科、拉勾网、boss直聘等等知名网站实战,搭建响应式网站、Python web项目。☆22Updated last year
- 评分卡 逻辑回归 最优分组 金融风控 信用等级 屁屁和铭仔的数据之路 AugustBetty☆11Updated 3 years ago
- 基于情感词典的热门话题的情感分析☆9Updated 10 years ago
- 🌏实时监控900多家中国企业的新闻动态☆20Updated 7 years ago
- 通过游戏埋点数据挖掘进行游戏用户流失分析☆22Updated 6 years ago
- 黄金舆情数据分析☆45Updated 7 years ago
- 目前任职大数据开发工作,日常开发使用Python作为数据分析工具,在此比较常用的方面知识或难点总结、整理出来,以此分享,谢谢!☆18Updated 6 years ago
- 基于用户行为的推荐算法大赛---第四名(临兵斗列)☆42Updated 8 years ago
- 智慧物流算法大赛简介: 根据包括货值、路程和油价等字段的数据集,对每趟货物运送的运价进行回归预测。 本项目为我的参赛代码,分为四个主要的部分:1.数据预处理;2.特征工程;3.建模调参训练;4.数据可视化。 最终获得了大赛的二等奖。☆34Updated 5 years ago
- scrapy实现商事主体信息公示平台爬虫。查询工商注册信息的网站,输入关键词可以爬相关所有注册企业数据的数据。 网址:http://cri.gz.gov.cn/☆25Updated 5 years ago