zengxiao3p / markLinks

本项目使用python3.5.2,使用scrapy作为爬取框架，主要爬取银行营销信息的爬虫项目，使用selenium模拟人工操作流程，包括保存登录信息cookies。模拟人工操作规避ajax请求的动态渲染等问题，主要爬取银行官网，微信搜狗上银行的信息，微小宝上银行信息，银行标书中标易，剑鱼等的来源。使用mysql作为持久化保存数据。

☆18

Alternatives and similar repositories for mark

Users that are interested in mark are comparing it to the libraries listed below

Sorting:

ChenHuabin321 / company_ino_spider
本项目为企业工商信息网络爬虫，输入行业关键字，例如“铜箔”，可爬取八方资源网等工商信息网上所有与铜箔有关企业的工商信息。
☆24Updated 7 years ago
lemontang93 / news_feed
🌏实时监控900多家中国企业的新闻动态
☆22Updated 7 years ago
Richar-Du / AIlicai
人工智能理财小程序
☆8Updated 4 years ago
alicelmx / wechat_public_spider
通过搜狗搜索引擎爬取微信公众号文章
☆28Updated 7 years ago
likeweilikewei / financial-NLP-intelligent-interaction
项目介绍：智能交互金融智能聊天。具体实现用户在所有关于股票话题的智能问答。其中难点是问题分类、数据预处理、参数提取。 ☆个人工作：实现金融智能聊天,实现所有股票问题的精确回答。通过提取通用特征将5亿+条训练语料缩减为10w条，语料内存占用量从10G减少到2M，并将…
☆64Updated 5 years ago
linwt / TrafficForecast-SparkMLlib
SparkMLlib智慧交通项目
☆16Updated 6 years ago
brady-chen / tbNews
金融新闻增量式聚焦爬虫
☆20Updated 8 years ago
quicklysnail / PPD-data-mining
拍拍贷网贷数据挖掘，风控建模
☆49Updated 8 years ago
13060923171 / Crawl-Project2
增加新的项目，爬取前程无忧，大街网，拉勾网，百度贴吧，美团商家，美团酒店，信托协会，微信步数，土流网，破解验证码，链家，百度文库，wallaven壁纸，音效，
☆17Updated 3 years ago
LongYosef / corpredit
国家企业信用信息官网爬虫，未获取全部企业信息，重点在设计反爬思路
☆67Updated 7 years ago
digfound / sinacrawler
第一次编写Python网络爬虫，主要使用beautifulsoup4爬取新浪新闻首页新闻列表。成功获取新闻标题、时间、来源、详情、评论数、编辑信息，使用pandas整理数据，并保存到数据库。
☆13Updated 7 years ago
teamowu / Data-Operation
💡数据化运营💡：会员数据化运营(RFM模型、营销响应预测)、商品数据化运营、流量数据化运营、内容数据化运营
☆46Updated 6 years ago
howie6879 / getNews
互联网新闻推荐系统(myNews)--2016全国计算机设计大赛企业命题参赛作品
☆45Updated 8 years ago
EthanXzhang / HotelDataCrawler
酒店数据的python爬虫(this project has been abandoned)
☆14Updated 5 years ago
cnwarden / bijia
比价网站：历史记录，多平台采集，机器学习，价格分析与预测，购物建议
☆45Updated 10 years ago
datugou / spiders
各种爬虫：爱企查爬虫，网上114企业信息爬虫，抖音视频爬虫，wipo爬虫，专利信息爬虫（patentscope）
☆76Updated 3 years ago
xqtbox / AutoHomeSpider_Scrapy
爬取汽车之家的口碑数据，并破解前端js反爬虫措施分析
☆62Updated 7 years ago
evanleungc / GoldSentAnalysis
黄金舆情数据分析
☆52Updated 8 years ago
striver-ing / internet-content-detection
Python编写的爬虫框架以及特定网站的信息抓取
☆18Updated 7 years ago
doublezjia / qichacha-spider
爬取企查查上面的企业信息
☆11Updated 7 years ago
JK-River / RobotAIEngine
儿童机器人AI引擎，包括自然语言理解、对话生成、多轮对话、状态跟踪、智能推荐以及第三方服务的集成。
☆75Updated 8 years ago
chillfly / MarketingManager
营销管理平台，包括但不局限于微博，用的python语言基于tornado框架实现，主要技术有python，redis，rabbitmq，linuxshell。目前已经实现的微博营销功能有：微博关注、微博点赞、微博转发、微博评论、评论点赞。
☆17Updated 2 years ago
JK-River / Robot4Kids
儿童机器人相关的后台框架、AI引擎、自然语言处理、儿童教育知识图谱、APP框架
☆46Updated 8 years ago
miaofu / WebDataProduct
A Web Page Of Public Sentiment For P2P Industry( P2P 行业的舆情分析前端展示)
☆25Updated 9 years ago
XiePingfan / StockInfo
一个用于爬股票历史数据，并根据历史数据分析挖掘并对未来数据进行预测的项目
☆17Updated 7 years ago
guoyu07 / Gumingzhijia
中国股市从1990年发展至今才仅仅28年，正处于一个茁壮成长的黄金时期。股票市场发展至今形成了两大流派，技术派和基本派，基本分析以公司的价值为投资对象，发掘公司未来的投资价值；而技术分析则以行为为主，通过股票的历史走势，各种形态指标为研究对象；在股票市场的推进中，信息越发…
☆9Updated 7 years ago
xiaoe1314 / Python
Python实战项目：爬取糗事百科、拉勾网、boss直聘等等知名网站实战，搭建响应式网站、Python web项目。
☆23Updated 2 years ago
ChenHuabin321 / zhihuSpider
本爬虫用于爬取知乎网站问题、回答的相关字段信息，问题的标题、内容、发布时间、话题、回答数量、评论数、点击数、关注数等字段，及对该问题回答的内容，作者、点赞数、评论数、回答时间等等字段信息。可用于对社会话题、热点进行数据分析。
☆43Updated 6 years ago
shenyanf / AShareListedCompanyList
使用python抓取上交所上市公司信息和下载深交所上市公司信息，然后保存到mysql中，并可以从mysql导出到excel。
☆39Updated 7 years ago
YeKandy / JDSpider
使用python抓取京东全站数据（商品，店铺，分类，评论）
☆66Updated 2 years ago