jianiuqi / CTripSpiderLinks
爬取携程酒店数据
☆33Updated 9 years ago
Alternatives and similar repositories for CTripSpider
Users that are interested in CTripSpider are comparing it to the libraries listed below
Sorting:
- A complete and graceful API for Wechat. 微信个人号接口(支持文件、图片上下载)、微信机器人及命令行微信。三十行即可自定义个人号机器人。☆31Updated last year
- 豆瓣爬虫 爬取热门标签、图书信息、图书评论 系统架构 Webmagic+SSM+Redis+Mysql+ActiveMQ+Druid☆43Updated 6 years ago
- 知乎爬虫,基于webmagic框架 .A java web spider base on webmagic.☆69Updated 9 years ago
- Netty教程 - Netty是一个java开源框架。Netty提供异步的、事件驱动的网络应用程序框架和工具,用以快速开发高性能、高可靠性的网络服务器和客户端程序。☆28Updated 8 years ago
- 开源框架研究,经典书籍阅读等笔记☆59Updated 3 years ago
- 基于hadoop思维的分布式网络爬虫。☆85Updated 9 years ago
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆74Updated 12 years ago
- 基于nutch的新闻分类系统☆34Updated 9 years ago
- webmagic 爬取我喜欢的网易云歌单+评论☆51Updated 8 years ago
- 舆情搜索服务框架,其中lucene和solr版本为4.8。☆61Updated 10 years ago
- 阿里巴巴大数据竞赛☆63Updated 11 years ago
- 房价数据爬取+分析☆33Updated 9 years ago
- spring整合webmagic,mybatis,dungproxy☆29Updated 2 years ago
- 分布式大数据SQL查询可视化界面!☆68Updated 10 years ago
- 网络爬虫☆51Updated 11 years ago
- java 基于selenium抓取搜狗微信公众号文章☆50Updated 10 years ago
- 停止维护 -->移步 https://github.com/vbay/tutorials☆145Updated 7 years ago
- ☆149Updated 11 years ago
- 中文分词、统计词频、比对文本相似度☆40Updated 6 years ago
- 爬虫代理IP池服务,可供其他爬虫程序通过restapi获取☆116Updated 3 years ago
- lyq算法库,涉及到相关数据挖掘,解压缩,模式匹配,图算法等多领域算法☆132Updated 10 years ago
- 爬取百度指数和阿里指数,采用selenium,存入hbase,验证码自动识别,多线程控制☆32Updated 9 years ago
- 新词发现分布式机器学习算法。☆15Updated 11 years ago
- 滑块验证码破解,以工商滑块验证码为例。☆27Updated 8 years ago
- A data extraction tool for HousePricing(https://github.com/PENGZhaoqing/HousePricing)☆51Updated 9 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 10 years ago
- ☆14Updated 8 years ago
- 使用java+httpclient+httpcleaner,多线程、分布式爬去电商网站商品信息,数据存储在hbase上,并使用solr对商品建立索引,使用redis队列存储一个共享的url仓库;使用zookeeper对爬虫节点生命周期进行监视等。☆233Updated 5 years ago
- 小锋生活小助手——JAVA开发的基于爬虫和API实现的查询类微信公众号☆31Updated 7 years ago
- SpringBoot+Solr + webmagic JD商品爬取数据,放入solr中做搜索,学习下solr使用☆44Updated 8 years ago