jianiuqi / CTripSpiderLinks
爬取携程酒店数据
☆31Updated 8 years ago
Alternatives and similar repositories for CTripSpider
Users that are interested in CTripSpider are comparing it to the libraries listed below
Sorting:
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆74Updated 11 years ago
- 网络爬虫☆51Updated 11 years ago
- 读书笔记《自己动手写网络爬虫》,自己敲的代码。主要记录了网络爬虫的基本实现,网页去重的算法,网页指纹算法,文本信息挖掘☆47Updated 10 years ago
- 知乎爬虫,基于webmagic框架 .A java web spider base on webmagic.☆69Updated 9 years ago
- 舆情搜索服务框架,其中lucene和solr版本为4.8。☆61Updated 9 years ago
- 基于hadoop思维的分布式网络爬虫。☆86Updated 9 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 10 years ago
- 基于nutch的新闻分类系统☆34Updated 9 years ago
- 微博情感分析☆12Updated 12 years ago
- lyq算法库,涉及到相关数据挖掘,解压缩,模式匹配,图算法等多领域算法☆132Updated 10 years ago
- 豆瓣爬虫 爬取热门标签、图书信息、图书评论 系统架构 Webmagic+SSM+Redis+Mysql+ActiveMQ+Druid☆43Updated 6 years ago
- webmagic 爬取我喜欢的网易云歌单+评论☆51Updated 8 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- 天亮舆情系统之天亮舆情采集器,基于master/slave结构开发的分布采集器系统☆22Updated 3 years ago
- 轻松搞定微服务系列☆26Updated 6 years ago
- 中国明星数据爬取。你甚至可以拿到互联网上所有的人之间的关系,接下来你可以自己发挥!基于这些数据,你可以完成更多有趣的事情。比如说社交网络分析, 关系网络可视化,算法研究,和其他有意思的事情。Chinese star data crawling. You can even ge…☆28Updated 7 years ago
- Spider_SinaTweetCrawler, to crawl tweet content from sinaTweet. (java)☆23Updated 8 years ago
- java 基于selenium抓取搜狗微信公众号文章☆50Updated 9 years ago
- 分布式大数据SQL查询可视化界面!☆68Updated 10 years ago
- 慕课网 首页 实战 路径 猿问 手记 登录 注册 11.11 Python 手记 \ 史上最全,最详idea搭建springdata+mongoDB+maven+springmvc 史上最全,最详idea搭建springdata+mongoDB+maven+springm…☆164Updated 8 years ago
- 小锋生活小助手——JAVA开发的基于爬虫和API实现的查询类微信公众号☆31Updated 7 years ago
- 房价数据爬取+分析☆33Updated 8 years ago
- 模仿Java标准库的一些API实现的算法库,包括了数据结构,字符串处理(StringBuilder),图(有向图)。原来是用Python实现的,但是Python实现的并没有经过完整的测试,不能够保证完全的正确性。 使用Java实现的集合库都经过完整的测试,实际上,我在实现的…☆50Updated 10 years ago
- 开源框架研究,经典书籍阅读等笔记☆59Updated 2 years ago
- Netty教程 - Netty是一个java开源框架。Netty提供异步的、事件驱动的网络应用程序框架和工具,用以快速开发高性能、高可靠性的网络服务器和客户端程序。☆28Updated 8 years ago
- 1、支持网页爬虫 2、多线程、线程池 3、支持全文搜索 4、支持Hadoop分布式平台、HDFS/MapReduce、Zookeeper、HBase 5、支持redis分布式缓存 6、集成微信公众号开发 7、Spring4新特性 8、ActiveMQ 9、Nginx详细配置…☆16Updated 2 years ago
- spring整合webmagic,mybatis,dungproxy☆29Updated 2 years ago
- 电商爬虫系统:京东,当当,一号店,国美爬虫(代理使用);论坛、新闻、豆瓣爬虫☆104Updated 7 years ago
- 阿里巴巴大数据竞赛☆63Updated 11 years ago
- 可能是最好用的微信公众号Java开发包☆109Updated 9 years ago