JetFeng / SohuSpider-JavaLinks
用java写的搜狐新闻爬虫
☆15Updated 8 years ago
Alternatives and similar repositories for SohuSpider-Java
Users that are interested in SohuSpider-Java are comparing it to the libraries listed below
Sorting:
- 今日头条科技新闻接口爬虫☆18Updated 7 years ago
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆77Updated 11 years ago
- 微博数据展示与舆情监控系统后台API☆68Updated 7 years ago
- 新浪新闻爬虫☆15Updated 10 years ago
- 基于scrapy-redis的分布式新闻爬虫,可同时获取腾讯、网易、搜狐、凤凰网、新浪、东方财富、人民网等各大平台新闻资讯☆44Updated 7 years ago
- 利用Java网络爬虫爬取重庆大学新闻网站数据,依据解析的数据构建的新闻网站☆12Updated 9 years ago
- 金融数据爬虫☆28Updated 9 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆21Updated 6 years ago
- 马蜂窝旅游数据,包括酒店、美食、景点的评论数据以及游记数据☆48Updated 7 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- 小锋生活小助手——JAVA开发的基于爬虫和API实现的查询类微信公众号☆31Updated 6 years ago
- 豆瓣爬虫 爬取热门标签、图书信息、图书评论 系统架构 Webmagic+SSM+Redis+Mysql+ActiveMQ+Druid☆44Updated 6 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆35Updated 7 years ago
- 一个简易的搜索引擎,采用Java开发☆32Updated 11 years ago
- 【爬虫】基于Scrapy开发的微博(评论、转发、点赞)爬虫,可以批量抓取。☆27Updated 8 years ago
- 爬虫程序:支持爬取问答类网站(Quora/SO/Yahoo Answer/知乎/百度知道等)、百科类网站(百度百科/中英文维基百科等)、博客类网站(CSDN/Twitter等)☆27Updated 7 years ago
- 人工智能开放平台☆32Updated 6 years ago
- 百度新闻爬虫 http://blog.csdn.net/xiaojimanman/article/details/40891791☆9Updated 9 years ago
- SpringBoot整合weixin-java-tools实现微信公众号登录授权☆12Updated 6 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆20Updated 8 years ago
- 小爬虫☆29Updated 7 years ago
- 这是一个心理测试网站,主要利用了ssh框架 来实现了有关于后台管理,用户注册,以及心理测评☆11Updated 7 years ago
- spring-boot集成neo4j图形数据库,并实现简单的节点创建和查询☆39Updated 7 years ago
- 新闻爬虫 (腾讯,网易,新浪,今日头条,搜狐,凤凰网,腾讯滚动新闻)☆57Updated 6 years ago
- 京东商品推荐系统-数据爬虫☆18Updated 10 years ago
- 一个用Solr做企业应用内的搜索引擎的demo;目前仅能实现对MySql数据库表和富文本(pdf、word、excel、ppt等)的全文检索☆33Updated 8 years ago
- 天亮舆情系统之天亮舆情采集器,基于master/slave结构开发的分布采集器系统☆22Updated 2 years ago
- 无限极分销系统☆21Updated 9 years ago
- 理想周行:旅游出行之约拍摄影平台(微信小程序)☆31Updated 6 years ago
- JEECMS是一款基于JAVA技术研发的站群管理系统。 1、支持大规模网站群管理; 2、跨站全文检索、数据共享; 3、微官网/手机网站同步建设; 4、高效二次开发的插件化管理 5、支持可视化模板制作;☆26Updated 8 years ago