JetFeng / SohuSpider-JavaLinks
用java写的搜狐新闻爬虫
☆14Updated 8 years ago
Alternatives and similar repositories for SohuSpider-Java
Users that are interested in SohuSpider-Java are comparing it to the libraries listed below
Sorting:
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆74Updated 11 years ago
- 微博数据展示与舆情监控系统后台API☆69Updated 7 years ago
- 今日头条科技新闻接口爬虫☆17Updated 7 years ago
- 网络舆情爬虫 实现元搜索(MetaSearch)和随机URL(主要是五大门户网站)的抓取。☆13Updated 8 years ago
- 新浪新闻爬虫☆15Updated 10 years ago
- 基于scrapy-redis的分布式新闻爬虫,可同时获取腾讯、网易、搜狐、凤凰网、新浪、东方财富、人民网等各大平台新闻资讯☆44Updated 7 years ago
- 新闻爬虫 (腾讯,网易,新浪,今日头条,搜狐,凤凰网,腾讯滚动新闻)☆57Updated 7 years ago
- 百度新闻爬虫 http://blog.csdn.net/xiaojimanman/article/details/40891791☆8Updated 9 years ago
- 中国明星数据爬取。你甚至可以拿到互联网上所有的人之间的关系,接下来你可以自己发挥!基于这些数据,你可以完成更多有趣的事情。比如说社交网络分析,关系网络可视化,算法研究,和其他有意思的事情。Chinese star data crawling. You can even ge…☆28Updated 7 years ago
- "奇伢爬虫"是基于sprint boot 、 WebMagic 实现 微信公众号文章、新闻、csdn、info等网站文章爬取,可以动态设置文章爬取规则、清洗规则,基本实现了爬取大部分网站的文章。☆324Updated 7 years ago
- 金融数据爬虫☆28Updated 9 years ago
- 豆瓣爬虫 爬取热门标签、图书信息、图书评论 系统架构 Webmagic+SSM+Redis+Mysql+ActiveMQ+Druid☆44Updated 6 years ago
- 系统从互联网爬取资讯,对热点公共事件进行检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆94Updated 7 years ago
- 新闻网站爬虫,目前能够爬取网易,新浪,qq,搜狐等三家网站的新闻页面,并保存到本 地。☆34Updated 10 years ago
- 基于SSH框架的BOS物流管理系统,eclipse+maven+svn+powerdesigner☆50Updated 7 years ago
- 这是一个心理测试网站,主要利用了ssh框架 来实现了有关于后台管理,用户注册,以及心理测评☆11Updated 7 years ago
- Lianjia house spider链家二手房爬虫~ Springboot + Webmagic + Mysql + Redis☆26Updated 4 years ago
- 工作寻(JobHunter)是一款招聘信息整合的网站,目前固定的模板有拉勾网,中华英才网,前程无忧。工作寻可以在线通过关键字,工作经验,工作地点实时爬取,也可以创建任务爬取定数量的招聘信息用以统计,分析最高薪资,最低薪资,平均薪资等。该项目为本科毕业设计项目。☆51Updated 6 years ago
- 一个用Solr做企业应用内的搜索引擎的demo;目前仅能实现对MySql数据库表和富文本(pdf、word、excel、ppt等)的全文检索☆33Updated 8 years ago
- 医疗数据爬虫、简单病症分析及医疗资源推荐☆66Updated 4 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆20Updated 9 years ago
- 一个企业商品展示的网站项目,包括首页,新闻展示,商品展示,在线聊天,留言簿,后台管理等功能的简单网站☆37Updated 9 years ago
- 小锋生活小助手——JAVA开发的基于爬虫和API实现的查询类微信公众号☆31Updated 7 years ago
- 人工智能开放平台☆32Updated 6 years ago
- 一个功能类似淘宝商城的销售门户网站,包含前台商品分类展示查询,搜索,用户注册评价留言,下订单,查询订单;后台用户角色权限,商品,厂家,留言评价,新闻广告订单管理...☆97Updated 12 years ago
- 慕课网 首页 实战 路径 猿问 手记 登录 注册 11.11 Python 手记 \ 史上最全,最详idea搭建springdata+mongoDB+maven+springmvc 史上最全,最详idea搭建springdata+mongoDB+maven+springm…☆165Updated 8 years ago
- 京东商品推荐系统-数据爬虫☆18Updated 10 years ago
- 模拟在线考试系统或者在线问答系统。系统从内置试题库随机分发试卷,并产生结果分析。☆85Updated 8 years ago
- 一个简易的搜索引擎,采用Java开发☆32Updated 11 years ago
- 这是一个工具程 序集合,方便我们平时对数据进行预处理。针对文本处理的内容较多。包括分词(集成了张华平分词、结巴分词)、文件处理增强(如读取文本到Map中,保存文本到Map)和语料模型(把文档转换成矩阵,就算单词数量等)☆21Updated 9 months ago