JetFeng / SohuSpider-JavaLinks
用java写的搜狐新闻爬虫
☆14Updated 8 years ago
Alternatives and similar repositories for SohuSpider-Java
Users that are interested in SohuSpider-Java are comparing it to the libraries listed below
Sorting:
- 新浪新闻爬虫☆15Updated 10 years ago
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆74Updated 11 years ago
- 微博数据展示与舆情监控系统后台API☆68Updated 7 years ago
- 今日头条科技新闻接口爬虫☆17Updated 8 years ago
- 工作寻(JobHunter)是一款招聘信息整合的网站,目前固定的模板有拉勾网,中华英才网,前程无忧。工作寻可以在线通过关键字,工作经验,工作地点实时爬取,也可以创建任务爬取定数量的招聘信息用以统计,分析最高薪资,最低薪资,平均薪资等。该项目为本科毕业设计项目。☆51Updated 7 years ago
- "奇伢爬虫"是基于sprint boot 、 WebMagic 实现 微信公众号文章、新闻、csdn、info等网站文章爬取,可以动态设置文章爬取规则、清洗规则,基本实现了爬取大部分网站的文章。☆324Updated 8 years ago
- 基于scrapy-redis的分布式新闻爬虫,可同时获取腾讯、网易、搜狐、凤凰网、新浪、东方财富、人民网等各大平台新闻资讯☆46Updated 7 years ago
- 豆瓣爬虫 爬取热门标签、图书信息、图书评论 系统架构 Webmagic+SSM+Redis+Mysql+ActiveMQ+Druid☆43Updated 6 years ago
- 系统从互联网爬取资讯,对热点公共事件进行检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆96Updated 7 years ago
- 金融数据爬虫☆28Updated 9 years ago
- 新闻网站爬虫,目前能够爬取网易,新浪,qq,搜狐等三家网站的新闻页面,并保存到本地。☆34Updated 10 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆36Updated 8 years ago
- 一个简易的搜索引擎,采用Java开发☆32Updated 11 years ago
- 医疗数据爬虫、简单病症分析及医疗资源推荐☆64Updated 4 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- 语音情绪识别--微信小程序☆18Updated 7 years ago
- 这是一个心理测试网站,主要利用了ssh框架 来实现了有关于后台管理,用户注册,以及心理测评☆12Updated 8 years ago
- 多线程爬虫--抓取淘宝商品详情页URL☆128Updated 6 years ago
- 网络舆情爬虫 实现元搜索(MetaSearch)和随机URL(主要是五大门户网站)的抓取。☆13Updated 9 years ago
- 互联网新闻推荐系统(myNews)--2016全国计算机设计大赛企业命题参赛作品☆45Updated 8 years ago
- 用java实现的贝叶斯分类算法。用于大数据的分类。☆42Updated 9 years ago
- TuShare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。☆38Updated 9 years ago
- 小锋生活小助手——JAVA开发的基于爬虫和API实现的查询类微信公众号☆31Updated 7 years ago
- 一个企业商品展示的网站项目,包括首页,新闻展示,商品展示,在线聊天,留言簿,后台管理等功能的简单网站☆37Updated 9 years ago
- 马蜂窝旅游数据,包括酒店、美食、景点的评论数据以及游记数据☆48Updated 8 years ago
- 京东商品推荐系统-数据爬虫☆18Updated 10 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆20Updated 6 years ago
- 中国明星数据爬取。你甚至可以拿到互联网上所有的人之间的关系,接下来你可以自己发挥!基于这些数据,你可以完成更多有趣的事情。比如说社交网络分析,关系网络可视化,算法研究,和其他有意思的事情。Chinese star data crawling. You can even ge…☆28Updated 7 years ago
- 新闻爬虫 (腾讯,网易,新浪,今日头条,搜狐,凤凰网,腾讯滚动新闻)☆58Updated 7 years ago
- 慕课网 首页 实战 路径 猿问 手记 登录 注册 11.11 Python 手记 \ 史上最全,最详idea搭建springdata+mongoDB+maven+springmvc 史上最全,最详idea搭建springdata+mongoDB+maven+springm…☆164Updated 8 years ago