JetFeng / SohuSpider-JavaLinks
用java写的搜狐新闻爬虫
☆14Updated 8 years ago
Alternatives and similar repositories for SohuSpider-Java
Users that are interested in SohuSpider-Java are comparing it to the libraries listed below
Sorting:
- 新浪新闻爬虫☆15Updated 10 years ago
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆74Updated 11 years ago
- 基于scrapy-redis的分布式新闻爬虫,可同时获取腾讯、网易、搜狐、凤凰网、新浪、东 方财富、人民网等各大平台新闻资讯☆47Updated 7 years ago
- 微博数据展示与舆情监控系统后台API☆67Updated 7 years ago
- 今日头条科技新闻接口爬虫☆17Updated 8 years ago
- "奇伢爬虫"是基于sprint boot 、 WebMagic 实现 微信公众号文章、新闻、csdn、info等网站文章爬取,可以动态设置文章爬取规则、清洗规则,基本实现了爬取大部分网站的文章。☆324Updated 8 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- 多线程爬虫--抓取淘宝商品详情页URL☆128Updated 6 years ago
- 系统从互联网爬取资讯,对热点公共事件进行检测、聚合和追踪,多维度分析事件内容,监测时间传播路径,分析用户的观点和和情绪,形成摘要、报告、图表等分析结果,实现公共事件的舆情分析可视化系统,提供专业的舆情监测、分析和预警服务☆98Updated 7 years ago
- 医疗数据爬虫、简单病症分析及医疗资源推荐☆64Updated 4 years ago
- 小锋生活小助手——JAVA 开发的基于爬虫和API实现的查询类微信公众号☆31Updated 7 years ago
- 这是一个心理测试网站,主要利用了ssh框架 来实现了有关于后台管理,用户注册,以及心理测评☆12Updated 8 years ago
- 新闻网站爬虫,目前能够爬取网易,新浪,qq,搜狐等三家网站的新闻页面,并保存到本地。☆34Updated 10 years ago
- 新闻爬虫 (腾讯,网易,新浪,今日头条,搜狐,凤凰网,腾讯滚动新闻)☆58Updated 7 years ago
- 金融数据爬虫☆28Updated 9 years ago
- 网络舆情爬虫 实现元搜索(MetaSearch)和随机URL(主要是五大门户网站)的抓取。☆13Updated 9 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆36Updated 8 years ago
- 豆瓣爬虫 爬取热门标签、图书信息、图书评论 系统架构 Webmagic+SSM+Redis+Mysql+ActiveMQ+Druid☆43Updated 6 years ago
- 一个简易的搜索引擎,采用Java开发☆32Updated 11 years ago
- 舆情分析平台☆34Updated 8 years ago
- 知乎爬虫/可以爬出关注关系的爬虫☆307Updated 5 months ago
- spring-boot集成neo4j图形数据库,并实现简单的节点创建和查询☆39Updated 7 years ago
- 互联网新闻推荐系统(myNews)--2016全国计算机设计大赛企业命题参赛作品☆44Updated 8 years ago
- 工作寻(JobHunter)是一款招聘信息整合的网站,目前固定的模板有拉勾网,中华英才网,前程无忧。工作寻可以在线通过关键字,工作经验,工作地点实时爬取,也可以创建任务爬取定数量的招聘信息用以统计,分析最高薪资,最低薪资,平均薪资等。该项目为本科毕业设计项目。☆52Updated 7 years ago
- 语音情绪识别--微信小程序☆18Updated 8 years ago
- 用java实现的贝叶斯分类算法。用于大数据的分类。☆42Updated 10 years ago
- 京东商品推荐系统-数据爬虫☆18Updated 10 years ago
- 一个企业商品展示的网站项目,包括首页,新闻展示,商品展示,在线聊天,留言簿,后台管理等功能的简单网站☆37Updated 9 years ago
- 针对手机评论数据的情感挖掘与分析项目,基于依存句法分析和情感词库提取特征词,并对特征词做情感极性预测标注。☆36Updated 9 years ago
- 今日头条爬虫,主要爬取关键词搜索结果,包含编辑距离算法、奇异值分解、k-means聚类。☆72Updated 6 years ago