JetFeng / SohuSpider-JavaLinks
用java写的搜狐新闻爬虫
☆14Updated 8 years ago
Alternatives and similar repositories for SohuSpider-Java
Users that are interested in SohuSpider-Java are comparing it to the libraries listed below
Sorting:
- 基于Map/Reduce爬虫,可抽取各大新闻网站的新闻正文并进行分类和聚类☆76Updated 11 years ago
- 今日头条科技新闻接口爬虫☆17Updated 7 years ago
- 微博数据展示与舆情监控系统后台API☆68Updated 7 years ago
- 京东商品推荐系统-数据爬虫☆18Updated 10 years ago
- 豆瓣爬虫 爬取热门标签、图书信息、图书评论 系统架构 Webmagic+SSM+Redis+Mysql+ActiveMQ+Druid☆44Updated 6 years ago
- 工作寻(JobHunter)是一款招聘信息整合的网站,目前固定的模板有拉勾网,中华英才网,前程无忧。工作寻可以在线通过关键字,工作经验,工作地点实时爬取,也可以创建任务爬取定数量的招聘信息用以统计,分析最高薪资,最低薪资,平均薪资等。该项目为本科毕业设计项目。☆51Updated 6 years ago
- 人工智能开放平台☆32Updated 6 years ago
- 基于Nutch+ElasticSearch+MySQL+SSM的简易搜索引擎☆20Updated 8 years ago
- 一个简易的搜索引擎,采用Java开发☆32Updated 11 years ago
- “掌上苏大”是一款校园客户端应用,致力于服务苏州大学的师生,它的特点是贴近校园生活,包含消息中心、跳蚤市场、勤工俭学、校园新闻、苏大周边、交通查询、时事经纬、视频教程、真题库、考研信息、自考助学、课程表、个人中心、网站导航、音乐天地、流量查询、软件管理、设置中心等若干模块,…☆35Updated 9 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆35Updated 7 years ago
- 基于scrapy-redis的分布式新闻爬虫,可同时获取腾讯、网易、搜狐、凤凰网、新浪、东方财富、人民网等各大平台新闻资讯☆44Updated 7 years ago
- 马蜂窝旅游数据,包括酒店、美食、景点的评论数据以及游记数据☆48Updated 7 years ago
- 美番MOFO项目集IOS/Android/Boss/官网/微信公众号/微信小程序于一体的摄影圈内容社交平台,以平台用户流量引流到电商变现的项目。致力于打造业内最好的摄影爱好者聚集地,涵盖圈子社交,大咖论坛,系列教程,器材租售,模特互动,更有各类线上线下活动,为大家带来更多的…☆33Updated 7 years ago
- 医疗数据爬虫、简单病症分析及医疗资源推荐☆66Updated 3 years ago
- 金融数据爬虫☆28Updated 9 years ago
- 基于TF-IDF模型的文本相似度分析软件☆13Updated 7 years ago
- 重写网盘系统,基于SpringMVC、MySQL、Redis,计划同时完成web端和Android端☆49Updated 2 years ago
- 新闻网站爬虫,目前能够爬取网易,新浪,qq,搜狐等三家网站的新闻页面,并保存到本地。☆34Updated 10 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆20Updated 6 years ago
- TuShare是一个免费、开源的python财经数据接口包。主要实现对股票等金融数据从数据采集、清洗加工 到 数据存储的过程,能够为金融分析人员提供快速、整洁、和多样的便于分析的数据,为他们在数据获取方面极大地减轻工作量,使他们更加专注于策略和模型的研究与实现上。☆36Updated 9 years ago
- 电商+大数据+spark机器学习☆17Updated 7 years ago
- 基于SSH框架的BOS物流管理系统,eclipse+maven+svn+powerdesigner☆50Updated 7 years ago
- 天亮舆情系统之天亮舆情采集器,基于master/slave结构开发的分布采集器系统☆22Updated 2 years ago
- 一个功能类似淘宝商城的销售门户网站,包含前台商品分类展示查询,搜索,用户注册评价留言,下订单,查询订单;后台用户角色权限,商品,厂家,留言评价,新闻广告订单管理...☆97Updated 12 years ago
- 1、支持网页爬虫 2、多线程、线程池 3、支持全文搜索 4、支持Hadoop分布式平台、HDFS/MapReduce、Zookeeper、HBase 5、支持redis分布式缓存 6、集成微信公众号开发 7、Spring4新特性 8、ActiveMQ 9、Nginx详细配置…☆16Updated 2 years ago
- 微信开发框架:订阅号、企业号、小程序、后台代码生成器 采用的sdk为:☆31Updated 7 years ago
- 慕课网 首页 实战 路径 猿问 手记 登录 注册 11.11 Python 手记 \ 史上最全,最详idea搭建springdata+mongoDB+maven+springmvc 史上最全,最详idea搭建springdata+mongoDB+maven+springm…☆165Updated 8 years ago
- 视频教育网站☆16Updated 6 years ago
- 小锋生活小助手——JAVA开发的基于爬虫和API实现的查询类微信公众号☆31Updated 7 years ago