Even-github / JobCrawlerLinks
拉勾网爬虫及数据可视化项目
☆12Updated 3 years ago
Alternatives and similar repositories for JobCrawler
Users that are interested in JobCrawler are comparing it to the libraries listed below
Sorting:
- 大数据招聘信息分析平台☆46Updated 9 years ago
- 使用Storm实时处理交通大数据(数据源:kafka,集群管理:zookeeper)☆51Updated 3 years ago
- 在公司接了一个任务,完成一个项目数据同步的模块。要求是不能操作项目的数据库。怕操作不当,数据丢失。所以想到的方案是使用log4jdbc记录数据源的SQL语句到日志文件。然后按行读取日志文件中的数据,记录读取的Point,以便下次继续读取。读取的数据进入bigqueue队列,…☆12Updated 8 years ago
- 大数据企业实训项目:基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分布式云盘系统。使用Hadoop HDFS作为文件存储系统、HBase作为数据存储仓库,采用SpringMVC+Spring框架实现,包括用户注册与登录、我的网盘、关注用户、我…☆141Updated 7 years ago
- 使用SpringBoot开发的基于HBASE的大数据存储分布式云计算笔记(后端)☆34Updated 6 years ago
- 基于spark streaming+flume+kafka+hbase的实时日志处理分析系统(分为控制台版本和基于springboot、Echarts等的Web UI可视化版本)☆39Updated 2 years ago
- 基于Flink流处理的动态实时亿级全端用户画像系统可视化界面☆36Updated 3 years ago
- Spark混合推荐系统大数据监控平台☆11Updated 7 years ago
- spark流式计算电商商品关注度+推荐系统/关联系统☆14Updated 8 years ago
- 使用 SpringBoot2.0+ElasticSearch 实现的开源电影搜索引擎☆88Updated 3 years ago
- 用于数据迁移、缓存预热,springboot架构。支持数据区间分割、动态调整线程池配置、任务进度实时查看等特性☆45Updated 8 years ago
- 中阳保险管理系统☆14Updated 7 years ago
- 一个大数据实时流处理日志分析系统 Demo☆30Updated 3 years ago
- 项目主要着手于获取最新最热新闻资讯,通过大数据分析用户喜好精确推送咨询新闻。是对在线教育平台业务进行大数据统计分析的系统。碎片化、切换频繁、社交化和个性化现如今成为人们阅读行为的标签。项目对海量信息进行搜集,通过系统计算分类,分析用户的兴趣进行推送从而满足用户的需求。☆22Updated 5 years ago
- 工作寻(JobHunter)是一款招聘信息整合的网站,目前固定的模板有拉勾网,中华英才网,前程无忧。工作寻可以在线通过关键字,工作经验,工作地点实时爬取,也可以创建任务爬取定数量的招聘信息用以统计,分析最高薪资,最低薪资,平均薪资等。该项目为本科毕业设计项目。☆53Updated 7 years ago
- 本项目主要用于搭建一个基于docker的实时监控系统,涉及的大数据相关组件有Filebeat,Kafka,Zookeeper,Flink,后端主要使用了SpringBoot进行开发,数据库使用了Redis做缓存,前端用了Vue框架,通过Ant Design组件库和Echar…☆42Updated 3 years ago
- 分布式卡包应用:用户子系统包含 优惠券库存功能实现、用户优惠券功能实现、领取优惠券功能实现、可用优惠券功能实现、已使用优惠券功能实现、用户所有的优惠券功能实现、用户使用优惠券功能实现、评论功能实现。 技术栈:Springboot+kafka+Redis+HBase☆14Updated 6 years ago
- java爬虫,反爬虫策略、ETL清洗数据,以及spark离线和实时分析新闻并存入ES☆20Updated 7 years ago
- 大数据建模分析平台☆67Updated 7 years ago
- 论坛日志分析系统清洗程序(包含IP规则库,UDF开发,MapReduce程序,日志数据)☆33Updated 7 years ago
- 共享单车综合管控大数据分析平台☆19Updated 3 years ago
- 这是一个模拟的博客系统,利用业余时间开发,旨在巩固整个软件开发周期内的各项流程,以开发技术练习为主,文档和工具练习为辅。力求重要的流程都有文档可以追溯、关键的技术点都有笔记进行记录。☆17Updated 3 years ago
- 京东商品推荐系统-数据爬虫☆18Updated 10 years ago
- 基于redis的分布式锁,适用于秒杀,自增ID等web分布式开发场景☆11Updated 8 years ago
- 数据分析快速开发平台:包含统一数据访问接口,数据建模,数据治理,数据展现☆23Updated 7 years ago
- 面向学校、学院、老师的网盘,存储个人文件资源☆17Updated 8 years ago
- 大数据生态圈学习☆18Updated 3 years ago
- 基于spark的外卖大数据平台分析系统☆47Updated 7 years ago
- web项目快速构建平台,由Java开发实现,无需编写代码,根据页面及组件等配置既能快速构建一个web项目☆29Updated 7 years ago
- 慕课网广告系统设计微服务☆33Updated 3 years ago