一个开源、成体系的大数据学习教程。spark学习 hadoop hive hbase flink教程 linux 从入门到精通
☆283Nov 27, 2019Updated 6 years ago
Alternatives and similar repositories for big-data
Users that are interested in big-data are comparing it to the libraries listed below
Sorting:
- 关于大数据的面试题,包括hadoop、hbase、hive、spark、storm、zookeeper、kafka、flume、logstash、redis、ELK、ETL、算法等等,持续更新中☆447Mar 31, 2019Updated 6 years ago
- 大数据相关框架实战项目(Hadoop, Spark, Storm, Flink)☆352Oct 4, 2022Updated 3 years ago
- 定期更新Hadoop生态圈中常用大数据组件文档 重心依次为: Flink Solr Sparksql ES Scala Kafka Hbase/phoenix Redis Kerberos (项目包含hadoop思维导图 印象笔记 Scala版本简单demo …☆923Mar 23, 2023Updated 2 years ago
- 💎🔥大数据学习笔记☆681May 13, 2019Updated 6 years ago
- 大数据博客、笔试题、教程、项目、面经的整理☆558Dec 21, 2020Updated 5 years ago
- 大数据实践项目 Hadoop、Spark、Kafka、Hbase、Flink.....☆539May 14, 2019Updated 6 years ago
- 全套大数据基础学习教程,包含最基础的centos、maven。大数据主要包含hdfs、mr、yarn、hbase、kafka、scala、sparkcore、sparkstreaming、sparksql。教程包含所有的源代码演示以及在线文档说明。☆54Oct 4, 2022Updated 3 years ago
- BigData Project 大数据项目由浅入深☆650Nov 30, 2017Updated 8 years ago
- flink简易使用教程,结合官方仓库的example样例,结合常见场景,使用flink的基本功能☆118Jun 21, 2022Updated 3 years ago
- [大数据面试题]分享自己在网络上收集的大数据相关的面试题以及自己的答案总结.目前包含Hadoop/Hive/Spark/Flink/Hbase/Kafka/Zookeeper框架的面试题知识总结☆1,651Aug 30, 2021Updated 4 years ago
- 一个大数据架构师应该掌握的技能☆473Sep 2, 2019Updated 6 years ago
- 专注大数据学习面试,大数据成神之路开启。Flink/Spark/Hadoop/Hbase/Hive...☆10,426Aug 7, 2023Updated 2 years ago
- Flink 案例开发数据清洗、数据报表☆57Sep 13, 2025Updated 5 months ago
- Spark、Hadoop、Flink、Storm、Kafka编程实例学习☆170Apr 25, 2017Updated 8 years ago
- Java开发者或者大数据开发者面试知识点整理☆254Feb 25, 2019Updated 7 years ago
- 学习 Spark 的一个小项目,以及其中各种调优的笔记☆177Jul 20, 2017Updated 8 years ago
- 【大数据必备】非科班转行Java大数据面经分享☆466Jul 1, 2022Updated 3 years ago
- java 进阶之路:面试高频算法、akka、多线程、NIO、Netty、SpringBoot、Spark&&Flink 等☆129Oct 11, 2023Updated 2 years ago
- 关于 HDFS,Yarn,MapReduce,HBase,Hive,Pig,Sqoop,Flume,Zookeeper,MemCached,Redis,Storm,Scala,Spark,Flink 等大数据框架的学习笔记☆76Sep 18, 2019Updated 6 years ago
- 大数据入门指南☆16,871Jan 5, 2024Updated 2 years ago
- Spark 学习之路,包含 Spark Core,Spark SQL,Spark Streaming,Spark mllib 学习笔记☆145Jul 3, 2018Updated 7 years ago
- 电商用户行为分析大数据平台☆1,091Nov 16, 2022Updated 3 years ago
- Apache Spark 官方文档中文版☆1,184Jul 21, 2023Updated 2 years ago
- 电商大数据项目-推荐系统(java和scala语言)☆203Jul 18, 2023Updated 2 years ago
- 中国大陆大学列表爬虫☆11Mar 27, 2019Updated 6 years ago
- Simple tool in Python to help monitoring ram/cpu/io usage around ceph.☆10Jul 29, 2016Updated 9 years ago
- Hadoop3.2 single/cluster mode with web terminal gotty, spark, jupyter pyspark, hive, eco etc.☆11Nov 7, 2019Updated 6 years ago
- 大数据面试知识点☆45Jan 18, 2021Updated 5 years ago
- 大数据学习,从零开始学习大数据,包含大数据学习各阶段学习视频、面试资料☆3,140Jan 20, 2026Updated last month
- 迁移工具,目标是Oracle,MySQL,SqlServer到PostgreSQL的单项迁移,PostgreSQL和大数据平台Hive,Hbase,Impala等的双向迁移。☆10Dec 3, 2014Updated 11 years ago
- ☆11Nov 16, 2022Updated 3 years ago
- 《Spark 大型电商项目实战》源码,博客地址:http://blog.csdn.net/u012318074/article/category/6744423☆214Nov 14, 2023Updated 2 years ago
- 大数据学习,主要涉及Kafka、ZooKeeper、Hive、HBase、Spark☆46Aug 22, 2019Updated 6 years ago
- 使用Spark GraphX基于PageRank算法构建一个仿微博用户好友的分布式推荐系统。☆24Aug 26, 2018Updated 7 years ago
- Spark 、Flink等离线任务的调度以及实时任务的监控☆306Nov 13, 2025Updated 3 months ago
- 大数据/数据挖掘/推荐系统/机器学习相关资源☆1,413Oct 14, 2019Updated 6 years ago
- ☆42Oct 24, 2020Updated 5 years ago
- Easy Scheduler是一个分布式工作流任务调 度系统,主要解决数据研发ETL错综复杂的依赖关系,而不能直观监控任务健康状态等问题。Easy Scheduler以DAG流式的方式将Task组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及Kil…☆10Apr 9, 2019Updated 6 years ago
- 基于Flink实现的商品实时推荐系统。flink统计商品热度,放入redis缓存,分析日志信息,将画像标签和实时记录放入Hbase。在用户发起推荐请求后,根据用户画像重排序热度榜,并结合协同过滤和标签两个推荐模块为新生成的榜单的每一个产品添加关联产品,最后返回新的用户列表。☆4,471Feb 4, 2024Updated 2 years ago