最好的大数据项目。《Titan数据运营系统》,本项目是一个全栈闭环系统,我们有用作数据可视化的web系统,然后用flume-kafaka-flume进行日志的读取,在hive设计数仓,编写spark代码进行数仓表之间的转化以及ads层表到mysql的迁移,使用azkaban进行定时任务的调度,使用技术:Java/Scala语言,Hadoop、Spark、Hive、Kafka、Flume、Azkaban、SpringBoot,Bootstrap, Echart等;
☆143Nov 8, 2021Updated 4 years ago
Alternatives and similar repositories for TitanDataOperationSystem
Users that are interested in TitanDataOperationSystem are comparing it to the libraries listed below
Sorting:
- 大数据处理相关技术学习之路(持续更新中...)。 Bigdata整理 --> 慢慢滴~ 大数据相关技术包括离线处理,实时处理,OLAP等,如hadoop、spark、flink、hive、hbase、oozie...以 及大数据项目,如用户画像、数据仓库等,…☆332Jan 15, 2024Updated 2 years ago
- 基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。☆116May 16, 2022Updated 3 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Feb 19, 2018Updated 8 years ago
- A dockerized small bigdata cluster to play with☆13Jun 14, 2016Updated 9 years ago
- 为知笔记批量导出☆11Sep 1, 2022Updated 3 years ago
- 本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。☆19Mar 2, 2022Updated 4 years ago
- 大数据项目之用户上网行为分析☆62Jul 4, 2023Updated 2 years ago
- 电信大数据项目实战☆13Dec 27, 2018Updated 7 years ago
- phoenix 操作hbase和springboot的整合☆11Dec 7, 2017Updated 8 years ago
- 拉比克是一个开源大数据平台构建方案,已稳定应用于生产集群。融合Hadoop、Hive、Hbase、zookeeper等如CDH☆14Mar 11, 2019Updated 6 years ago
- 基于Hadoop、Spark、FLUME、HIVE等大数据组件搭建的一个分布式集群环境下的电影推荐及日志分析平台☆18Jan 6, 2023Updated 3 years ago
- spark大数据大型电商项目☆15May 26, 2020Updated 5 years ago
- 项目实战:Hadoop生态圈☆31Feb 27, 2018Updated 8 years ago
- 传统大数据分析工具以Hadoop、Spark为代表,集成了大量的技术框架, 对用户来说又重又笨又不灵活,难以维护和驾驭,国际和国内的敏捷型BI工具在对接时又面临性能、友好性、定制化能力弱的缺点。本项目独辟蹊径,以阿里开源的DataX为ETL工具,以列式数据库ClickHou…☆67Sep 28, 2020Updated 5 years ago
- skycloud-base 运维管理平台前端页面☆16Dec 10, 2022Updated 3 years ago
- 【雪球-Infra】功能:实现kafka消息实时落地hbase,支持csv/json字符串两种格式的消息,支持自定义组合rowkey,列簇和列名,支持按照kafka消息流中不同字段join不同的hbase表,并自定义写入列簇和列(join时需评估一下性能), …☆22Dec 5, 2023Updated 2 years ago
- 本项目主要用于搭建一个基于docker的实时监控系统,涉及的大数据相关组件有Filebeat,Kafka,Zookeeper,Flink,后端主要使用了SpringBoot进行开发,数据库使用了Redis做缓存,前端用了Vue框架,通过Ant Design组件库和Echar…☆42Jan 5, 2023Updated 3 years ago
- spark streaming从kafka读取消息,offset写入Redis,spark计算单词出现频率,最后写入hive表☆17Jul 30, 2019Updated 6 years ago
- spring cloud集成全渠道在线客服以及后台管理系统,所有微服务之间的消息传递采用区块链技术,持续更新中~~目标是:第一阶段:采用spring cloud微服务搭建后台管理系统第二阶段:集成在线客服,采用netty实现websocket长连接第三阶段:集成h5、微信、…☆18Dec 16, 2022Updated 3 years ago
- Spark Streaming+Flume+Kafka+HBase+Hadoop+Zookeeper实现实时日志分析统计;SpringBoot+Echarts实现数据可视化展示☆520Jul 25, 2018Updated 7 years ago
- 专注大数据 Spark ML 机器学习:监督学习、无监督学习,主要有:分类算法、回归算法、聚类算法、推荐算法、频繁模式挖掘算法☆17Nov 6, 2020Updated 5 years ago
- Spark 3.0.0 Structured Streaming Kafka Avro Demo☆15Apr 21, 2023Updated 2 years ago
- Spring-cloud-alibaba 微服务工程模板☆20Jan 20, 2023Updated 3 years ago
- 大数据收集,实时分析,离线分析经典案例☆21Apr 21, 2023Updated 2 years ago
- 基于flume+kafka+HBase+spark+ElasticSearch的用户轨迹查询大数据开发项目☆121Jun 17, 2022Updated 3 years ago
- ambari2.7.4,hdp3.1.4集成hue4.6.0,均是最新版☆19Jul 23, 2020Updated 5 years ago
- This project is used for tracking lineage when using spark. Our team is aimed at enhancing the ability of column relation during logical …☆20Jan 7, 2022Updated 4 years ago
- 大数据生态圈学习☆18Oct 5, 2022Updated 3 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆57Jun 17, 2022Updated 3 years ago
- 超实用的hive表数据、分区,hdfs文件的自动化清理工具☆20Jun 21, 2022Updated 3 years ago
- 从数据仓库到用户画像,从数据建设到数据应用☆626Jan 26, 2022Updated 4 years ago
- datax-kuduwriter☆11Aug 16, 2023Updated 2 years ago
- 基于大数据的图书推荐系统☆63Dec 8, 2021Updated 4 years ago
- 基于flink的电商实时数据分析、推荐、风控项目☆67Jul 24, 2022Updated 3 years ago
- 计算机毕业设计之Spark+Flink+Python考研预测分析 考研院校推荐系统 考研大数据分析大屏☆33Feb 18, 2022Updated 4 years ago
- 基于Spark2.2新闻网大数据实时系统项目☆62Apr 3, 2019Updated 6 years ago
- bigdata_tools☆28Mar 27, 2023Updated 2 years ago
- 通过HBase Observer同步数据到ElasticSearch☆55May 8, 2015Updated 10 years ago
- 大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。☆1,728Feb 12, 2026Updated 2 weeks ago