最好的大数据项目。《Titan数据运营系统》,本项目是一个全栈闭环系统,我们有用作数据可视化的web系统,然后用flume-kafaka-flume进行日志的读取,在hive设计数仓,编写spark代码进行数仓表之间的转化以及ads层表到mysql的迁移,使用azkaban进行定时任务的调度,使用技术:Java/Scala语言,Hadoop、Spark、Hive、Kafka、Flume、Azkaban、SpringBoot,Bootstrap, Echart等;
☆144Nov 8, 2021Updated 4 years ago
Alternatives and similar repositories for TitanDataOperationSystem
Users that are interested in TitanDataOperationSystem are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- 使用Hadoop、Spark等实现的大数据平台项目☆31Jun 21, 2022Updated 3 years ago
- 大数据处理相关技术学习之路(持续更新中...)。 Bigdata整理 --> 慢慢滴~ 大数据相关技术包括离线处理,实时处理,OLAP等,如hadoop、spark、flink、hive、hbase、oozie...以及大数据项目,如用户画像、数据仓库等,…☆343Jan 15, 2024Updated 2 years ago
- 基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。☆118May 16, 2022Updated 4 years ago
- spark大数据大型电商项目☆15May 26, 2020Updated 6 years ago
- 大数据项目之用户上网行为分析☆62Jul 4, 2023Updated 2 years ago
- Deploy to Railway using AI coding agents - Free Credits Offer • AdUse Claude Code, Codex, OpenCode, and more. Autonomous software development now has the infrastructure to match with Railway.
- datax-kuduwriter☆11Aug 16, 2023Updated 2 years ago
- spark streaming从kafka读取消息,offset写入Redis,spark计算单词出现频率,最后写入hive表☆17Jul 30, 2019Updated 6 years ago
- 实时数仓的一些数据处理(mysql、canal、kafka、flink、hbase、kudu等等),以及 一堆Flink的练习☆11Jul 1, 2022Updated 3 years ago
- 【雪球-Infra】功能:实现kafka消息实时落地hbase,支持csv/json字符串两种格式的消息,支持自定义组合rowkey,列簇和列名,支持按照kafka消息流中不同字段join不同的hbase表,并自定义写入列簇和列(join时需评估一下性能), …☆22Dec 5, 2023Updated 2 years ago
- 大数据收集,实时分析,离线分析经典案例☆21Apr 21, 2023Updated 3 years ago
- This project is used for tracking lineage when using spark. Our team is aimed at enhancing the ability of column relation during logical …☆20Jan 7, 2022Updated 4 years ago
- spark将hdfs数据高性能灌入kafka,然后spark streaming/structured streaming高速消费,关注性能,欢迎提供性能/代码优化建议☆32Mar 24, 2019Updated 7 years ago
- 基于Hadoop的视频收视率分析,毕设项目☆63Apr 24, 2026Updated last month
- 项目实战:Hadoop生态圈☆31Feb 27, 2018Updated 8 years ago
- GPUs on demand by Runpod - Special Offer Available • AdRun AI, ML, and HPC workloads on powerful cloud GPUs—without limits or wasted spend. Deploy GPUs in under a minute and pay by the second.
- 传统大数据分析工具以Hadoop、Spark为代表,集成了大量的技术框架, 对用户来说又重又笨又不灵活,难以维护和驾驭,国际和国内的敏捷型BI工具在对接时又面临性能、友好性、定制化能力弱的缺点。本项目独辟蹊径,以阿里开源的DataX为ETL工具,以列式数据库ClickHou…☆67Sep 28, 2020Updated 5 years ago
- Scala练习项目:包括scala基础知识,Spark RDD,DataFrame,Spark SQL,spark与HDFS、Phoenix、Hbase交互。☆12Nov 11, 2022Updated 3 years ago
- phoenix 操作hbase和springboot的整合☆11Dec 7, 2017Updated 8 years ago
- Spark Streaming+Flume+Kafka+HBase+Hadoop+Zookeeper实现实时日志分析统计;SpringBoot+Echarts实现数据可视化展示☆519Jul 25, 2018Updated 7 years ago
- 本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。☆22Mar 2, 2022Updated 4 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆60Jun 17, 2022Updated 3 years ago
- 用户埋点行为日志分析平台,项目主要用于搭建基于Flink、Apache Doris、Redis和MySQL等中间件的用户行为日志收集、存储、分析平台,支持用户自定义查询条件☆11Dec 28, 2023Updated 2 years ago
- 基于SparkSQL的电影分析项目实战☆39Nov 21, 2020Updated 5 years ago
- 拉比克是一个开源大数据平台构建方案,已稳定应用于生产集群。融合Hadoop、Hive、Hbase、zookeeper等如CDH☆14Mar 11, 2019Updated 7 years ago
- Virtual machines for every use case on DigitalOcean • AdGet dependable uptime with 99.99% SLA, simple security tools, and predictable monthly pricing with DigitalOcean's virtual machines, called Droplets.
- 从数据仓库到用户画像,从数据建设到数据应用☆638Jan 26, 2022Updated 4 years ago
- 基于Hadoop/Spark奥运会奖牌变化大数据分析实现毕业源码案例设计☆18Apr 30, 2023Updated 3 years ago
- 大数据项目:车流量监控☆67Jul 21, 2023Updated 2 years ago
- A naive hotel management system based on SpringBoot & Hadoop / 东南大学生产实训项目☆27Sep 13, 2021Updated 4 years ago
- 深圳地铁大数据客流分析系统🚇🚄🌟☆2,462May 12, 2026Updated last month
- A dockerized small bigdata cluster to play with☆13Jun 14, 2016Updated 9 years ago
- 本项目主要用于搭建一个基于docker的实时监控系统,涉及的大数据相关组件有Filebeat,Kafka,Zookeeper,Flink,后端主要使用了SpringBoot进行开发,数据库使用了Redis做缓存,前端用了Vue框架,通过Ant Design组件库和Echar…☆41Jan 5, 2023Updated 3 years ago
- 大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。☆1,775Apr 18, 2026Updated last month
- ❄️本仓库包含Java学习笔记和大数据学习笔记,主要包含Java基础、JavaWEB、Java框架、大数据主要框架。主要内容为:Java、Mysql、SSM、SpringBoot、MyBatisPlus、MyBatis、Hadoop、Hive、Flume、Kakfa、HBa…☆23Apr 20, 2023Updated 3 years ago
- Wordpress hosting with auto-scaling - Free Trial Offer • AdFully Managed hosting for WordPress and WooCommerce businesses that need reliable, auto-scalable performance. Cloudways SafeUpdates now available.
- 大数据相关框架实战项目(Hadoop, Spark, Storm, Flink)☆354Oct 4, 2022Updated 3 years ago
- 基于Hadoop、Spark、FLUME、HIVE等大数据组件搭建的一个分布式集群环境下的电影推荐及日志分析平台☆18Jan 6, 2023Updated 3 years ago
- ☆10Apr 13, 2020Updated 6 years ago
- 电信大数据项目实战☆13Dec 27, 2018Updated 7 years ago
- 流量监控☆14Oct 26, 2014Updated 11 years ago
- 在线编辑pdf文档☆11Jun 21, 2022Updated 3 years ago
- Spark电影数据分析实战,利用spark开发针对用户观影等历史行为数据进行采集 、分析和展示☆21Feb 3, 2021Updated 5 years ago