最好的大数据项目。《Titan数据运营系统》,本项目是一个全栈闭环系统,我们有用作数据可视化的web系统,然后用flume-kafaka-flume进行日志的读取,在hive设计数仓,编写spark代码进行数仓表之间的转化以及ads层表到mysql的迁移,使用azkaban进行定时任务的调度,使用技术:Java/Scala语言,Hadoop、Spark、Hive、Kafka、Flume、Azkaban、SpringBoot,Bootstrap, Echart等;
☆144Nov 8, 2021Updated 4 years ago
Alternatives and similar repositories for TitanDataOperationSystem
Users that are interested in TitanDataOperationSystem are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- 使用Hadoop、Spark等实现的大数据平台项目☆31Jun 21, 2022Updated 3 years ago
- 大数据处理相关技术学习之路(持续更新中...)。 Bigdata整理 --> 慢慢滴~ 大数据相关技术包括离线处理,实时处理,OLAP等,如hadoop、spark、flink、hive、hbase、oozie...以及大数据项目,如用户画像、数据仓库等,…☆340Jan 15, 2024Updated 2 years ago
- SparkStreaming项目,显示flume->Kafka->Spark->hbase(实时数据处理方案),Scala实现☆36Feb 19, 2018Updated 8 years ago
- 基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。☆117May 16, 2022Updated 3 years ago
- flink实时处理kafka传来的数据通过连接池技术写入hbase☆95Jul 18, 2022Updated 3 years ago
- Wordpress hosting with auto-scaling - Free Trial Offer • AdFully Managed hosting for WordPress and WooCommerce businesses that need reliable, auto-scalable performance. Cloudways SafeUpdates now available.
- spark大数据大型电商项目☆15May 26, 2020Updated 5 years ago
- 大数据项目之用户上网行为分析☆62Jul 4, 2023Updated 2 years ago
- datax-kuduwriter☆11Aug 16, 2023Updated 2 years ago
- spark streaming从kafka读取消息,offset写入Redis,spark计算单词出现频率,最后写入hive表☆17Jul 30, 2019Updated 6 years ago
- 实时数仓的一些数据处理(mysql、canal、kafka、flink、hbase、kudu等等),以及一堆Flink的练习☆11Jul 1, 2022Updated 3 years ago
- 计算机毕业设计之Spark+Flink+Python考研预测分析 考研院校推荐系统 考研大数据分析大屏☆33Feb 18, 2022Updated 4 years ago
- This project is used for tracking lineage when using spark. Our team is aimed at enhancing the ability of column relation during logical …☆20Jan 7, 2022Updated 4 years ago
- 大数据收集,实时分析,离线分析经典案例☆21Apr 21, 2023Updated 3 years ago
- 项目实战:Hadoop生态圈☆31Feb 27, 2018Updated 8 years ago
- Simple, predictable pricing with DigitalOcean hosting • AdAlways know what you'll pay with monthly caps and flat pricing. Enterprise-grade infrastructure trusted by 600k+ customers.
- 基于Hadoop的视频收视率分析,毕设项 目☆64Apr 24, 2026Updated last week
- 传统大数据分析工具以Hadoop、Spark为代表,集成了大量的技术框架, 对用户来说又重又笨又不灵活,难以维护和驾驭,国际和国内的敏捷型BI工具在对接时又面临性能、友好性、定制化能力弱的缺点。本项目独辟蹊径,以阿里开源的DataX为ETL工具,以列式数据库ClickHou…☆67Sep 28, 2020Updated 5 years ago
- Spark 3.0.0 Structured Streaming Kafka Avro Demo☆15Apr 21, 2023Updated 3 years ago
- phoenix 操作hbase和springboot的整合☆11Dec 7, 2017Updated 8 years ago
- 本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。☆22Mar 2, 2022Updated 4 years ago
- 为知笔记批量导出☆11Sep 1, 2022Updated 3 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆60Jun 17, 2022Updated 3 years ago
- 用户埋点行为日志分析平台,项目主要用于搭建基于Flink、Apache Doris、Redis和MySQL等中间件的用户行为日志收集、存储、分析平台,支持用户自 定义查询条件☆11Dec 28, 2023Updated 2 years ago
- 基于SparkSQL的电影分析项目实战☆41Nov 21, 2020Updated 5 years ago
- Deploy to Railway using AI coding agents - Free Credits Offer • AdUse Claude Code, Codex, OpenCode, and more. Autonomous software development now has the infrastructure to match with Railway.
- 拉比克是一个开源大数据平台构建方案,已稳定应用于生产集群。融合Hadoop、Hive、Hbase、zookeeper等如CDH☆14Mar 11, 2019Updated 7 years ago
- 从数据仓库到用户画像,从数据建设到数据应用☆631Jan 26, 2022Updated 4 years ago
- A naive hotel management system based on SpringBoot & Hadoop / 东南大学生产实训项目☆28Sep 13, 2021Updated 4 years ago
- 深圳地铁大数据客流分析系统🚇🚄🌟☆2,455May 16, 2024Updated last year
- 本项目主要用于搭建一个基于docker的实时监控系统,涉及的大数据相关组件有Filebeat,Kafka,Zookeeper,Flink,后端主要使用了SpringBoot进行开发,数据库使用了Redis做缓存,前端用了Vue框架,通过Ant Design组件库和Echar…☆42Jan 5, 2023Updated 3 years ago
- 大数据知识仓库涉及到数据仓库建模、实时计算、大数据、数据中台、系统设计、Java、算法等。☆1,755Apr 18, 2026Updated 2 weeks ago
- 本项目以数据采集、处理、分析及数据可视化为项目流程,实现百万级电影数据离线处理与计算。功能包括python爬虫,Matplotlib、Echarts数据可视化、Mapreduce、hive数据统计、情感分析、词图云、电影票房与评分预测☆244Nov 14, 2021Updated 4 years ago
- 大数据相关框架实战项目(Hadoop, Spark, Storm, Flink)☆354Oct 4, 2022Updated 3 years ago
- 基于Hadoop、Spark、FLUME、HIVE等大数据组件搭建的一个分布式集群环境下的电影推荐及日志分析平台☆18Jan 6, 2023Updated 3 years ago
- Managed Database hosting by DigitalOcean • AdPostgreSQL, MySQL, MongoDB, Kafka, Valkey, and OpenSearch available. Automatically scale up storage and focus on building your apps.
- ☆10Apr 13, 2020Updated 6 years ago
- 数据分析大作业项目:对2013年3月至2017年2月北京市12个地点的空气监测数据进行分析处理。☆10Nov 29, 2019Updated 6 years ago
- 全球人工智能技术创新大赛-赛道三:小布助手对话短文本语义匹配☆11Apr 5, 2021Updated 5 years ago
- 电信大数据项目实战☆13Dec 27, 2018Updated 7 years ago
- nlp任务军火库☆12Nov 28, 2022Updated 3 years ago
- 在线编辑pdf文档☆11Jun 21, 2022Updated 3 years ago
- 基于Spark2.x新闻网大数据实时分析可视化系统项目☆535Mar 28, 2019Updated 7 years ago