一个简单的Hive项目,使用了Sqoop、Hadoop、Hive、MySQL,对电商数据进行分析
☆56Dec 15, 2018Updated 7 years ago
Alternatives and similar repositories for BI_project
Users that are interested in BI_project are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- 大数据离线项目之:BI上报(Hadoop、Hbase、Hive、flume、sqoop)☆14Jul 1, 2022Updated 3 years ago
- 基于Hadoop的视频收视率分析,毕设项目☆65Jun 23, 2025Updated 9 months ago
- 使用Hive进行大数据分析实战☆23Aug 8, 2018Updated 7 years ago
- 大数据数据仓库建立和离线数据分析☆18Apr 19, 2021Updated 4 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆59Jun 17, 2022Updated 3 years ago
- NordVPN Special Discount Offer • AdSave on top-rated NordVPN 1 or 2-year plans with secure browsing, privacy protection, and support for for all major platforms.
- 研究生课程笔记。包含组合数学、高级算法设计与分析、最优化理论与应用、大数据分析与挖掘。☆15Dec 17, 2023Updated 2 years ago
- A naive hotel management system based on SpringBoot & Hadoop / 东南大学生产实训项目☆28Sep 13, 2021Updated 4 years ago
- Java与大数据分析方向,《数据挖掘基础》课程仓库☆10Jul 16, 2019Updated 6 years ago
- AQI air quality analysis based on Hadoop MapReduce☆13Dec 30, 2023Updated 2 years ago
- 打砖块☆20Nov 30, 2024Updated last year
- 《Python金融大数据挖掘与分析全流程详解》学习笔记及代码☆14Aug 4, 2020Updated 5 years ago
- 基于Django和Hadoop集群进行的大数据分析平台☆70Nov 25, 2017Updated 8 years ago
- 基于豆瓣电影爬虫及Spark数据分析可视化设计毕业源码案例设计☆19Apr 30, 2023Updated 2 years ago
- 基于sqoop封装的一个通用的抽取工具,方便数据平台界面提交任务以及数据源管理☆10May 2, 2017Updated 8 years ago
- Bare Metal GPUs on DigitalOcean Gradient AI • AdPurpose-built for serious AI teams training foundational models, running large-scale inference, and pushing the boundaries of what's possible.
- 本项目来源于企业级电商网站的大数据统计分析平台,该平台以 Spark 框架为核心,对电商网站的日志进行离线和实时分析☆20Jul 17, 2021Updated 4 years ago
- 基于Python语言的Spark数据处理分析案例集锦(PySpark)☆27Mar 5, 2021Updated 5 years ago
- Code for "Contextualized Embeddings in Named-Entity Recognition", ECIR 2020☆13Jul 25, 2024Updated last year
- 自己设计的所有MapReduce案例,包括有单词统计、主播数据的清洗、疫情数据统计、岗位分析、Java岗位统计、手机数据品牌的统计等等☆21Nov 21, 2022Updated 3 years ago
- ☆17Feb 6, 2025Updated last year
- ☆13Feb 6, 2026Updated last month
- mongodb的使用☆13Dec 27, 2017Updated 8 years ago
- 基于flink的用户行为分析☆51Sep 5, 2023Updated 2 years ago
- [ECCV'24] UNIT: Backdoor Mitigation via Automated Neural Distribution Tightening☆10Dec 18, 2025Updated 3 months ago
- Managed hosting for WordPress and PHP on Cloudways • AdManaged hosting with the flexibility to host WordPress, Magento, Laravel, or PHP apps, on multiple cloud providers. Cloudways by DigitalOcean.
- Taurix OS kernel. Taurix 系统内核,操作系统原理实(xjb)践(写)☆12Dec 20, 2020Updated 5 years ago
- 《分布式对象存储:原理、设计与实现》☆12May 19, 2020Updated 5 years ago
- 基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。☆117May 16, 2022Updated 3 years ago
- 基于Spark2.x新闻网大数据实时分析可视化系统项目☆536Mar 28, 2019Updated 6 years ago
- 量化交易网站,软工三大作业迭代三,团队项目☆11Mar 8, 2018Updated 8 years ago
- OceanBase 大赛仓库,由偏远小渔村传统弱校队维护☆13Oct 18, 2022Updated 3 years ago
- 《2021医学健康数据分析与挖掘》课程论文 -- 基于BERT的20NewsGroups数据集新闻分类实验☆10Jun 22, 2021Updated 4 years ago
- 清华大数据作业MapReduce处理几百个G的JSON数据☆50Jun 27, 2016Updated 9 years ago
- 基于跳表实现的键值型存储引擎☆12Jun 21, 2021Updated 4 years ago
- Virtual machines for every use case on DigitalOcean • AdGet dependable uptime with 99.99% SLA, simple security tools, and predictable monthly pricing with DigitalOcean's virtual machines, called Droplets.
- iHealth 项目的后台程序(一个基于 Django 和 MongoDB 的 Web 后端)☆35Nov 11, 2019Updated 6 years ago
- 一个集分布式爬虫,分布式存储,分布式计算统计分析一体的统计分析数据挖掘项目☆14Feb 6, 2018Updated 8 years ago
- 这是一个可通过网页远程登录管理、可接入讯飞星火、ChatGPT等大语言模型的微信聊天机器人,使用微信网页版协议。☆16Feb 20, 2024Updated 2 years ago
- Easy Scheduler是一个分布式工作流任务调度系统,主要解决数据研发ETL错综复杂的依赖关系,而不能直观监控任务健康状态等问题。Easy Scheduler以DAG流式的方式将Task组装起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及Kil…☆10Apr 9, 2019Updated 6 years ago
- 基于MFCC特征构建单核GMM的0-9独立词语音识别,MFCC,GMM,sklearn,Isolated word recognition。☆10Nov 18, 2020Updated 5 years ago
- 第六届字节青训营项目:使用 Gin 作为web框架,MySQL 作为数据存储并使用 Gorm 操作数据库。使用Etcd作为注册中心,Grpc 进行服务之间的通信。 采用 redis 作为缓存;消息中间件 RabbitMQ☆13Nov 14, 2023Updated 2 years ago
- 全国大数据竞赛三等奖解决方案,省赛二等奖解决方案。一键安装大数据环境脚本,自动部署集群环境,包括zookeeper、hadoop、mysql、hive、spark以及一些基础环境。已通过实际服务器测试,效果极佳,仅需要输入密码等少量人为干预。解放安装部署配置所需人力。并添加…☆42Sep 26, 2024Updated last year