实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本的框架实现,并实现最终的数据可视化。
☆59Jun 17, 2022Updated 3 years ago
Alternatives and similar repositories for E-CommerceWarehouse
Users that are interested in E-CommerceWarehouse are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- 模拟电商系统上线运行一段时间后,根据收集到大量的用户行为数据,利用大数据技术(Flink)进行深入挖掘和分析,进而得到感兴趣的商业指标并增强对风险的控制。 整体可以分为用户行为习惯数据和业务行为数据两大类。用户的行为习惯数据包括了用户的登录方式、上线的时间点及时长、点击和浏…☆141May 5, 2020Updated 5 years ago
- 其中包括:Python的数据结构和算法相关内容,一个完整的Django的web项目,还有MiniWeb相关内容,和多线程的协程、进程、线程,和网络编程,还有和数据库的交互,比如Mongodb、Mysql、Redis,其中还有PyQt5,还有可视化内容相关,还有整套Pytho…☆17Jun 7, 2023Updated 2 years ago
- 基于开源Litemall电商项目的大数据项目,包含前端埋点(openresty+lua)、后端埋点;数据仓库(五层)、实时计算和用户画像。大数据平台采用CDH6.3.2(已使用vagrant+ansible脚本化),同时也包含了Azkaban的workflow。☆117May 16, 2022Updated 3 years ago
- 天天生鲜电商项目基于django框架的website,是一个电商项目,功能齐全,用户注册登录缓存放在redis,用户信息商品信息等放于mysql, 使用搜索引擎框架实现搜索功能,增加其他功能,如分页,乐观锁,分布式存储等优化功能,实现接口对接付款评价等功能, 大家可以使用u…☆14Jul 28, 2020Updated 5 years ago
- 一个简单的Hive项目,使用了Sqoop、Hadoop、Hive、MySQL,对电商数据进行分析☆56Dec 15, 2018Updated 7 years ago
- GPU virtual machines on DigitalOcean Gradient AI • AdGet to production fast with high-performance AMD and NVIDIA GPUs you can spin up in seconds. The definition of operational simplicity.
- 电商平台数据仓库搭建☆141Jan 29, 2025Updated last year
- 小象数据完整产品包括用户行为分析、用户画像、智慧运营,通过采集用户行为数据和第三方数据进行实时处理和分析,实时获取用户操作、产品体验和运营活动的数据反馈。兼容神策SDK,完整产品包括用户行为分析、用户画像、智慧运营,通过采集用户行为数据和第三方数据进行实时处理和分析,实时获…☆48Apr 6, 2024Updated 2 years ago
- 本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。☆20Mar 2, 2022Updated 4 years ago
- 一个实时数仓项目,从0到1搭建实时数仓☆63May 27, 2021Updated 4 years ago
- 分析各区域热门商品 —— 使用 Flume 采集数据,MapReduce 或 Spark Core 进行数据清洗,最后使用 Hive 或 Spark SQL 进行数据的分析和处理。☆16Feb 4, 2019Updated 7 years ago
- 从数据仓库到用户画像,从数据建设到数据应用☆629Jan 26, 2022Updated 4 years ago
- 微博情感分析☆12Sep 1, 2013Updated 12 years ago
- 基于Python+Flask+MySQL的数据微中台,支持数据库管理、数据收集(某乎爬虫等)等功能☆10Sep 4, 2020Updated 5 years ago
- 通过图形界面为数据监控以及数据同步提高良好的服务,可支持数据同步的数据源或数据库有:SQL数据源、NoSQL数据源、数据引擎、数据仓库、消息队列;通过Canal可支持数据库监控以及数据备份。☆25Jan 19, 2021Updated 5 years ago
- Managed Database hosting by DigitalOcean • AdPostgreSQL, MySQL, MongoDB, Kafka, Valkey, and OpenSearch available. Automatically scale up storage and focus on building your apps.
- 数据采集、数据审核、数据分析平台☆11Dec 16, 2022Updated 3 years ago
- 基于fabric的baas平台☆10Sep 9, 2018Updated 7 years ago
- Refactored version for https://github.com/shirdrn/document-processor.git☆15Apr 5, 2017Updated 9 years ago
- 项目主要着手于获取最新最热新闻资讯,通过大数据分析用户喜好精确推送咨询新闻。是对在线教育平台业务进行大数据统计分析的系统。碎片化、切换频繁、社交化和个性化现如今成为人们阅读行为的标签。项目对海量信息进行搜集,通过系统计算分类,分析用户的兴趣进行推送从而满足用户的需求。☆22Oct 13, 2020Updated 5 years ago
- 大数据相关框架实战项目(Hadoop, Spark, Storm, Flink)☆355Oct 4, 2022Updated 3 years ago
- 基于深度学习的监督学习,使用梯度下降、ALS、LFM算法,使用AngularJS2生成前端框架,数据库为MongoDB,使用ElasticSearch作为搜索服务器,Redis作为缓存数据库,其中包括Spark的离线统计服务、Azkaban的工作调度服务、Flume的日志采…☆22Dec 16, 2022Updated 3 years ago
- 公众号☆10Jul 24, 2023Updated 2 years ago
- The open source version of the Amazon Personalize docs. You can submit feedback & requests for changes by submitting issues in this repo …☆12Jun 16, 2023Updated 2 years ago
- 📚Springboot 实战小项目😋,目前有:秒杀项目,RaiitMQ 进阶,SpringAOP插件模块开发,Spring事件机制,Springboot SPI机制,Springboot自定义starter,docker,Minio,quartz,MybatisPlus…☆46Oct 7, 2024Updated last year
- GPU virtual machines on DigitalOcean Gradient AI • AdGet to production fast with high-performance AMD and NVIDIA GPUs you can spin up in seconds. The definition of operational simplicity.
- loganalysis.py 是一个通过python语言实现的WEB服务器访问日志统计分析应用。☆18Nov 9, 2013Updated 12 years ago
- Flink 案例开发数据清洗、数据报表☆58Sep 13, 2025Updated 7 months ago
- 一站式自动化测试平台及解决方案,安装包☆10Jan 19, 2024Updated 2 years ago
- Python version of the old and buggy Perl module WWW::Wishlist☆21Apr 27, 2014Updated 11 years ago
- 霍格沃兹测试学院-教学版测试平台完整项目-后端项目-java-springboot☆11Jun 28, 2023Updated 2 years ago
- 前端无痕埋点,用户行为监控,访客识别,UBT方案☆27Mar 16, 2021Updated 5 years ago
- WTU-APP项目源代码,用于开发以及之后的软件工程和软件测试作业☆14May 15, 2020Updated 5 years ago
- Docker Image packaging for Pentaho BI Server☆10Jul 6, 2015Updated 10 years ago
- 最好的大数据项目。《Titan数据运营系统》,本项目是一个全栈闭环系统,我们有用作数据可视化的web系统,然后用flume-kafaka-flume进行日志的读取,在hive设计数仓,编写spark代码进行数仓表之间的转化以及ads层表到mysql的迁移,使用azkaban…☆143Nov 8, 2021Updated 4 years ago
- Serverless GPU API endpoints on Runpod - Bonus Credits • AdSkip the infrastructure headaches. Auto-scaling, pay-as-you-go, no-ops approach lets you focus on innovating your application.
- 电商+大数据+spark机器学习☆17Dec 5, 2017Updated 8 years ago
- 利用用户画像数据、物品元数据、用户行为数据为特征构建推荐系统,使用CB和CF算法做推荐召回,使用 Redis数 据库做缓存处理,结合机器学习LR算法推荐排序,达到粗排、精排效果,实现推荐引擎搭建。☆46Feb 10, 2021Updated 5 years ago
- cookie维护☆19Jan 12, 2025Updated last year
- Multi label text classification based on Amazon Product Review, Find the topic/area which the review belogs to. Using TfidfVectorizer and…☆13Dec 8, 2022Updated 3 years ago
- 基于ssm的财务预算管理系统,写的简单易用,很适合上手。同时也包括了基本的管理系统的功能,也用到了一些插件,界面也美观大方。☆11Jun 30, 2017Updated 8 years ago
- Python+Requests+PyTest+Excel+Allure接口自动化测试实战☆14Mar 16, 2023Updated 3 years ago
- 大数据离线项目之:BI上报(Hadoop、Hbase、Hive、flume、sqoop)☆14Jul 1, 2022Updated 3 years ago