TurboWay / pybigdata
使用 python 操作大数据的各种组件
☆62Updated last year
Related projects ⓘ
Alternatives and complementary repositories for pybigdata
- 基于Django和Hadoop集群进行的大数据分析平台☆60Updated 6 years ago
- 💡数据化运营💡:会员数据化运营(RFM模型、营销响应预测)、商品数据化运营、流量数据化运营、内容数据化运营☆45Updated 5 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆48Updated 2 years ago
- 信用卡违约率分析☆17Updated 5 years ago
- 猎头招聘数据仓库☆39Updated 6 years ago
- 基于django的企业级开发模板,集成了channels(实时程序 ),apscheduler(任务调度),以及微信登录等等☆26Updated 3 years ago
- 基于微信网页版爬虫来对微信中获取到的联系人相关信息Flask,Echarts进行数据分析☆13Updated 5 years ago
- 数据治理、数据标准相关的 web 工具☆35Updated 2 years ago
- SpiderAdmin 一个集爬虫Scrapy+Scrapyd爬虫项目查看 和 爬虫任务定时调度的可视化管理工具☆91Updated 3 years ago
- 拉勾网+BOSS直聘网招聘信息大数据分析项目_数据获取+数据清洗+数据分析+数据可视化☆154Updated 2 years ago
- Python数据分析与挖掘实战书中的实例学习☆28Updated 7 years ago
- 参与针对于2019-nCoV数据可视化预测项目,后端完全使用ElasticSearch集群/Redis缓存,利用Flask提供API Server,利用前端/中后/前台的接口配合完成新型冠状病毒的疫情发展的相关信息可视化以及预测,方便观察疫情发展情况,并结合机器学习模型对疫…☆23Updated 4 years ago
- 完全免费、开源的 HelloDjango 系列教程之 django REST framework☆112Updated last year
- 基于Spark2.2新闻网大数据实时系统项目☆61Updated 5 years ago
- 强大的 SQL 语法拓展,目标是打造 "易读易写 方便维护" 的 sql 脚本 | SQL Extension☆29Updated 4 years ago
- python发送邮件报表☆32Updated 6 years ago
- 该项目为硬件实时监控系统,应用python、mysql、tornado、sqlalchemy、psutil、pyecharts等技术打造!☆25Updated 4 years ago
- ⌚️让添加执行计划任务变得更加优雅~ Flask-Apscheduler Job Center🌹☆226Updated 4 months ago
- 一键搭建zookeeper/hadoop/hive/hbase/sqoop/kafka/spark/kylin☆34Updated 4 years ago
- 本项目采用FastAPI + APScheduler + ZeroRPC开发轻量级定时调度平台☆35Updated last year
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆58Updated 5 years ago
- 数据治理、数据质量检核/监控平台(Django+jQuery+MySQL)☆180Updated last year
- Python3实战Spark大数据分析及调度☆21Updated 5 years ago
- 自主开发、整理的一套 Python 基础函数库,涵盖 system 系统增强包、logger 日志记录增强包、file 文件处理增强包、 date 日期处理函数包、data 数据信息处理函数包、csv 处理增强函数包、crypt 加密/编码增强包等,可减少程序开发工作量、降…☆93Updated 2 years ago
- 从0到1构建用户画像☆35Updated 3 years ago
- 基于python和llm大模型开发的数据处理和任务调度系统。 支持数据源管理,数据模型管理,数据集成,数据查询API接口,低代码自定义数据处理任务模版,单任务及dag任务工作流调度等功能。集成了llm模块实现rag知识库问答,链接各数据源数据进行数据对话问答,交互式数据分析…☆127Updated this week
- 基于Django+LayUI+HBase的文献数据挖掘系统的实现☆81Updated last year
- 想要做python全栈工程师, 必须要会的技术栈☆24Updated 5 years ago
- 基于scrapy-redis实现分布式爬虫,爬取知乎所有问题及对应的回答,集成selenium模拟登录、英文验证码及倒立文字验证码识别、随机生成User-Agent、IP代理、处理302重定向问题等等☆54Updated 5 years ago
- python数据分析基础☆78Updated 8 months ago