ZongXR / BigData-Competition
全国大数据竞赛三等奖解决方案,省赛二等奖解决方案。一键安装大数据环境脚本,自动部署集群环境,包括zookeeper、hadoop、mysql、hive、spark以及一些基础环境。已通过实际服务器测试,效果极佳,仅需要输入密码等少量人为干预。解放安装部署配置所需人力。并添加若干scala案例,结合spark用以进行数据准备。
☆30Updated last month
Related projects ⓘ
Alternatives and complementary repositories for BigData-Competition
- 本项目演示如何在PyTorch中使用Transformer模型进行中文文本分类☆27Updated last year
- 本赛题旨在运用有效的金融科技和大数据系统,分析涉赌涉诈资金交易新方式,持续优化风险监测模型,通过赛题提供的涉赌涉诈黑名单、白名单及用于训练的相关交易流水数据集,构建涉赌涉诈账户算法识别模型,全面排查存量风险。A榜排名11/1594,B榜排名13/1594。☆41Updated last year
- Z Lab数 据实验室开源代码汇总☆198Updated 5 months ago
- 该项目主要是自学过程中对于一些知识点的整理,项目整体分为四部分,分别是算法、工程、工具和数学知识。算法部分主要是常用的机器学习(LR、SVM、树模型、XGBoost、LightGBM和CatBoost等)和深度学习算法(NLP和CV以及一些基础知识),工程部分主要是spar…☆23Updated 2 years ago
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆58Updated 5 years ago
- 大数据项目之用户上网行为分析☆59Updated last year
- Spark开源项目:个性化推荐算法实践☆29Updated 4 years ago
- 这里用来存储做人工智能项目的代码和参加数据挖掘比赛的代码☆72Updated last month
- DCIC2023 Fraud Risk Identification Competition Solution.☆23Updated last year
- Python网络爬虫与推荐算法新闻推荐平台:网络爬虫:通过Python实现新浪新闻的爬取,可爬取新闻页面上的标题、文本、图片、视频链接(保留排版) 推荐算法:权重衰减+标签推荐+区域推荐+热点推荐☆99Updated 3 years ago
- 基于用户行为的用户画像项目☆68Updated 6 years ago
- 大数据实战——商品推荐系统(Spark、Scala、MongoDB)☆94Updated last year
- 基于ChatGLM-6b+langchain实现本地化知识库检索与智能答案生成☆22Updated last year
- DataFountain大赛项目 :CCF大数据时代的Serverless工作负载预测☆21Updated 3 years ago
- 天池比赛【NLP】医学搜索Query相关性判断 第三名方案☆31Updated last year
- 黑马头条推荐系统☆95Updated 5 years ago
- 开源往期获奖竞赛代码☆44Updated 2 years ago
- 大数据项目实战之基于Spark2.X的新闻话题的实时统计分析☆25Updated 2 years ago
- 优质的推荐算法资源汇总☆87Updated 2 years ago
- Spark电影数据分析实战,利用spark开发针对用户观影等历史行为数据进行采集、分析和展示☆19Updated 3 years ago
- 数据竞赛笔记fork☆64Updated last year
- 基于spark的大数据分析心脏病信息 更多详细说明在我的博客//zhuozhuo233.github.io/☆12Updated 2 years ago
- 推荐算法实战(Recommend algorithm)☆136Updated 4 months ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆60Updated 4 years ago
- 从0到1构建用户画像☆34Updated 3 years ago
- 基于Spark企业级用户画像项目☆109Updated last year
- 通过python爬虫获取人民网、新浪等网站新闻作为训练集,基于BERT构建新闻文本分类模型,并结合node.js + vue完成了一个可视化界面。☆36Updated 2 years ago
- DCIC 2023年 科技金融应用——欺诈风险识别☆24Updated last year
- 本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。☆15Updated 2 years ago
- 个人的技能树仓库,主要包含个人后端开发的项目☆134Updated 2 years ago