ZongXR / BigData-Competition
全国大数据竞赛三等奖解决方案,省赛二等奖解决方案。一键安装大数据环境脚本,自动部署集群环境,包括zookeeper、hadoop、mysql、hive、spark以及一些基础环境。已通过实际服务器测试,效果极佳,仅需要输入密码等少量人为干预。解放安装部署配置所需人力。并添加若干scala案例,结合spark用以进行数据准备。
☆36Updated 7 months ago
Alternatives and similar repositories for BigData-Competition
Users that are interested in BigData-Competition are comparing it to the libraries listed below
Sorting:
- 本赛题旨在运用有效的金融科技和大数据系统,分析涉赌涉诈资金交易新方式,持续优化风险监测模型,通过赛题提供的涉赌涉诈黑名单、白名单及用于训练的相关交易流水数据集,构建涉赌涉诈账户算法识别模型,全面排查存量风险。A榜排名11/1594,B榜排名13/1594。☆45Updated 2 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆65Updated 4 years ago
- 近年来,随着微信、微博、市长信箱、阳光热线等网络问政平台逐步成为政府了解民意、汇聚民智、凝聚民气的重要渠道,各类社情民意相关的文本数据量不断攀升,给以往主要依靠人工来进行留言划分和热点整理的相关部门的工作带来了极大挑战。同时,随着大数据技术的发展,建立基于自然语言处理技术的…☆33Updated 4 years ago
- 根据用户数据以及消费行为数据,使用Python建立分类模型,通过评估客户流失的风险来预测客户流转情况,找到对客户影响较大的因素,进而挽留客户☆9Updated 4 years ago
- 本项目分别电商数据统计模块及业务采集及数仓搭建模块,利用hive统计每个区域热门商品进行统计;依据业务数据实现离线业务数仓搭建。☆16Updated 3 years ago
- 基于RFM和决策树模型构建专家推荐系统。融合了RFM模型和决策树模型,结合专业运营人员的业务经营,发掘潜在用户,进行推荐营销召回。☆88Updated 11 months ago
- DCIC2023 Fraud Risk Identification Competition Solution.☆26Updated 2 years ago
- 利用flask进行echarts/pyecharts,Web程序开发,机器学习模型部署☆28Updated 2 years ago
- 开源往期获奖 竞赛代码☆45Updated 2 years ago
- 个性化推荐代码--初学者☆40Updated 5 years ago
- 利用用户画像数据、物品元数据、用户行为数据为特征构建推荐系统,使用CB和CF算法做推荐召回,使用 Redis数 据库做缓存处理,结合机器学习LR算法推荐排序,达到粗排、精排效果,实现推荐引擎搭建。☆45Updated 4 years ago
- 基于用户行为的用户画像项目☆74Updated 7 years ago
- 黑马头条推荐系统☆99Updated 5 years ago
- 通过python爬虫获取人民网、新浪等网站新闻作为训练集,基于BERT构建新闻文本分类模型,并结合node.js + vue完成了一个可视化界面。☆43Updated 3 years ago
- 电商广告推荐系统☆13Updated 2 years ago
- spark tutorial for big data mining。包括app流量运营分析、als推荐、smote样本采样、RFM客户价值分群、AHP层次分析客户价值得分、手机定位数据商圈挖掘、马尔可夫智能邮件预测、时序预测、关联规则、推荐电影好友等。☆40Updated 2 years ago
- Z Lab数据实验室开源代码汇总☆202Updated 10 months ago
- DataFountain大赛项目:CCF大数据时代的Serverless工作负载预测☆22Updated 4 years ago
- 数据挖掘常用算法:关联分析Apriori算法,数据分类决策树算法,数据聚类K-means算法☆25Updated 5 years ago
- 智慧物流算法大赛简介: 根据包括货值、路程和油价等字段的数据集,对每趟货物运送的运价进行回归预测。 本项目为我的参赛代码,分为四个主要 的部分:1.数据预处理;2.特征工程;3.建模调参训练;4.数据可视化。 最终获得了大赛的二等奖。☆37Updated 6 years ago
- 基于深度学习的新闻分类推荐系统(Spring Boot作为客户端,Keras作为服务端)☆50Updated 5 years ago
- 智能风控:原理、算法与工程实践 代码☆77Updated 4 years ago
- 大数据竞赛项目实战, 内容涵盖: Kaggle、阿里天池大数据、腾讯大数据、京东大数据、DataCastle大数据竞赛等等☆58Updated 6 years ago
- Datawhale自研数据标注工具☆68Updated last year
- 携程/榛果民宿实时评论挖掘软件,包含数据的实时采集/数据清洗/结构化保存/ UGC 数据主题提取/情感分析/后结构化可视化等技术的综合性演示 Demo。基于在线民宿 UGC 数据的意见挖掘项目,包含数据挖掘和 NLP 相关的处理,负责数据采集、主题抽取、情感分析等任务。主要…☆76Updated 4 years ago
- Spark开源项目:个性化推荐算法实践☆33Updated 5 years ago
- 实现了一整套电商数仓的搭建,包括数据采集平台的搭建,将用户的行为数据分为四层分别分层搭建,并实现业务数据库的分层搭建,针对数据仓库中的数据进行,留存、转化率、复购率、GMV、活跃等报表分析,使用当下主流程数的框架,这个项目采用Apache版本的框架实现,后续会上传CDH版本…☆52Updated 2 years ago
- e企查 | 金融科技服务平台企业数据的无监督分类系统-2020年第十一届中国大学生服务外包创新创业大赛A10赛题☆16Updated 2 years ago
- 此项目是对大学生的一卡通消费数据、图书借阅记录和图书馆门禁数据在spark集群的大数据框架环境之下进行聚类、关联分析,分析出学生的消费水平、生活规律、学习强度等聚类结果,以及将聚类结果进行FPGrowth关联分析得出学生聚类之间存在的关联性,此项目是使用scala语言,利用…☆63Updated 7 months ago
- 基于真实业务上手数据挖掘(银行流失预警):数据的处理、LightGBM、skLearning包(里面含有:GridSearchCV寻找最优参、StratifiedKFold分层5折切分、_test_Split单次数据切分等)、叠层模型融合、画AUC图、画混淆矩阵图,并输出预…☆95Updated 3 years ago