outman123 / kaggle_house_pricesLinks
问题定义,下载数据,观察结构,找最相关部分特征; 除去异常值,填充缺省值,部分特征正态化,特征编码向量化,增加新特征; 定义评估标准,选择表现好的几个模型,模型参数最优化,stacking模型融合。最终误差降低到0.101左右。详细介绍见https://zhuanlan.zhihu.com/p/89923216
☆17Updated 5 years ago
Alternatives and similar repositories for kaggle_house_prices
Users that are interested in kaggle_house_prices are comparing it to the libraries listed below
Sorting:
- 基于真实业务上手数据挖掘(银行流失预警):数据的处理、LightGBM、skLearning包(里面含有:GridSearchCV寻找最优参、StratifiedKFold分层5折切分、_test_Split单次数据切分等)、叠层模型融合、画AUC图、画混淆矩阵图,并输出预…☆97Updated 3 years ago
- 机器学习预测模型,分别用逻辑回归,决策树,随机森林,神经网络,XGBOOST和支持向量机算法建模,交叉验证,并选出AUC最优的模型。特征工程优化后,AUC值达到0.8259☆56Updated 5 years ago
- 智慧物流算法大赛简介: 根据包括货值、路程和油价等字段的数据集,对每趟货物运送的运价进行回归预测。 本项目为我的参赛代码,分为四个主要的部分:1.数据预处理;2.特征工程;3.建模调参训练;4.数据可视化。 最终获得了大赛的二等奖。☆38Updated 6 years ago
- Python实现经典分类回归、关联分析、聚类以及推荐算法等☆216Updated 6 years ago
- kaggle贷款违约预测☆36Updated 7 years ago
- 交易欺诈作为信用卡行业面临的主要贷后风险业务问题,每年都使信用卡行业遭受巨额损失。基于大数据机器学习开发出高效的交易欺诈识别模型一直是金融行业的主要挑战之一。本次大赛以此作为主题☆44Updated 6 years ago
- 基于Win10 + Python3.7环境,从采集手势库开始,提取手势轮廓线,提取轮廓线的傅里叶算子作为特征,用KNN和SVM作为分类器训练模型,并用PyQt制作简易桌面☆10Updated 6 years ago
- 机器学习的特征工程,包括特征抽取、特征预处理、特征选择、特征降维。☆25Updated 6 years ago
- 整理记录本人担任课程助教设计的四个机器学习实验,主要涉及简单的线性回归、朴素贝叶斯分类器、支持向量机、CNN做文本分类。内附实验指导书、讲解PPT、参考代码,欢迎各位码友讨论交流。☆118Updated 7 years ago
- Python与机器学习方向,《决策树与集成算法》课程仓库☆25Updated 7 years ago
- 2019年CCF智能信用评分大赛个人源码库。包含XGboost模型调参,特征筛选,训练等方案。同时包含stacking模型融合方案☆28Updated 5 years ago
- Sklearn机器学习中的主要算法原理以及实现(线性回归、逻辑回归、朴素贝叶斯、K-Means聚类、KNN、PCA主成分分析、BP神经网络)☆83Updated 5 years ago
- 如何使用ARIMA模型预测世界肺炎确诊人数?【时序数据预测】☆40Updated 5 years ago
- 基于互联网金融平台2015年度贷款数据完成信贷违约预测模型,该模型可以作为信贷平台预测违约借款人的参考☆70Updated 7 years ago
- 使用pyhton3语言对机器学习算法中的K近邻算法、线性回归、多项式回归、逻辑回归、PCA、SVM、决策树、随机森林、集成学习、boosting 等进行了算法的实现以及实验分析☆49Updated 6 years ago
- 【Numpy 手写实现】SVM 支持向量机 | KNN K近邻 | Kmeans | Logistic Regression 逻辑回归 | Maximum Entropy 最大熵 | Naive Bayes 朴素贝叶斯 | Perception 感知机 | Decision…☆211Updated 5 years ago
- 阿里天池与Datawhale联合举办二手车价格预测比赛:优胜奖方案代码总结☆113Updated 2 years ago
- 招商银行2022FinTech精英训练营☆29Updated 3 years ago
- 机器学习实践:贷款违约预测☆38Updated 6 years ago
- 分析银行营销活动数据以预测客户有多大可能购买存款产品☆13Updated 5 years ago
- 基于TensorFlow的深度学习、深度增强学习代码:NN(传统神经网络)、CNN(卷积神经网络)、RNN(递归神经网络)、LSTM(长短期记忆网络)、GAN(生成对抗网络)、DRL(深度增强学习)☆55Updated 7 years ago
- 记录小润了解的各种机器学习算法的实现以及基础概念,包括有监督 学习,无监督学习,分类,聚类,回归;神经元模型,多层感知器,BP算法;损失函数,激活函数,梯度下降法;全连接网络、卷积神经网络、递归神经网络;训练集,测试集,交叉验证,欠拟合,过拟合;数据规范化等☆157Updated 9 years ago
- 基于ARIMA时间序列的销量预测模型,实际预测准确率达90%以上,内含有测试记录和实际上线效果。☆105Updated 6 years ago
- 包括决策树和随机森林进行离职人员预测,Xgboost和lightGBM的应用☆288Updated 5 years ago
- 基于自构造函数的特征提取评分项目(缺失 值处理,单变量相关性分析,特征评分,降维)☆15Updated 8 years ago
- 2020年第八届泰迪杯数据挖掘C题“智慧政务文本挖掘”特等奖作品(论文与代码)☆68Updated last month
- 竞赛项目集合:Rossmann销售预测(Top3%)、HousePrices(Top34%)、数字识别(Top78%)、泰坦尼克(Top83%)、能源预测③(Top36%)、未来价格预测(Top37%)、NFL大数据碗(Top61%)、厄瓜多尔连锁超市销售预测(Top48%…☆41Updated 4 years ago
- 统计分析课程实验作业/包含《统计分析方法》中因子分析,主成分分析,Kmeans聚类等典型算法的手写实现☆77Updated 5 years ago
- Time Series Prediction, Stateful LSTM; 时间序列预测,洗发水销量/股票走势预测,有状态循环神经网络☆58Updated 8 years ago
- 《应用时间序列分析》易丹辉、王燕著; 案例Python实现☆17Updated 5 years ago