outman123 / kaggle_house_prices
问题定义,下载数据,观察结构,找最相关部分特征; 除去异常值,填充缺省值,部分特征正态化,特征编码向量化,增加新特征; 定义评估标准,选择表现好的几个模型,模型参数最优化,stacking模型融合。最终误差降低到0.101左右。详细介绍见https://zhuanlan.zhihu.com/p/89923216
☆17Updated 5 years ago
Alternatives and similar repositories for kaggle_house_prices:
Users that are interested in kaggle_house_prices are comparing it to the libraries listed below
- 2019年CCF智能信用评分大赛个人源码库。包含XGboost模型调参,特征筛选,训练等方案。同时包含stacking模型融合方案☆27Updated 4 years ago
- Python与机器学习方向,《决策树与集成算法》课程仓库☆24Updated 6 years ago
- 智慧物流算法大赛简介: 根据包括货值、路程和油价等字段的数据集,对每趟货物运送的运价进行回归预测。 本项目为我的参赛代码,分为四个主要的部分:1.数据预处理;2.特征工程;3.建模调参训练;4.数据可视化。 最终获得了大赛的二等奖。☆35Updated 5 years ago
- 机器学习预测模型,分别用逻辑回归,决策树,随机森林,神经网络,XGBOOST和支持向量机算法建模,交叉验证,并选出AUC最优的模型。特征工程优化后,AUC值达到0.8259☆54Updated 4 years ago
- 机器学习的特征工程,包括特征抽取、特征预处理、特征选择、特征降维。☆25Updated 6 years ago
- 统计分析课程实验作业/包含《统计分析方法》中因子分析,主成分分析,Kmeans聚类等典型算法的手写实现☆76Updated 5 years ago
- 基于真实业务上手数据挖掘(银行流失预警):数据的处理、LightGBM、skLearning包(里面含有:GridSearchCV寻找最优参、StratifiedKFold分层5折切分、_test_Split单次数据切分等)、叠层模型融合、画AUC图、画混淆矩阵图,并输出预…☆93Updated 2 years ago
- 常用的特征选择方法☆68Updated 2 years ago
- 洛杉矶房价预测☆19Updated 4 years ago
- 基于互联网金融平台2015年度贷款数据完成信贷违约预测模型,该模型可以作为信贷平台预测违约借款人的参考☆68Updated 6 years ago
- 利用python对3000个数据利用机器学习算法建立模型,并预测未来客户信用风险。处理数据不均衡问题时采用了SMOTE过采样以及随机过采样技术;通过相关性分析进行特征选择;建 模过程中用到了Logistic回归、SVM、随机森林、GBDT四种模型,并通过网格搜索法确定最优参数…☆29Updated 2 years ago
- 数据预处理之缺失值处理,特征选择☆21Updated 5 years ago
- 机器学习实践:贷款违约预测☆37Updated 5 years ago
- Time Series Prediction, Stateful LSTM; 时间序列预测,洗发水销量/股票走势预测,有状态循环神经网络☆58Updated 7 years ago
- 整理记录本人担任课程助教设计的四个机器学习实验,主要涉及简单的线性回归、朴素贝叶斯分类器、支持向量机、CNN做文本分类。内附实验指导书、讲解PPT、参考代码,欢迎各位码友讨论交流。☆115Updated 7 years ago
- 机器学习集成模型之Stacking各类模型及工具源码☆116Updated 4 years ago
- 基于Python实现了K-Means、GMM、DBSCAN、AGNES等四种常见的聚类算法☆68Updated 6 years ago
- 🤖机器学习实战🤖:决策树、随机森林线性回归、逻辑回归、贝叶斯、kNN等☆26Updated 5 years ago
- 集成学习Stacking 方法详解☆72Updated 5 years ago
- 数据特征工程、各种机器学习回归模型、回归数据预处理☆41Updated 5 years ago
- 利用爬虫获取58同城的二手房信息,选取特征并对数据进行预处理,利用机器学习算法给出不同地段的租房推荐。☆15Updated 5 years ago
- Python实现经典分类回归、关联分析、聚类以及推荐算法等☆208Updated 6 years ago
- 类别不平衡学习,包括采样、代价敏感学习、决策输出补偿以及集成学习等内容☆36Updated 4 years ago
- 交易欺诈作为信用卡行业面临的主要贷后风险业务问题,每年都使信用卡行业遭受巨额损失。基于大数据机器学习开发出高效的交易欺诈识别模型一直是金融行业的主要挑战之一。本次大赛以此作为主题☆41Updated 6 years ago
- 构建基于逻辑回归的评分卡模型☆44Updated 6 years ago
- 机器学习算法经典案例☆105Updated 4 years ago
- 基于遗传算法的特征选择☆127Updated 5 years ago
- 使用pyhton3语言对机器学习算法中的K近邻算法、线性回归、多项式回归、逻辑回归、PCA、SVM、决策树、随机森林、集成学习、boosting 等进行了算法的实现以及实验分析☆43Updated 5 years ago
- 分类类别不平衡,解决办法:采样(SMOTE和算法集成技术等)、阈值移动、调整代价或权重,附带信用卡诈骗案例☆21Updated 5 years ago
- 机器学习课程大作业 - 基于深度神经网络的图像分类任务☆29Updated 7 years ago