xuman-Amy / preprocessing
数据预处理之缺失值处理,特征选择
☆21Updated 6 years ago
Alternatives and similar repositories for preprocessing:
Users that are interested in preprocessing are comparing it to the libraries listed below
- 常用的特征选择方法☆68Updated 2 years ago
- 机器学习的特征工程,包括特征抽取、特征预处理、特征选择、特征降维。☆25Updated 6 years ago
- 2019年CCF智能信用评分大赛个人源码库。包含XGboost模型调参,特征筛选,训练等方案。同时包含stacking模型融合方案☆27Updated 5 years ago
- Time Series Prediction, Stateful LSTM; 时间序列预测,洗发水销量/股票走势预测,有状态循环神经网络☆58Updated 7 years ago
- 基于遗传算法的特征选择☆128Updated 5 years ago
- 交易欺诈作为信用卡行业面临的主要贷后风险业务问题,每年都使信用卡行业遭受巨额损失。基于大数据机器学习开发出高效的交易欺诈识别模型一直是金融行业的主要挑战之一。本次大赛以此作为主题☆42Updated 6 years ago
- 在sklearn下,几种常用的特征选择方法☆40Updated 9 years ago
- 国内首个迁移学习赛题 中国平安前海征信“好信杯”迁移学习大数据算法大赛 FInSight团队作品(算法方案排名第三)☆87Updated 6 years ago
- 数据特征工程、各种机器学习回归模型、回归数据预处理☆43Updated 5 years ago
- 通过科研人员论文项目等数据,训练识别导师/学生的分类器。代码包括特征选择基础、网格搜索确定特征选择方法参数、不平衡数据的处理(oversampling、undersampling)和pu-learning方法在此问题上的应用☆30Updated 5 years ago
- 使用遗传算法结合决策树做特征选择/Using genetic algorithm for feature selection with decision tree☆25Updated 6 years ago
- Bayesian Optimization and Grid Search for xgboost/lightgbm☆72Updated 2 months ago
- 现有聚类算法面向高维稀疏数据多未考虑类簇可重叠和离群点的存在,导致聚类效果不理想。针对此,提出一种可重叠子空间K-Means聚类算法(An Overlapping Subspace K-Means Clustering Algorithm, OS-K-Means)。给出类簇…☆30Updated 5 years ago
- Oversampling method based on relative density☆12Updated 4 years ago
- 集成学习Stacking方法详解☆74Updated 5 years ago
- 构建基于逻辑回归的评分卡模型☆44Updated 6 years ago
- LR / SVM / XGBoost / RandomForest etc.☆28Updated 4 years ago
- 天池智慧交通预测挑战赛 - 比赛经历分享☆16Updated 7 years ago
- 第三届“融360”天机智能算法挑战赛中“拒绝推断”赛题--复赛第四名的代码分享☆11Updated 5 years ago
- 机器学习集成模型之Stacking各类模型及工具源码☆116Updated 4 years ago
- featselector是一个基于统计分析和模型选择的特征选择器.☆14Updated 6 years ago
- 马上AI全球挑战赛-违约用户风险预测 top2-solution☆17Updated 6 years ago
- 利用时间序列预测汽车销量☆39Updated 6 years ago
- 基于Keras的LSTM多变量时间序列预测☆23Updated 7 years ago
- 常见的数据预处理,包括数据加载、缺失值&异常值处理、描述性变量转换为数值型、训练测试集划分、数据规范化☆41Updated last year
- 基于波士顿房屋租赁价格数据,使用lasso回归算法做特征选择后,分别使用线性回归、Lasso回归、Ridge回归、Elasitic Net四类回归算法构建模型(分别测试1,2,3阶)☆13Updated 5 years ago
- 💖基于机器学习的贷中风险预测模型--江苏银行“随e融”杯--二等奖💖☆21Updated 3 years ago
- 分类类别不平衡,解决办法:采样(SMOTE和算法集成技术等)、阈值移动、调整代价或权重,附带信用卡诈骗案例☆21Updated 5 years ago
- Cost-Sensitive Learning / ReSampling / Weighting / Thresholding / BorderlineSMOTE / AdaCost / etc.☆107Updated 4 years ago
- kaggle: IEEE-CIS Fraud Detection☆31Updated 5 years ago