kikizxd / Data_preprocessing
常见的数据预处理,包括数据加载、缺失值&异常值处理、描述性变量转换为数值型、训练测试集划分、数据规范化
☆41Updated last year
Alternatives and similar repositories for Data_preprocessing:
Users that are interested in Data_preprocessing are comparing it to the libraries listed below
- 利用python对3000个数据利用机器学习算法建立模型,并预测未来客户信用风险。处理数据不均衡问题时采用了SMOTE过采样以及随机过采样技术;通过相关性分析进行特征选择;建模过程中用到了Logistic回归、SVM、随机森林、GBDT四种模型,并通过网格搜索法确定最优参数…☆30Updated 2 years ago
- 利用时间序列预测汽车销量☆38Updated 6 years ago
- 机器学习的特征工程,包括特征抽取、特征预处理、特征选择、特征降维。☆25Updated 6 years ago
- 数据特征工程、各种机器学习回归模型、回归数据预处理☆41Updated 5 years ago
- 数据预处理过程(属性选择, 异常值处理, 归一化, 标准化等)☆61Updated 4 years ago
- 客流量时间序列预测模型☆118Updated 3 years ago
- 利用pythorch来构建lstm,rnn等模型来进行图片分类或画出时间序列曲线☆16Updated 5 years ago
- [大数据课程作业]分别采用神经网络、线性回归、SVM方法预测学生成绩☆44Updated 6 years ago
- 时间序列ARIMA模型的销量预测☆62Updated 6 years ago
- 通过修改transformer使其可以预测金融时间序列☆33Updated 3 years ago
- 集成学习Stacking方法详解☆72Updated 5 years ago
- 双塔模型,打比赛用。解决多维时间序列的分类预测任务☆32Updated 2 years ago
- 本项目开发了一个机器学习和深度学习的训练工具。该训练工具基于sklearn和pytorch,不仅支持常规训练、交叉验证训练,还支持贝叶斯搜索参数,并可随时自动保存训练模型和日志。☆11Updated last year
- 支持向量机(SVM)——分类预测,包括多分类问题,核函数调参,不平衡数据问题,特征降维,网格搜索,管道机制,学习曲线,混淆矩阵,AUC曲线等☆52Updated 7 years ago
- 机器学习预测系统汇总:包括贝叶斯网络、马尔科夫模型、线性回归、岭回归、多项式回归、决策树回归、深度神经网络预测☆73Updated 4 years ago
- 多元多步时间序列的LSTM模型预测——基于Keras☆80Updated 3 years ago
- 数据预处理之缺失值处理,特征选择☆21Updated 5 years ago
- 机器学习预测模型,分别用逻辑回归,决策树,随机森林,神经网络,XGBOOST和 支持向量机算法建模,交叉验证,并选出AUC最优的模型。特征工程优化后,AUC值达到0.8259☆54Updated 4 years ago
- Time Series Prediction, Stateful LSTM; 时间序列预测,洗发水销量/股票走势预测,有状态循环神经网络☆58Updated 7 years ago
- Regression prediction of time series data using LSTM, SVM and random forest. 使用LSTM、SVM、随机森林对时间序列数据进行回归预测,注释拉满。☆184Updated 4 years ago
- 利用爬虫获取58同城的二手房信息,选取特征并对数据进行预处理,利用机器学习算法给出不同地段的租房推荐。☆15Updated 5 years ago
- 构建基于逻辑回归的评分卡模型☆44Updated 6 years ago
- 基于Keras的LSTM多变量时间序列预测☆23Updated 7 years ago
- 建立SARIMA-LSTM混合模型预测时间序列问题。以PM2.5值为例,使用UCI公开的自2013年1月17日至2015年12月31日五大城市PM2.5小时检测数据,将数据按时间段划分,使用SARIMA过滤其线性趋势,再对过滤后的残差使用LSTM进行预测,最后对预测结果进行…☆75Updated 6 years ago
- TensorFlow Probability;Time series model☆126Updated 3 years ago
- 机器学习集成模型之Stacking各类模型及工具源码☆116Updated 4 years ago
- 利用Python实现三层BP神经网络☆81Updated 6 years ago
- 2019年CCF智能信用评分大赛个人源码库。包含XGboost模型调参,特征筛选,训练等方案。同时包含stacking模型融合方案☆27Updated 4 years ago
- 使用支持向量 机、弹性网络、随机森林、LSTM、SARIMA等多种算法进行时间序列的回归预测,除此以外还采取了多种组合方法对以上算法输出的结果进行组合预测。Support vector machine, elastic network, random forest, LSTM…☆44Updated 4 years ago
- 2021年研究生数学建模竞赛B题,全国二等奖,空气质量预报二次建模,时间序列数据分析与回归预测。Time Series Prediction&Air Quality Prediction.☆34Updated 3 years ago