2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > 机器学习-分类随机森林分析(randomForest模型构建 参数调优 特征变量筛选 模型评估

机器学习-分类随机森林分析(randomForest模型构建 参数调优 特征变量筛选 模型评估

时间:2019-04-07 14:42:08

相关推荐

机器学习-分类随机森林分析(randomForest模型构建 参数调优 特征变量筛选 模型评估

此文主要涉及随机森林分类分析,主要包含以下几部分内容:

1)随机森林基础知识

2)randomForest()认识及构建分类判别模型;

3)随机森林参数调优

4)随机森林模型评估

classification rate、Sensitivity和specificity和ROC curve/AUC value

5)特征变量重要性筛选及绘图

重要性指数排序、交叉验证及Boruta算法筛选

一、 准备数据

此处使用的包含分类信息的虚构微生物otu数据,用于构建随机森林分类模型。主要分析目的:1)构建准确率高的随机森林分类模型,2)检测分类水平间重要的OTUs(biomarkers)。

# 1.1 导入数据setwd("D:\\EnvStat\\公众号文件\\随机森林分析") # 设置工作路径#dir()#file.show("otu.csv")otu = read.csv("otu.csv",row.names = 1,header = TRUE,check.names = FALSE,stringsAsFactors = FALSE) # 微生物组数据dim(otu)head(otu)#1.2 计算相对丰度spe = otuspe[3:ncol(spe)] <- sweep(spe[3:ncol(spe)],1,rowSums(spe[3:ncol(spe)]),/)*100spe

机器学习-分类随机森林分析(randomForest模型构建 参数调优 特征变量筛选 模型评估和基础理论等)

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。