悟空:快速查看与分析数据平台
悟空正在计算,请稍后......
缺失值数据处理
参考:doi: 10.1093/nar/gkaa498
是否要导入自己的数据?
选择文件格式:
.xlsx
.xls
.csv/txt
请导入你的数据文件:
Browse...
首行是否为名字?
首列是否为名字?
要读入第几个Sheet的数据?
要读入第几个Sheet的数据?
数据分隔符(逗号/分号/制表符/空格):
Comma
Semicolon
Tab
BlankSpace
1. 选择缺失值处理的方式:
整体考虑
分组考虑
缺失值所占比例:
你的数据分为几大组(注意格式:组别数;每一组的数-每一组的数):
各组缺失值所占比例:
整组缺失仍保留?
2. 数据中缺失值的形式:
NA
NaN
Filtered
0
NULL
3. 选择缺失值处理方法:
K近邻法(KNN)
连续K近邻法(SeqKnn)
全局最小值
每行最小值
多重插补法(MI)
随机森林法(MissForest)
近邻的个数(K):
Seq近邻的个数(Seq K):
多重插补的个数(m):
树的个数(ntree):
原始数据
筛选后数据
缺失值分布矩阵图
缺失值处理后的数据
视频资料
下载数据
缺失值分布矩阵图(红色表示缺失值NA):
是否调整图片大小?
调节图片的高度:
2. 缺失值处理后的数据
下载数据
若使用该模块时遇到问题,建议先看看本视频:
¤
悟空云数据分析交流第二期之组缺失值填充