步骤 3:数据清洗
#zoo 包的 index 函数library(zoo)#定义数据清洗函数cleaning
#删除重复值 my.data
#计算平均月薪 min_salary
max_salary
my.data$avg_salary
#清理字符串中的不需要的字符 #并将需要分析的字符变量转化为因子,并对部分因子重新编码 my.data$city
my.data$experience
my.data$experience[my.data$experience %in% c("不限","应届毕业生")]
#这里的学历:“大专”,“本科”,“硕士”都表明是要求该学历“及以上” my.data$education
my.data$education[my.data$education=="不限"]
my.data$phase
c("不需要融资","未融资","天使轮","A 轮", "B 轮","C 轮","D 轮及以上","上市公司")) my.data$campany my.data$scale
"\\1",paste(my.data$scale,my.data$scale2)), levels =c("少于 15 人","15-50 人","50-150 人", "150-500 人","500-2000 人","2000 人以上")) my.data$id
my.data
return(my.data)}#清洗数据,得到清洗后的数据CN.clean str(CN.clean)