2000字范文,分享全网优秀范文,学习好帮手!
2000字范文 > R语言读取CSV 删除重复行 进行数据分析

R语言读取CSV 删除重复行 进行数据分析

时间:2024-02-22 20:31:35

相关推荐

R语言读取CSV 删除重复行 进行数据分析

R语言读取CSV,将csv数据中的重复值进行统计,统计之后删除重复内容,只保留第一次出现的值。

rm(list = ls())library(ggplot2)library(dplyr)Rstart=Sys.time()setwd("G:/GISworkspace/Rprocess")#建立工作空间df=read.csv('level3_river_clipV6.csv',header = T) #数据读取Cname=data.frame(df$NAME_CH) #取需要处理的列space=data.frame(1:lengths(Cname)) #建一个dataframe用于储存,这里是为了不破坏原数据num=array(1:lengths(Cname)) #用于记录重复次数for( i in 1:lengths(Cname)) #双循环{k=0for (j in 1:lengths(Cname)){if(Cname[i,]==Cname[j,]){space[i,]=Cname[j,]k=k+1}else{k=k}}num[i]=k}#boole=1:lengths(space)all=data.frame(space$ame.,num) #合并两个数据框#all=data.frame(space$ame.,num,boole)#all[,3]=duplicated(all[,2])all=all%>%distinct(all$space.ame.,.keep_all = TRUE)#去除重复行并保留第一次出现的值all=data.frame(all$space.ame.,all$num)colnames(all)[1]='name'colnames(all)[2]='num' # 设置列名write.csv(all,'Statistics.csv') #输出结果Rend=Sys.time()#计算程序运行时间Rtime=Rend-RstartRtime

(原数据)

(处理后数据)

python版本链接:/qq_42940285/article/details/120940087/qq_42940285/article/details/120940087

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。