2023.07.14

#2023.07.14 rm(list-ls()) data<-read.csv(“Data1.csv”) glimpse(data) #dplyr가가 설치되어야 함 data$Gender1<-factor(data$Gender1) data$EDU1<-factor(data$EDU1) glimpse(data) levels(data$Gender1)

read.table(“Data1.txt”,header=TRUE)

#1 ls() library(dplyr) #2 getwd() #3 setwd(““) getwd() library(ggplot2) data(”diamonds”) df<-diamonds df1<-df%>%select(price) write.csv(df,“diamond.csv”)

data(iris) library(dplyr) names(iris) names(iris)<-tolower(names(iris)) names(iris)

df<-iris%>% count(species) df1<-table(iris$species)

class(df) class(df1) dd<-c(1,2,3) length(dd)

data(“mtcars”) library(psych) describe(mtcars$mpg)

par(mfrow=c(1,1)) #그래프 1개 plot(density(iris$Sepal.Length)) plot(density(iris$Sepal.Width)) plot(density(iris$Petal.Length)) plot(density(iris$Petal.Width))

par(mfrow=c(2,2)) #그래프 4개 보고싶을 때 par(mfrow=c(1,2)) # 1화면에 2개

library(ggplot2) data(“diamonds”) head(diamonds) # st() 데이터셋의 변수 숫자, 관측치 개수, 변수 이름, 변수 유형과 같은 구조를 확인할 수 있다. # 사분위수 범위IQR, summary함수 나옴: 범주형 변수는 범주별 도수를 출력함

#adsp와 관계없음 library(plyr) data$Gender1<-revalue(data$Gender1,replace=c(“0”=“female”,“1”=“male”)) data$EDU1<-revalue(data$EDU1,replace=c(“1”=“high”,“2”=“university”,“3”=“graduate”,“4”=“phd”)) table(data$Gender1) table(data$EDU1) table(data$Gender1,data$EDU1) #빈도의 비율 구하기 a<-table(data$Gender1) b<-table(data$EDU1) prop.table(a) prop.table(b) c<-table(data$Gender1,data$EDU1) prop.table(c) prop.table(table(),1) #행의 합이 1이 되도록 비율 표시 prop.table(table(),2) #열의 합이 1이 되도록 비율 표시 prop.table(c,1) #행별로 합이 1 prop.table(c,2) #열별로 합이 1 #소수점 아래 자리수 지정 round()함수 round(0.7811159,2) round(prop.table(c),2)

2023.07.14

강지안

2023-07-14