Se desarrollo una encuesta con los estudiantes de la asignatura Seminarios de Construcciones para la cual se realizaron preguntas que arrojaron las siguientes variables:
sandra<-read.csv("datos codificados.csv")
colnames(sandra)
[1] "Nombre" "Region" "Ocupacion" "Estatura" "Edad"
[6] "Sexo" "Peso" "Hermanos" "Hijos" "Estrato"
[11] "Estado.Civil" "Matricula"
sapply(sandra[,1:4],ic.var)
Error in match.fun(FUN) : object 'ic.var' not found
se definieron los tipos de variles como cualitativas o cuantitativas, las variables cualitativas son variables no numericas por tanto no podemos sacar grafica de histograma si no un diagrama de barras.
region<-read.csv("datos codificados.csv",stringsAsFactors = F, header=T)
barplot(prop.table(table(sandra$Region)),col=c("blue","red","purple","cornflowerblue","yellow"),legend.text=c("valle","cauca","quindio","nariño","bogota"),xlab ="regiones",ylab = "numero de estudiantes")
ocupacion<-read.csv("datos codificados.csv",stringsAsFactors = F, header=T)
barplot(prop.table(table(sandra$Ocupacion)),col=c("cornflowerblue","purple","yellow"),legend.text=c("pregrado","postgrado","maestria"),ylab = "numero de estudiantes",xlab="ocupacion")
pie(Ocupacion)
Error in pie(Ocupacion) : object 'Ocupacion' not found
para poder hallar la moda se descarga el paquete modeest , luego se procede a llamarla libreria con library(“modeest”) ahora si con mvl podemos calcular la moda de los datos
sandra<-read.csv("datos codificados.csv")
estatura<-sandra$Estatura
mean(estatura)
[1] 168.0417
median(estatura)
[1] 167.5
var(estatura)
[1] 108.3895
sd(estatura)
[1] 10.41103
library("modeest")
mlv(estatura,method="discrete")
Mode (most frequent value): 160
Bickel's modal skewness: 0.4166667
Call: mlv.integer(x = estatura, method = "discrete")
hist(estatura, breaks = "scott",main="histograma de estatura", col= "cornflowerblue")
sandra<-read.csv("datos codificados.csv")
edad<-sandra$Edad
hist(edad, breaks = "scott",main="histograma de edad", col= "cornflowerblue")
mean(edad)
[1] 28.58333
median(edad)
[1] 25
var(edad)
[1] 78.16667
library("modeest")
mlv(edad,method="discrete")
Mode (most frequent value): 23
Bickel's modal skewness: 0.4166667
Call: mlv.integer(x = edad, method = "discrete")
sexo<-sandra$Sexo
sexo<-read.csv("datos codificados.csv",stringsAsFactors = F, header=T)
barplot(prop.table(table(sandra$Sexo)),col=c("red","cornflowerblue"), xlab=("sexo"),legend.text=c("hombre","mujer"))
sandra<-read.csv("datos codificados.csv")
peso<-sandra$Peso
mean(peso)
[1] 67.25
median(peso)
[1] 67.5
var(peso)
[1] 164.1957
library("modeest")
mlv(estatura,method="discrete")
Mode (most frequent value): 160
Bickel's modal skewness: 0.4166667
Call: mlv.integer(x = estatura, method = "discrete")
hist(peso, breaks = "scott",main="histograma de peso", col= "cornflowerblue")
sandra<-read.csv("datos codificados.csv")
hermanos<-sandra$Hermanos
mean(hermanos)
[1] 2.416667
median(hermanos)
[1] 2
var(hermanos)
[1] 3.471014
library("modeest")
mlv(hermanos,method="discrete")
Mode (most frequent value): 1
Bickel's modal skewness: 0.4583333
Call: mlv.integer(x = hermanos, method = "discrete")
hist(hermanos, breaks = 6,main="histograma de numero de hermanos", col= "cornflowerblue")
sandra<-read.csv("datos codificados.csv")
hijos<-sandra$Hijos
var(hijos)
[1] 0.6793478
mean(hijos)
[1] 0.375
median(hijos)
[1] 0
library("modeest")
mlv(hijos,method="discrete")
Mode (most frequent value): 0
Bickel's modal skewness: 0.2083333
Call: mlv.integer(x = hijos, method = "discrete")
hist(hijos, breaks = "scott",main="histograma de numero de hijos", col= "cornflowerblue")
estrato<-read.csv("datos codificados.csv",stringsAsFactors = F, header=T)
barplot(prop.table(table(sandra$Estrato)),col=c("blue","red","purple","cornflowerblue","yellow"),legend.text=c("1","2","3","4","5"))
estado.civil<-read.csv("datos codificados.csv",stringsAsFactors = F, header=T)
barplot(prop.table(table(sandra$Estado.Civil)),col=c("red","purple"),legend.text=c("soltero","casado"))
matricula<-read.csv("datos codificados.csv",stringsAsFactors = F, header=T)
barplot(prop.table(table(sandra$Matricula)),col=c("yellow","green"),legend.text=c("si","no"))
el comando summary da un resumen de datos maximo y minimo, cuartiles, media, mediana
summary(sandra)
Nombre Region Ocupacion Estatura
Alejandro Arcila : 1 Min. :1.000 Min. :1.000 Min. :152.0
Andrés Casanova : 1 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:160.0
Angela : 1 Median :1.000 Median :1.000 Median :167.5
Angie Aldemar : 1 Mean :1.583 Mean :1.417 Mean :168.0
Angie Cabezas : 1 3rd Qu.:1.250 3rd Qu.:2.000 3rd Qu.:175.8
Carlos Zapata : 1 Max. :5.000 Max. :3.000 Max. :188.0
(Other) :18
Edad Sexo Peso Hermanos Hijos
Min. :21.00 Min. :1.000 Min. :50.00 Min. :0.000 Min. :0.000
1st Qu.:23.00 1st Qu.:1.000 1st Qu.:57.00 1st Qu.:1.000 1st Qu.:0.000
Median :25.00 Median :2.000 Median :67.50 Median :2.000 Median :0.000
Mean :28.58 Mean :1.542 Mean :67.25 Mean :2.417 Mean :0.375
3rd Qu.:30.25 3rd Qu.:2.000 3rd Qu.:75.25 3rd Qu.:4.000 3rd Qu.:0.000
Max. :49.00 Max. :2.000 Max. :98.00 Max. :6.000 Max. :3.000
Estrato Estado.Civil Matricula
Min. :1.00 Min. :1.000 Min. :1.000
1st Qu.:3.00 1st Qu.:1.000 1st Qu.:1.000
Median :3.00 Median :1.000 Median :1.000
Mean :3.25 Mean :1.167 Mean :1.417
3rd Qu.:3.25 3rd Qu.:1.000 3rd Qu.:2.000
Max. :5.00 Max. :2.000 Max. :2.000