Esta es una guía mostrando únicamente los resultantes de las pruebas. Usted debe escribir los códigos para obtener los resultados mostrados. Para lograr un mejor resultado, revise con calma sus códigos. Si el resultado es diferente, revise con detalle o consulte a su profesor.
Utilice
set.seed(12345)
Genere 100 datos aleatorios con una media de 50 y desviaron estandar de 4.6
Suponga que los datos son edades de personas que visitan el hospital a emergencias médicas, durante la semana (lunes a viernes)
set.seed(12345)
dat<-rnorm(100,50,4.6 )
datos<-round(dat)
datos
## [1] 53 53 49 48 53 42 53 49 49 46 49 58 52 52 47 54 46 48 55 51 54 57 47 43 43
## [26] 58 48 53 53 49 54 60 59 58 51 52 49 42 58 50 55 39 45 54 54 57 43 53 53 44
## [51] 48 59 50 52 47 51 53 54 60 39 51 44 53 57 47 42 54 57 52 44 50 46 45 61 56
## [76] 54 54 46 52 55 53 55 49 61 54 59 53 49 52 54 46 46 59 48 45 53 48 60 47 47
- Visualice los datos utilizando un plot
plot(datos)
- Genere un diagrama de cajas según se muestra en la figura
boxplot(datos, col = "blue", xlab= "Variable", ylab= "Cantidad")
- Obtenga una distribución de frecuencias.
library(fdth)
## Warning: package 'fdth' was built under R version 4.3.2
##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
dist <- fdt(datos,breaks="Sturges")
dist
## Class limits f rf rf(%) cf cf(%)
## [38.61,41.485) 2 0.02 2 2 2
## [41.485,44.36) 9 0.09 9 11 11
## [44.36,47.235) 15 0.15 15 26 26
## [47.235,50.11) 17 0.17 17 43 43
## [50.11,52.985) 11 0.11 11 54 54
## [52.985,55.86) 28 0.28 28 82 82
## [55.86,58.735) 9 0.09 9 91 91
## [58.735,61.61) 9 0.09 9 100 100
- Obtenga una distribución de frecuencias con 10 clases
library(fdth)
fdt.10 <- fdt(datos, k=10)
print(fdt.10)
## Class limits f rf rf(%) cf cf(%)
## [38.61,40.91) 2 0.02 2 2 2
## [40.91,43.21) 6 0.06 6 8 8
## [43.21,45.51) 6 0.06 6 14 14
## [45.51,47.81) 12 0.12 12 26 26
## [47.81,50.11) 17 0.17 17 43 43
## [50.11,52.41) 11 0.11 11 54 54
## [52.41,54.71) 24 0.24 24 78 78
## [54.71,57.01) 9 0.09 9 87 87
## [57.01,59.31) 8 0.08 8 95 95
## [59.31,61.61) 5 0.05 5 100 100
Interprete la frecuencia absoluta de la segunda clase
Obtenga una distribución de frecuencias, que inicie desde 10 y termine en 45, con una amplitud de 7.
dist.6 <- fdt(datos,breaks="Sturges", start=10, end=45, h= 7)
dist.6
## Class limits f rf rf(%) cf cf(%)
## [10,17) 0 0.00 0 0 0
## [17,24) 0 0.00 0 0 0
## [24,31) 0 0.00 0 0 0
## [31,38) 0 0.00 0 0 0
## [38,45) 11 0.11 11 11 11
Se esta interesado en conocer cuántas personas que visitan el hospital tienen entre 30 a 40 “year” de edad.
Elabore una polígono de frecuencia acumulado, como se muestra en la figura
plot(dist, type="cfp")
- Elabore una polígono de frecuencia relativa, como se muestra en la figura
plot(dist, type = "rfp")
- Elabore una histograma, como se muestra en la figura:
hist(datos,xlab="cantidad",ylab="frecuencia",main="Histograma", breaks = "Sturges")
- Calcule un resumen estadístico
summary(datos)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 39.00 47.00 52.00 51.13 54.00 61.00
Analice el Diagrama de cajas realizado anteriormente, y revise que sus datos resumen, coincidan con el diagrama de cajas realizado.
Calcule el percentil 26 de los datos. Analice como es su interpretación, revise muy bien los datos en bruto y discuta con su compañero.
## [1] 39 39 42 42 42 43 43 43 44 44 44 45 45 45 46 46 46 46 46 46 47 47 47 47 47
## [26] 47 48 48 48 48 48 48 49 49 49 49 49 49 49 49 50 50 50 51 51 51 51 52 52 52
## [51] 52 52 52 52 53 53 53 53 53 53 53 53 53 53 53 53 53 54 54 54 54 54 54 54 54
## [76] 54 54 54 55 55 55 55 56 57 57 57 57 58 58 58 58 59 59 59 59 60 60 60 61 61
quantile(datos, .26)
## 26%
## 47.74
La interpretación correcta sería: tenemos un 26% de las personas que tienen edades menores a 47.45, y un 74% que tienen edades mayores a 47.45
- Calcule el percentil 90, y de su interpretación:
quantile(datos, .90)
## 90%
## 58
- Elabore un Tallos y Hojas. Utilizamos “scale”:
stem(datos, scale = 3)
##
## The decimal point is at the |
##
## 39 | 00
## 40 |
## 41 |
## 42 | 000
## 43 | 000
## 44 | 000
## 45 | 000
## 46 | 000000
## 47 | 000000
## 48 | 000000
## 49 | 00000000
## 50 | 000
## 51 | 0000
## 52 | 0000000
## 53 | 0000000000000
## 54 | 00000000000
## 55 | 0000
## 56 | 0
## 57 | 0000
## 58 | 0000
## 59 | 0000
## 60 | 000
## 61 | 00
- Calcule la mediana de los datos
median(datos)
## [1] 52
- Calcule el rango de los datos
range(datos)
## [1] 39 61
- Calcule el rango intercuartilico de los datos y de su interpretación:
diff(quantile(datos, probs = c(0.25, 0.75)))
## 75%
## 7