setwd("~/pye1pm")library(fdth)##
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
##
## sd, var
library(modeest)##
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
##
## mfv
library(pacman)
p_load("DT","prettydoc","xfun","readr", "datasets", "ggplot2", "beanplot")La siguiente variable corresponde a
mujeres <- women
mujeres## height weight
## 1 58 115
## 2 59 117
## 3 60 120
## 4 61 123
## 5 62 126
## 6 63 129
## 7 64 132
## 8 65 135
## 9 66 139
## 10 67 142
## 11 68 146
## 12 69 150
## 13 70 154
## 14 71 159
## 15 72 164
Este conjunto de datos proporciona las estaturas y los pesos promedio de las mujeres estadounidenses de 30 a 39 años.
y posteriormente se hace la tabla de frecuencias donde: f= frecuencia absoluta
rf= frecuencia relativa rf(%) frecuencia relativa porcentual cf= frecuencia acumulada cf(%)=frecuencia acumulada porcentual
tabla <- fdt(mujeres$height, breaks = "Sturges")
tabla## Class limits f rf rf(%) cf cf(%)
## [57.42,60.48) 3 0.2 20 3 20
## [60.48,63.54) 3 0.2 20 6 40
## [63.54,66.6) 3 0.2 20 9 60
## [66.6,69.66) 3 0.2 20 12 80
## [69.66,72.72) 3 0.2 20 15 100
ahora ordenaremos los datos de menor a mayor
sort (mujeres$weight)## [1] 115 117 120 123 126 129 132 135 139 142 146 150 154 159 164
#sort (mujeres$height)Histogramas de frecuencias
plot(tabla, type="fh")(mujeres$weight)## [1] 115 117 120 123 126 129 132 135 139 142 146 150 154 159 164
plot(tabla, type="rfh")Continuaremos con los histogramas de frecuencias
Este conjunto de datos proporciona las estaturas y los pesos promedio de las mujeres estadounidenses de 30 a 39 años.
plot(mujeres, xlab = "Height (in)", ylab = "Weight (lb)",
main = "mujeres americanas 30-39 años") Con los datos planteados acontinuacion se muestra las medidas de tendencia central de la altura de las mujeres americanas de 30 a 39 años.
mujeres$height <- c(58,59,60,61,62,63,64,65,66,67,68,69,70,71,72)Media:
mean(mujeres$height) [1] 65
Mediana:
median(mujeres$height) [1] 65
Moda:
mlv(mujeres$height) [1] 64.5
Con los datos planteados acontinuacion se muestra las medidas de tendencia central de los pesos de las mujeres americanas de 30 a 39 años.
mujeres$weight <- c(115,117,120,123,126,129,132,135,139,142,146,150,154,159,164)Media:
mean(mujeres$weight) [1] 138.6667
Mediana:
median(mujeres$weight) [1] 140.5
Moda:
mlv(mujeres$weight) [1] 144.3333
Los cuartiles, valor minimo y maximo
summary(mujeres$weight)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 115.0 124.5 135.0 136.7 148.0 164.0
summary(mujeres$height)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 58.0 61.5 65.0 65.0 68.5 72.0
El grafico de caja y bigote
boxplot(mujeres$height)boxplot(mujeres$weight)boxplot <- (mujeres$height)Continuaremos con las medidas de dispersion lineal
varianza
var(mujeres$height)## [1] 20
var(mujeres$weight)## [1] 240.2095
La desviación estándar
sd(mujeres$height)## [1] 4.472136
sd(mujeres$weight)## [1] 15.49869
Gráfico de dispersión lineal
plot(mujeres$height)plot(mujeres$weight)Analisis de regresion lineal
Tenemos los datos de cual es el numero de alturas y pesos promedio de las mujeres estadounidenses
Y con el fin de conocer la relacion de estas variables se elabora una matriz de diagramas de dispersion. Donde se puede ver una relacion clara entre la edad y la circunferencia.
pairs<- (mujeres)A continuacion se aplicara la regla de los minimos cuadrados donde el comando basico es lm (linear models)
##regresion <- lm(mujeres ~ height)
##summary <- (regresion)Intervalo de confianza
#confint(regresion)#confint(regresion, level = 0.80)Indice de correlacion
cor <- (mujeres$height - mujeres$weight)Ecuacion de la recta de los minimos cuadrados
\[ y = -1.641e-14 + 1.000e+00x \]
cor.test <- (mujeres$height - mujeres$weight)y = -1.641e-14 + 1.000e+00*(65)
y## [1] 65
Se muestra la grafica
#plot(mujeres$height, mujeres$weight, xlab="mujeres estadounidenses", ylab="alturas y pesos")
#abline(regresion)Predicciones
mujeres <- data.frame (height = seq(58:72))
(mujeres ~ height) ## mujeres ~ height
mujeres <- data.frame (weight = seq(115:164))
(mujeres ~ weight) ## mujeres ~ weight
mujeres <- (height = seq(58,72))
#Gráfico de dispersión y recta
plot(mujeres, xlab = "Height (in)", ylab = "Weight (lb)",
main = "mujeres americanas de 30-39 años")xfun::embed_file("Tarea repaso.RMD")