setwd("~/pye1pm")
library(fdth)
## 
## Attaching package: 'fdth'
## The following objects are masked from 'package:stats':
## 
##     sd, var
library(modeest)
## 
## Attaching package: 'modeest'
## The following object is masked from 'package:fdth':
## 
##     mfv
library(pacman)
p_load("DT","prettydoc","xfun","readr", "datasets", "ggplot2", "beanplot")

La siguiente variable corresponde a

mujeres <- women
mujeres
##    height weight
## 1      58    115
## 2      59    117
## 3      60    120
## 4      61    123
## 5      62    126
## 6      63    129
## 7      64    132
## 8      65    135
## 9      66    139
## 10     67    142
## 11     68    146
## 12     69    150
## 13     70    154
## 14     71    159
## 15     72    164

Este conjunto de datos proporciona las estaturas y los pesos promedio de las mujeres estadounidenses de 30 a 39 años.

y posteriormente se hace la tabla de frecuencias donde: f= frecuencia absoluta

rf= frecuencia relativa rf(%) frecuencia relativa porcentual cf= frecuencia acumulada cf(%)=frecuencia acumulada porcentual

tabla <- fdt(mujeres$height, breaks = "Sturges")
tabla
##   Class limits f  rf rf(%) cf cf(%)
##  [57.42,60.48) 3 0.2    20  3    20
##  [60.48,63.54) 3 0.2    20  6    40
##   [63.54,66.6) 3 0.2    20  9    60
##   [66.6,69.66) 3 0.2    20 12    80
##  [69.66,72.72) 3 0.2    20 15   100

ahora ordenaremos los datos de menor a mayor

sort (mujeres$weight)
##  [1] 115 117 120 123 126 129 132 135 139 142 146 150 154 159 164
#sort (mujeres$height)

Histogramas de frecuencias

plot(tabla, type="fh")

(mujeres$weight)
##  [1] 115 117 120 123 126 129 132 135 139 142 146 150 154 159 164
plot(tabla, type="rfh")

Continuaremos con los histogramas de frecuencias

Este conjunto de datos proporciona las estaturas y los pesos promedio de las mujeres estadounidenses de 30 a 39 años.

plot(mujeres, xlab = "Height (in)", ylab = "Weight (lb)",
     main = "mujeres americanas 30-39 años")

Con los datos planteados acontinuacion se muestra las medidas de tendencia central de la altura de las mujeres americanas de 30 a 39 años.

mujeres$height <- c(58,59,60,61,62,63,64,65,66,67,68,69,70,71,72)

Media:

mean(mujeres$height) [1] 65

Mediana:

median(mujeres$height) [1] 65

Moda:

mlv(mujeres$height) [1] 64.5

Con los datos planteados acontinuacion se muestra las medidas de tendencia central de los pesos de las mujeres americanas de 30 a 39 años.

mujeres$weight <- c(115,117,120,123,126,129,132,135,139,142,146,150,154,159,164)

Media:

mean(mujeres$weight) [1] 138.6667

Mediana:

median(mujeres$weight) [1] 140.5

Moda:

mlv(mujeres$weight) [1] 144.3333

Los cuartiles, valor minimo y maximo

summary(mujeres$weight)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   115.0   124.5   135.0   136.7   148.0   164.0
summary(mujeres$height)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    58.0    61.5    65.0    65.0    68.5    72.0

El grafico de caja y bigote

boxplot(mujeres$height)

boxplot(mujeres$weight)

boxplot <- (mujeres$height)

Continuaremos con las medidas de dispersion lineal

varianza

var(mujeres$height)
## [1] 20
var(mujeres$weight)
## [1] 240.2095

La desviación estándar

sd(mujeres$height)
## [1] 4.472136
sd(mujeres$weight)
## [1] 15.49869

Gráfico de dispersión lineal

plot(mujeres$height)

plot(mujeres$weight)

Analisis de regresion lineal

Tenemos los datos de cual es el numero de alturas y pesos promedio de las mujeres estadounidenses

Y con el fin de conocer la relacion de estas variables se elabora una matriz de diagramas de dispersion. Donde se puede ver una relacion clara entre la edad y la circunferencia.

pairs<- (mujeres)

A continuacion se aplicara la regla de los minimos cuadrados donde el comando basico es lm (linear models)

##regresion <- lm(mujeres ~ height)
##summary <- (regresion)

Intervalo de confianza

#confint(regresion)
#confint(regresion, level = 0.80)

Indice de correlacion

cor <- (mujeres$height - mujeres$weight)

Ecuacion de la recta de los minimos cuadrados

\[ y = -1.641e-14 + 1.000e+00x \]

cor.test <- (mujeres$height - mujeres$weight)
y = -1.641e-14 + 1.000e+00*(65)
y
## [1] 65

Se muestra la grafica

#plot(mujeres$height, mujeres$weight, xlab="mujeres estadounidenses", ylab="alturas y pesos")
#abline(regresion)

Predicciones

mujeres <- data.frame (height = seq(58:72))
(mujeres ~ height) 
## mujeres ~ height
mujeres <- data.frame (weight = seq(115:164))
(mujeres ~ weight) 
## mujeres ~ weight
mujeres <- (height = seq(58,72))

#Gráfico de dispersión y recta 
plot(mujeres, xlab = "Height (in)", ylab = "Weight (lb)",
     main = "mujeres americanas de 30-39 años")

xfun::embed_file("Tarea repaso.RMD")

Download Tarea repaso.RMD