TEMA 1. Medidas de tendencia central y dispersion

Ejercicio 1

# con c() se asigna un vector(una columna de valores)

luz <- c(266.63, 163.42, 219.41, 162.64, 187.16, 289.17, 306.55, 335.48, 345.50, 226.80, 208.99, 230.46)
luz
##  [1] 266.63 163.42 219.41 162.64 187.16 289.17 306.55 335.48 345.50 226.80
## [11] 208.99 230.46
media <- mean(luz)
media
## [1] 245.1842
mediana <- median(luz)
mediana
## [1] 228.63
moda <- mode(luz)   # no hay funcion de moda en r 

no se puede obtener el rango directamente con la funsion range la funcion range() da los valores maximos y nimimos pero no lo

rango <- max(luz) - min(luz)
rango
## [1] 182.86

la varianza y desviasion estandar en r es muestral para calcularl la poblacional se hace de la siguiente manera

luz_media <- luz - media 
luz_media
##  [1]  21.44583 -81.76417 -25.77417 -82.54417 -58.02417  43.98583  61.36583
##  [8]  90.29583 100.31583 -18.38417 -36.19417 -14.72417
#si a un vector le restas un dato, el dato se va a restar a cada renglon del vector 
luz_cuadrado <- luz_media*luz_media
luz_cuadrado
##  [1]   459.9238  6685.3790   664.3077  6813.5395  3366.8039  1934.7535
##  [7]  3765.7655  8153.3375 10063.2664   337.9776  1310.0177   216.8011
luz_cuadrado_suma <- sum(luz_cuadrado)
luz_cuadrado_suma
## [1] 43771.87
varianza_poblacional <- luz_cuadrado_suma/12
varianza_poblacional
## [1] 3647.656
desviacion_estandar_poblacional <- sqrt(varianza_poblacional)
desviacion_estandar_poblacional
## [1] 60.39583
# funcion de raiz cuadrada sqrt()
varianza_muestral <- var(luz)
varianza_muestral
## [1] 3979.261
desviacion_estandar_muestral <- sd(luz)
desviacion_estandar_muestral
## [1] 63.08139

Tema 2. Distribución Normal

problema 1

1A)

# pnorm(x,miu,sigma))*100(porciencto)
a <- (pnorm(600,1300,600))*100
a
## [1] 12.16725

1B)

b <- ((pnorm(1500,1300,600))*100)-((pnorm(1000,1300,600))*100)
b
## [1] 32.20211

1C)

c <- (1-pnorm(2200,1300,600))*100
c
## [1] 6.68072

Problema 2

2A)

a2 <- (pnorm(21,18.7,5))*100
a2
## [1] 67.72419

2B)

b2 <- ((1-pnorm(21,18.7,5))*100)
b2
## [1] 32.27581

problema 3

3A)

a3 <- (1-pnorm(90,80,4))*100
a3
## [1] 0.6209665

3B)

b3 <- (pnorm(85,80,4)-pnorm(70,80,4))*100
b3
## [1] 88.81406

3C)

#round arriba
# floor redondea para abajo 
# ceiling redondea para arriba

c3 <- floor((1-pnorm(100,80,4))*1000) #1000 pilas

 
c3
## [1] 0
d4 <- floor((1-pnorm(90,80,4))*1000) #1000 pilas
d4
## [1] 6

TEMA 3: prubas de hipotesis

paso 1. plantear hipotesis paso 2. nivel de significacia paso 3. zona de aceptacion rechazo paso 4. funcion pivotal paso 5. consulion

Ejercios del mundo real

3.84

¿Qué reacción tendría usted si un aficionado al fútbol americano le dijera lo siguiente? “Los Raiders de Rockland tienen un promedio de 3.6 yardas de recorrido por tierra. Como sólo necesitan 10 yardas para anotar y tienen cuatro oportunidades para lograrlo, la anotación es segura, siempre y cuando mantengan su forma de jugar por tierra.”

RESPUESTA -> La afirmación es incorrecta porque ignora completamente la variabilidad en yardas ganadas por carrera.

3.86

A continuación se presentan tres partes del presupuesto de una año para la defensa; a cada una de ellas, el Congreso estadounidense asignó la misma cantidad de financiamiento * Salario de los funcionarios (total) * Mantenimiento de la flota aérea. * Adquisiciones de alimentos (total)

RESPUESTA -> Salarios de funcionarios: A; mantenimiento de flota: C; adquisiciones de alimentos: B

3.92

E1 30 de junio de 1992, la capitalización de nueve mercados de valores del Pacífico y Asia fue:

Pais | capitalizacion en miles de millones de dolares ————— | ————- filipinas | 17 indonesia | 21 tailandia | 44 singapur | 50 malasia | 79 corea del sur | 86 taiwan | 140 Hong Kong | 178 Australia | 203

a)Encuentre la media aritmética de los datos b)Encuentre la mediana de los datos. c)Encuentre la moda de los datos d)Cuál es la mejor medida de la tendencia central del conjunto de datos? e)Encuentre la desviación estándar de los datos. (La población completa está incluida en ellos.)

cap <- c(17, 21, 44, 50, 79, 86, 140, 178, 203)

# a)
media_cap <- mean(cap)
media_cap
## [1] 90.88889
# b)
mediana_cap <- median(cap)
mediana_cap
## [1] 79
# c)
#no hay moda

# d) 
histograma_cap <- hist(cap)

#la mediana es la mejor media de tendencia central cuando tienes una distribucion sesgada 

# e) desviacion poblacioonal 

cap2 <- cap-media_cap
cap2 
## [1] -73.888889 -69.888889 -46.888889 -40.888889 -11.888889  -4.888889  49.111111
## [8]  87.111111 112.111111
cap3 <- cap2*cap2
cap3
## [1]  5459.56790  4884.45679  2198.56790  1671.90123   141.34568    23.90123
## [7]  2411.90123  7588.34568 12568.90123
cap4 <- sum(cap3)
varianza_cap_poblacional <- cap4/9
varianza_cap_poblacional
## [1] 4105.432
desv_cap <- sqrt(varianza_cap_poblacional)
desv_cap
## [1] 64.07365
sd_cap_pop <- sqrt(var(cap) * (length(cap)-1) / length(cap))
sd_cap_pop
## [1] 64.07365

8.64

Inspectores del gobierno, al investigar los cargos levantados contra una embotelladora de refrescos de Lousiana, que no llenaba bien sus productos, muestrearon 200 botellas y encontraron que el promedio de llenado es 31.7 onzas líquidas. Se anuncia que las botellas contienen 32 onzas líquidas. Se sabe que la desviación estándar de le población es 1.5 onzas líquidas. ¿Deberían concluir los inspectores, a un nivel de significancia del 2%, que las botellas están tienen menos contenido?

paso 1. plantear hipotesis opcion 1 -> Ho: xbar = μ H1: xbar ≠ μ

paso 2. nivel de significacia α = 0.02

paso 3. zona de aceptacion rechazo

paso 4. funcion pivotal

z_botellas <- (31.7-32)/(1.5/sqrt(200))
z_botellas
## [1] -2.828427

paso 5. conclusion se rechaza Ho las botellas tienen un llenado diferente 32 onzas. Con una confianza del 98%