Parcial_1

El siguiente documento HTML tiene como objetivo dar respuesta al taller Ejercicios Distribución de Frecuencia
Autor/a

Harold Andrés Alonso Trujillo

Fecha de publicación

May 7, 2023

Librerias

Código
library(ggplot2)
library(lattice)
library(vembedr)
library(knitr)
library(kableExtra)
library(agricolae)
library(dplyr)

Punto 1

Clasifica las siguientes variables como cualitativas o cuantitativas, y a estas últimas como continuas o discretas:

Código
Variables <- c("Intención de voto de un colectivo",
                "Nº de cartas que se escriben en un mes",
                "Número de calzado",
                "Nº de Km. recorrido en un fin de semana",
                "Marcas de cerveza",
                "Nº de empleados de una empresa",
                "Altura",
                "Temperatura de un enfermo")

Clasificación <- c("Variable cualitativa nominal",
                   "Variable cuantitativa discreta y razón",
                   "Variable cualitativa ordinal",
                   "Variable cuantitativa continua y razón",
                   "Variable cualitativa nominal",
                   "Variable cuantitativa discreta y razón",
                   "Variable cuantitativa continua y razón",
                   "Variable cuantitativa continua y en intervalo"
                                         )
Punto1 <- data.frame("Variables"= Variables,
                      "Clasificación"= Clasificación )

kable(Punto1) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "left")
Variables Clasificación
Intención de voto de un colectivo Variable cualitativa nominal
Nº de cartas que se escriben en un mes Variable cuantitativa discreta y razón
Número de calzado Variable cualitativa ordinal
Nº de Km. recorrido en un fin de semana Variable cuantitativa continua y razón
Marcas de cerveza Variable cualitativa nominal
Nº de empleados de una empresa Variable cuantitativa discreta y razón
Altura Variable cuantitativa continua y razón
Temperatura de un enfermo Variable cuantitativa continua y en intervalo

Punto 2

Muchas de las personas que invierten en bolsa lo hacen para conseguir beneficios rápidos, por ello el tiempo en que mantienen las acciones es relativamente breve. Preguntada una muestra de 40 inversores habituales sobre el tiempo en meses que han mantenido sus últimas inversiones se recogieron los siguientes datos:

Código
Vector2 <- c(10.5,11.2, 9.9,    15, 11.4,   12.7,   16.5,   10.1,   12.7,   
            11.4, 11.6, 6.2,    7.9,    8.3,    10.9,   8.1,    3.8,    10.5,   11.7,   8.4,
            12.5,   11.2,   9.1,    10.4,   9.1,    13.4,   12.3,   5.9,    11.4,   8.8,
            7.4,    8.6,    13.6,   14.7,   11.5,   11.5,   10.9,   9.8,    12.9,   9.9)
Punto2 <- matrix(Vector2,nrow=4, ncol=10)

kable(Punto2) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
10.5 11.4 12.7 7.9 3.8 12.5 9.1 11.4 13.6 10.9
11.2 12.7 11.4 8.3 10.5 11.2 13.4 8.8 14.7 9.8
9.9 16.5 11.6 10.9 11.7 9.1 12.3 7.4 11.5 12.9
15.0 10.1 6.2 8.1 8.4 10.4 5.9 8.6 11.5 9.9

Construye una tabla de frecuencias que recoja adecuadamente esta información, y haz también alguna representación gráfica.

Código
caracteristicas <- c("Población", 
                     "Muestra",
                     "Objetivos de estudio",
                     "Variables",
                     "Tipo de variable sgún su naturaleza",
                     "Tipo de variable su escala de medición")

caracteristicas_punto_2 <- data.frame("Caracteristicas" = caracteristicas,
                                      "Información"= c("El tiempo (meses) que las personas han mantenido sus ultimas inversiones en la bolsa.",
                                                       "El tiempo (meses) que 40 inversores han mantenido sus ultimas inversiones en las bolsa.",
                                                       "Los 40 inversores",
                                                       "El tiempo (meses).",
                                                       "Variable Cuantitativa Continua",
                                                       "Razón"))

kable(caracteristicas_punto_2) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
Caracteristicas Información
Población El tiempo (meses) que las personas han mantenido sus ultimas inversiones en la bolsa.
Muestra El tiempo (meses) que 40 inversores han mantenido sus ultimas inversiones en las bolsa.
Objetivos de estudio Los 40 inversores
Variables El tiempo (meses).
Tipo de variable sgún su naturaleza Variable Cuantitativa Continua
Tipo de variable su escala de medición Razón

TABLA No1: Distribución de frecuencias para 40 inversores según el tiempo (meses) que han mantenido sus últimas inversiones en la bolsa. Ciudad de Ibagué.

Código
Distribución_p2 <- hist(Vector2, plot = FALSE)
Tabla_p2 <- table.freq(Distribución_p2)
kable(Tabla_p2) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
Lower Upper Main Frequency Percentage CF CPF
2 4 3 1 2.5 1 2.5
4 6 5 1 2.5 2 5.0
6 8 7 3 7.5 5 12.5
8 10 9 10 25.0 15 37.5
10 12 11 15 37.5 30 75.0
12 14 13 7 17.5 37 92.5
14 16 15 2 5.0 39 97.5
16 18 17 1 2.5 40 100.0

GRÁFICA No 1: Histograma de frecuencias para 40 inversores según el tiempo (meses) que han mantenido sus últimas inversiones en la bolsa. Ciudad de Ibagué.

Código
Grafica_histo_p2 <- hist(Vector2, 
                   xlab = "Tiempo en meses", 
                   ylab = "N° de inversores",
                   main = "Histograma de frecuencias",
                   col = 1:8)

GRÁFICA No 2: Polígono de frecuencias para 40 inversores según el tiempo (meses) que han mantenido sus últimas inversiones en la bolsa. Ciudad de Ibagué.

Código
Grafica_lineas_p2 <- plot(x =Tabla_p2$Main,
                          y =Tabla_p2$Frequency,
                          type="b",
                          pch=20,
                          lty=1,
                          xlab="Tiempo en meses",
                          ylab="N° de inversores",
                          main="Polígono de frecuencias") %>%
lines(x =Tabla_p2$Main,
      y =Tabla_p2$Frequency) %>% 
axis(side=1,Tabla_p2$Main,labels=TRUE)

GRÁFICA No 3: Ojiva de frecuencias para 40 inversores según el tiempo (meses) que han mantenido sus últimas inversiones en la bolsa. Ciudad de Ibagué

Código
Grafica_ojivas_p2 <- plot(x =Tabla_p2$Main,
                          y =Tabla_p2$CPF,
                          type="b",
                          pch=20,
                          lty=1,
                          xlab="Tiempo en meses",
                          ylab="N° de inversores",
                          main="Ojiva de frecuencias") %>%
lines(x =Tabla_p2$Main,
      y =Tabla_p2$CPF) %>% 
axis(side=1,Tabla_p2$Main,labels=TRUE)

Punto 3

Investigados los precios por habitación de 50 hoteles de una ciudad se han obtenido los siguientes resultados:

Código
Vector3 <- c(700,   300,    500,    400,    500,    700,    400,    750,    800,    500,
             300,   400,    700,    400,    700,    500,    400,    700,    1000,   750,
             400,   500,    300,    500,    1000,   300,    400,    500,    700,    500,
             500,   750,    300,    700,    1000,   1500,   500,    750,    1200,   800,
             700,   800,    750,    700,    750,    800,    700,    700,    1200,   800)
Punto3 <- matrix(Vector3,nrow=5, ncol=10)

kable(Punto3) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
700 700 300 500 400 300 500 1500 700 800
300 400 400 400 500 400 750 500 800 700
500 750 700 700 300 500 300 750 750 700
400 800 400 1000 500 700 700 1200 700 1200
500 500 700 750 1000 500 1000 800 750 800

Determínese:

  • La distribución de frecuencias de los precios.

  • Porcentaje de hoteles con un precio superior a 750.

  • Cuántos hoteles tienen un precio mayor o igual que 500 pero menor o igual a 1000.

  • Representar gráficamente dichas distribuciones.

Código
caracteristicas_punto_3 <- data.frame("Caracteristicas" = caracteristicas,
                                      "Información"= c("El precio por habitación de los hoteles de una ciudad.",
                                                       "El precio por habitación de 50 hoteles de una ciudad.",
                                                       "Los 50 hoteles.",
                                                       "El precio por habitación",
                                                       "Variable Cuantitativa Continua",
                                                       "Razón"))

kable(caracteristicas_punto_3) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
Caracteristicas Información
Población El precio por habitación de los hoteles de una ciudad.
Muestra El precio por habitación de 50 hoteles de una ciudad.
Objetivos de estudio Los 50 hoteles.
Variables El precio por habitación
Tipo de variable sgún su naturaleza Variable Cuantitativa Continua
Tipo de variable su escala de medición Razón

TABLA No 2: Distribuciones de frecuencia para 50 hoteles según los precios por habitación. Ciudad de Londres

Código
Distribución_p3 <- hist(Vector3, plot = FALSE)
Tabla_p3 <- table.freq(Distribución_p3)
kable(Tabla_p3) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
Lower Upper Main Frequency Percentage CF CPF
200 400 300 12 24 12 24
400 600 500 10 20 22 44
600 800 700 22 44 44 88
800 1000 900 3 6 47 94
1000 1200 1100 2 4 49 98
1200 1400 1300 0 0 49 98
1400 1600 1500 1 2 50 100

GRÁFICA No 4: Histograma de frecuencia para 50 hoteles según los precios por habitación. Ciudad de Londres.

Código
Grafica_histo_p3 <- hist(Vector3, 
                   xlab = "precio", 
                   ylab = "porcentajes",
                   main = "Histograma de frecuencias",
                   col = 1:8)

GRÁFICA No 5: Polígono de frecuencia para 50 hoteles según los precios por habitación. Ciudad de Londres.

Código
Grafica_lineas_p3 <- plot(x =Tabla_p3$Main,
                          y =Tabla_p3$Frequency,
                          type="b",
                          pch=20,
                          lty=1,
                          xlab = "precio", 
                   ylab = "porcentajes",
                   main = "Poligono de frecuencias") %>%
lines(x =Tabla_p2$Main,
      y =Tabla_p2$Frequency) %>% 
axis(side=1,Tabla_p2$Main,labels=TRUE)

GRÁFICA No 6: Ojiva de frecuencia para 50 hoteles según los precios por habitación. Ciudad de Londres.

Código
Grafica_ojivas_p3 <- plot(x =Tabla_p3$Main,
                          y =Tabla_p3$CPF,
                          type="b",
                          pch=20,
                          lty=1,
                         xlab = "precio", 
                        ylab = "porcentajes",
                        main = "Ojiva de frecuencias") %>%
lines(x =Tabla_p3$Main,
      y =Tabla_p3$CPF) %>% 
axis(side=1,Tabla_p3$Main,labels=TRUE)

  • Porcentaje de hoteles con un precio superior a 750.

    Código
    34 - 12
    [1] 22

    El 22% de los hoteles tiene un precio superior a 750

  • Cuántos hoteles tienen un precio mayor o igual que 500 pero menor o igual a 1000.

    Código
    38-3
    [1] 35

    Los hoteles con un precio mayor o igual a 500 pero menor o igual a 1000 son 35.

Punto 4

El gobierno desea saber si el número medio de hijos por familia ha descendido respecto a la década anterior. Para ello ha encuestado a 50 familias respecto al número de hijos y ha obtenido los siguientes datos:

Código
Vector4 <- c(3,4,3,2,4,3,5,1,2,2,0,4,3,2,2,3,1,0,2,2,3,2,2,2,2,3,3,2,1,6,4,
             2,3,3,2,2,2,4,3,3,2,3,3,2,3,2,4,1,2,0)
Punto4 <- matrix(Vector4,nrow=2, ncol=25)

kable(Punto4) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 3 2 2 3 2 3 3 4 2
4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 4 3 3 2 2 1 0
  • Construye la tabla de frecuencias a partir de estos datos.

  • Construye el grafico que consideres más adecuado con las frecuencias no acumuladas

  • Construye el gráfico que consideres más adecuado con las frecuencias acumuladas.

Código
caracteristicas_punto_4 <- data.frame("Caracteristicas" = caracteristicas,
                                      "Información"= c("El número medio de hijos por familia de todas las familias de la ciudad de Cali",
                                                       "El número medio de hijos por familia de 50 familias de la ciudad de Cali",
                                                       "50 familias de la ciudad de Cali",
                                                       "Número medio de hijos por familia",
                                                       "Cuantitativa discreta",
                                                       "Razón"))

kable(caracteristicas_punto_4) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
Caracteristicas Información
Población El número medio de hijos por familia de todas las familias de la ciudad de Cali
Muestra El número medio de hijos por familia de 50 familias de la ciudad de Cali
Objetivos de estudio 50 familias de la ciudad de Cali
Variables Número medio de hijos por familia
Tipo de variable sgún su naturaleza Cuantitativa discreta
Tipo de variable su escala de medición Razón

Tabla N° 3 Distribución de frecuencias para 50 familias de la ciudad de Cali, según el número medio de hijos por familia.

Código
Tabla_P4 <- table.freq(hist(Vector4, plot = FALSE))

kable(Tabla_P4) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
Lower Upper Main Frequency Percentage CF CPF
0 1 0.5 7 14 7 14
1 2 1.5 20 40 27 54
2 3 2.5 15 30 42 84
3 4 3.5 6 12 48 96
4 5 4.5 1 2 49 98
5 6 5.5 1 2 50 100

Grafica N° 7: Diagrama de barras para 50 familias de la ciudad de Cali, según el número medio de hijos por familia.

Código
Grafica_histo_p4 <- barplot(table(Vector4), 
                   xlab = "N° de hijos", 
                   ylab = "Número de familias",
                   main = "Diagrama de barras de frecuencias",
                   col = 1:8)

Grafica N° 8: Diagrama de horizontal para 50 familias de la ciudad de Cali, según el número medio de hijos por familia.

Código
Diagrama_hor_p4 <- ecdf(Vector4)
plot(Diagrama_hor_p4, 
     main = "Grafica de función por partes", 
     ylab = "N° de hijos", 
     xlab = "Famlias", 
     col = "#000000")

  • ¿Cuántas familias tienen exactamente tres hijos?

15 familias tienen exactamente tres (3) hijos

  • ¿Qué porcentaje de familias tienen exactamente 3 hijos?

El 30% de las familias tienen exactamente tres (3) hijos

  • ¿Qué porcentaje de las familias de la muestra tienen más de dos hijos? ¿Y menos de 3?

Un 46% de familias tienen más de dos (2) hijos

Punto 5

En un hospital se desea hacer un estudio sobre los pesos de los recién nacidos. Para ello, se recogen los datos de 40 bebes y se tiene:

Código
Vector5 <- c(3.2,3.7,4.2,4.6,3.7,3.0,2.9,3.1,3.0,4.5,
             4.1,3.8,3.9,3.6,3.2,3.5,3.0,2.5,2.7,2.8,
             3.0,4.0,4.5,3.5,3.5,3.6,2.9,3.2,4.2,4.3,
             4.1,4.6,4.2,4.5,4.3,3.2,3.7,2.9,3.1,3.5)
Punto5 <- matrix(Vector5,nrow=4, ncol=10)

kable(Punto5) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
3.2 3.7 3.0 3.9 3.0 3.0 3.5 4.2 4.2 3.7
3.7 3.0 4.5 3.6 2.5 4.0 3.6 4.3 4.5 2.9
4.2 2.9 4.1 3.2 2.7 4.5 2.9 4.1 4.3 3.1
4.6 3.1 3.8 3.5 2.8 3.5 3.2 4.6 3.2 3.5
  • Construir la tabla de frecuencias

  • Representa gráficamente la información recogida.

Código
caracteristicas_punto_5 <- data.frame("Caracteristicas" = caracteristicas,
                                      "Información"= c("El peso (kg) de todos los recién nacidos en el Hospital Federico Lleras.",
                                                       "El peso (kg) de 40 bebés recién nacidos que se encuentran en el Hospital Federico Lleras.",
                                                       "Los 40 bebés",
                                                       "El peso (kg)",
                                                       "Variable Cuantitativa Continua",
                                                       "Razón"))

kable(caracteristicas_punto_5) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
Caracteristicas Información
Población El peso (kg) de todos los recién nacidos en el Hospital Federico Lleras.
Muestra El peso (kg) de 40 bebés recién nacidos que se encuentran en el Hospital Federico Lleras.
Objetivos de estudio Los 40 bebés
Variables El peso (kg)
Tipo de variable sgún su naturaleza Variable Cuantitativa Continua
Tipo de variable su escala de medición Razón

Tabla No 4: Distribución de frecuencias para el peso (kg) de 40 bebés recién nacidos que se encuentran en el Hospital Federico Lleras. Ciudad de Ibagué.

Código
Tabla_P5 <- table.freq(hist(Vector5, plot = FALSE))

kable(Tabla_P5) %>% 
   kable_styling(bootstrap_options = "striped",
                 full_width = F,
                 position = "center")
Lower Upper Main Frequency Percentage CF CPF
2.5 3.0 2.75 10 25 10 25
3.0 3.5 3.25 10 25 20 50
3.5 4.0 3.75 8 20 28 70
4.0 4.5 4.25 10 25 38 95
4.5 5.0 4.75 2 5 40 100

Gráfico No 9: Histograma de frecuencias para el peso (kg) de 40 bebés recién nacidos que se encuentran en el Hospital Federico Lleras. Ciudad de Ibagué,

Código
Grafica_histo_p5 <- hist(Vector5, 
                         xlab = "peso", 
                         ylab = "N° de bebes",
                         main = "Histograma de frecuencias",
                         col = 1:8)

Gráfico No 10: Polígono de frecuencias para el peso (kg) de 40 bebés recién nacidos que se encuentran en el Hospital Federico Lleras. Ciudad de Ibagué

Código
Grafica_lineas_P5 <- plot(x =Tabla_P5$Main,
                          y =Tabla_P5$Frequency,
                          type="b",
                          pch=20,
                          lty=1,
                          xlab = "precio", 
                          ylab = "porcentajes",
                          main = "Poligono de frecuencias") %>%
  lines(x =Tabla_P5$Main,
        y =Tabla_P5$Frequency) %>% 
  axis(side=1,Tabla_P5$Main,labels=TRUE)

Gráfico No 11: Ojiva de frecuencias para el peso (kg) de 40 bebés recién nacidos que se encuentran en el Hospital Federico Lleras. Ciudad de Ibagué.

Código
Grafica_ojivas_P5 <- plot(x =Tabla_P5$Main,
                          y =Tabla_P5$CPF,
                          type="b",
                          pch=20,
                          lty=1,
                          xlab = "peso", 
                          ylab = "porcentajes",
                          main = "Ojiva de frecuencias") %>%
  lines(x =Tabla_P5$Main,
        y =Tabla_P5$CPF) %>% 
  axis(side=1,Tabla_p3$Main,labels=TRUE)

  • Si sabemos que los bebes que pesan menos de 3 kilos nacen prematuramente ¿Qué porcentaje de niños prematuros han nacido entre estos 40?

    El 15% de los bebés nacieron prematuros.

  • Normalmente los niños que pesan más de 3 kilos y medio no necesitan estar en la incubadora ¿Puedes decirme que porcentaje de niños están en esta situación?

    El 50% de los bebés no necesitan estar en incubadora.

Punto 6

Completar la siguiente tabla:

Código
Tabla_p6 <- data.frame("Li" = c(0,10,20,30,40),
                       "Ls" = c(10,20,30,40,50),
                       "Yi" = c(NA,NA,NA,NA,NA),
                       "ni" = c(2,NA,NA,15,NA),
                       "hi%" = c(0.05,NA,NA,NA,NA),
                       "Ni" = c(2,NA,NA,NA,NA),
                       "Hi%" = c(0.05,0.15,0.40,0.775,1)) 
kable(Tabla_p6) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
Li Ls Yi ni hi. Ni Hi.
0 10 NA 2 0.05 2 0.050
10 20 NA NA NA NA 0.150
20 30 NA NA NA NA 0.400
30 40 NA 15 NA NA 0.775
40 50 NA NA NA NA 1.000

Tabla No 5: Distribución de frecuencias

Código
Tabla_R_p6 <- data.frame("Li" = c(0,10,20,30,40),
                       "Ls" = c(10,20,30,40,50),
                       "Yi" = c(5,15,25,35,45),
                       "ni" = c(2,4,10,15,9),
                       "hi%" = c(0.05,0.10,0.25,0.375,0.225),
                       "Ni" = c(2,6,16,31,40),
                       "Hi%" = c(0.05,0.15,0.40,0.775,1)) 
kable(Tabla_R_p6) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
Li Ls Yi ni hi. Ni Hi.
0 10 5 2 0.050 2 0.050
10 20 15 4 0.100 6 0.150
20 30 25 10 0.250 16 0.400
30 40 35 15 0.375 31 0.775
40 50 45 9 0.225 40 1.000

Punto 7

Antes de las últimas elecciones generales, una encuesta realizada sobre la intención de voto de colectivo de 45 personas, dio los siguientes resultados:

Código
Vector7 <- c("PP","PSOE","IU","PP","PSOE","UV","PP","UV","PSOE",
             "IU","PP","IU","PP","UV","PP","PP","PSOE","UV",
             "PSOE","PP","PSOE","UV","PP","UV","UV","PSOE","PP",
             "IU","PP","PSOE","IU","PP","IU","UV","UV","PP",
             "PSOE","UV","PP","PSOE","PP","IU","PP","IU","PP")
Punto7 <- matrix(Vector7,nrow=5, ncol=9)

kable(Punto7) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
PP UV PP PP PSOE PSOE IU PP PP
PSOE PP IU PSOE UV PP PP PSOE IU
IU UV PP UV PP IU IU UV PP
PP PSOE UV PSOE UV PP UV PP IU
PSOE IU PP PP UV PSOE UV PSOE PP
Código
caracteristicas_punto_7 <- data.frame("Caracteristicas" = caracteristicas,
                                      "Información"= c("La intención de voto colectivo de todos los encuestados antes de las últimas elecciones generales en EE.UU.",
                                                       "La intención de voto colectivo de 45 personas antes de las últimas elecciones generales en EE.UU.",
                                                       "Las 45 personas antes de las últimas elecciones generales en EE.UU.",
                                                       "La intención de voto.",
                                                       "Variable Cualitativa",
                                                       "Nominal"))

kable(caracteristicas_punto_7) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
Caracteristicas Información
Población La intención de voto colectivo de todos los encuestados antes de las últimas elecciones generales en EE.UU.
Muestra La intención de voto colectivo de 45 personas antes de las últimas elecciones generales en EE.UU.
Objetivos de estudio Las 45 personas antes de las últimas elecciones generales en EE.UU.
Variables La intención de voto.
Tipo de variable sgún su naturaleza Variable Cualitativa
Tipo de variable su escala de medición Nominal

Tabla No 6: Distribución de frecuencias para 45 personas con intención de voto antes de las elecciones generales en EE.UU. Ciudad de New York,

Código
## MODIFICAR
Tabla_p7 <- data.frame(

  "ni" = table(Vector7),

  "hi" = prop.table(table(Vector7)),

  "%" = (prop.table(table(Vector7))*100),
  
  "Ni" = cumsum(table(Vector7)),
  
  "Hi" = cumsum(prop.table(table(Vector7))))

kable(Tabla_p7) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
ni.Vector7 ni.Freq hi.Vector7 hi.Freq X..Vector7 X..Freq Ni Hi
IU IU 8 IU 0.1777778 IU 17.77778 8 0.1777778
PP PP 17 PP 0.3777778 PP 37.77778 25 0.5555556
PSOE PSOE 10 PSOE 0.2222222 PSOE 22.22222 35 0.7777778
UV UV 10 UV 0.2222222 UV 22.22222 45 1.0000000

Gráfica No 12: Diagrama de barras para 45 personas con intención de voto antes de las elecciones generales en EE.UU. Ciudad de New York

Código
Grafica_histo_p7 <- barplot(table(Vector7), 

                         xlab = "Intencion de voto", 

                         ylab = "N° de personas",

                         main = "Diagrama de barras de frecuencias",

                         col = 1:8)

Gráfica No 13: Diagrama de sectores para 45 personas con intención de voto antes de las elecciones generales en EE.UU. Ciudad de New York

Código
Grafica_sectores_p7 <- pie((prop.table(table(Vector7))*100),
                           col= 1:5 ,
                           main="Diagrama de sectores")

  • Confeccionar una tabla de frecuencias que recoja esta información y elabora dos tipos de gráficos distintos a partir de ella. ¿Qué porcentaje de votantes espera tener cada formación política?

El porcentaje que se espera tener para cada formación política es el siguiente: El 37.8% de los votantes espera optar por el partido político “PP”, el 17.8% de los votantes espera optar por el partido político “IU”, y tanto el partido político “UV” y el “PSOE” esperan tener un 22.2%.

Punto 8

Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en el año 2002 son los siguientes:

Código
Vector8 <- c(440,560,335,587,613,400,424,466,565,393,
             453,650,407,376,470,560,321,500,528,526,
             570,430,608,537,409,600,550,432,591,428,
             440,340,558,460,560,607,382,667,512,492,
             450,530,501,471,660,470,364,634,580,450,
             574,500,462,380,518,480,625,507,645,382)
Punto8 <- matrix(Vector8,nrow=6, ncol=10)

kable(Punto8) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
440 424 407 528 409 440 382 501 580 518
560 466 376 526 600 340 667 471 450 480
335 565 470 570 550 558 512 660 574 625
587 393 560 430 432 460 492 470 500 507
613 453 321 608 591 560 450 364 462 645
400 650 500 537 428 607 530 634 380 382
  • Construya la tabla de frecuencia.
Código
caracteristicas_punto_8 <- data.frame("Caracteristicas" = caracteristicas,
                                      "Información"= c("Los sueldos mensuales (en dólares) de todos los empleados de la empresa Pirámide S.A. en el año 2002.",
                                                       "Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en el año 2002",
                                                       "Los 60 empleados de la empresa Pirámide S.A. en el año 2002",
                                                       "Los sueldos mensuales (en dólares)",
                                                       "Variable Cuantitativa Continua",
                                                       "Razón"))

kable(caracteristicas_punto_8) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
Caracteristicas Información
Población Los sueldos mensuales (en dólares) de todos los empleados de la empresa Pirámide S.A. en el año 2002.
Muestra Los sueldos mensuales (en dólares) de 60 empleados de la empresa Pirámide S.A. en el año 2002
Objetivos de estudio Los 60 empleados de la empresa Pirámide S.A. en el año 2002
Variables Los sueldos mensuales (en dólares)
Tipo de variable sgún su naturaleza Variable Cuantitativa Continua
Tipo de variable su escala de medición Razón

Tabla N° 7: Distribución de frecuencias para 60 de la empresa Pirámide S.A. en el año 2002, según los sueldos mensuales (en dólares).

Código
Distribución_p8 <- hist(Vector8, plot = FALSE)
Tabla_p8 <- table.freq(Distribución_p8)
kable(Tabla_p8) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
Lower Upper Main Frequency Percentage CF CPF
300 350 325 3 5.0 3 5.0
350 400 375 7 11.7 10 16.7
400 450 425 10 16.7 20 33.3
450 500 475 11 18.3 31 51.7
500 550 525 9 15.0 40 66.7
550 600 575 11 18.3 51 85.0
600 650 625 7 11.7 58 96.7
650 700 675 2 3.3 60 100.0

Punto 9

En una finca de apartamentos en el Tolima, se reúne la comunidad de vecinos para ver si contratan una persona que les lleve la contabilidad. El resultado de la votación es el siguiente: 25 vecinos a favor de la contratación, 15 vecinos en contra y 5 vecinos se abstienen. Construye la tabla de frecuencias para estos datos y representa gráficamente la información recogida mediante un diagrama de sectores

Código
caracteristicas_punto_9 <- data.frame("Caracteristicas" = caracteristicas,
                                      "Información"= c("Los Votos de vecinos de una comunidad en una finca de apartamentos en el Tolima para ver si se contrata a una persona que les lleve la contabilidad",
                                                       "Los Votos de 45 vecinos de una comunidad en una finca de apartamentos en el Tolima para ver si se contrata a una persona que les lleve la contabilidad.",
                                                       "Los 45 vecinos de una comunidad en una finca de apartamentos en el Tolima",
                                                       "Votos de los vecinos",
                                                       "Variable Cualitativa",
                                                       "Nominal"))

kable(caracteristicas_punto_9) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
Caracteristicas Información
Población Los Votos de vecinos de una comunidad en una finca de apartamentos en el Tolima para ver si se contrata a una persona que les lleve la contabilidad
Muestra Los Votos de 45 vecinos de una comunidad en una finca de apartamentos en el Tolima para ver si se contrata a una persona que les lleve la contabilidad.
Objetivos de estudio Los 45 vecinos de una comunidad en una finca de apartamentos en el Tolima
Variables Votos de los vecinos
Tipo de variable sgún su naturaleza Variable Cualitativa
Tipo de variable su escala de medición Nominal

TABLA No 8: Distribución de frecuencias para los votos de 45 vecinos de una comunidad en una finca de apartamentos en el Tolima para ver si se contrata a una persona que les lleve la contabilidad.

Código
Tabla_p9 <- data.frame("Votos" = c("Favor", "Se abstiene","Encontra"),
                       "ni" = c(25,5,15),
                       "hi"= round((c(25,5,15)/sum(c(25,5,15))), digits = 3)
                       )
kable(Tabla_p9) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
Votos ni hi
Favor 25 0.556
Se abstiene 5 0.111
Encontra 15 0.333

GRÁFICO No 14: Diagrama circular para los votos de 45 vecinos de una comunidad en una finca de apartamentos en el Tolima para ver si se contrata a una persona que les lleve la contabilidad

Código
Grafica_sectores_p9 <- pie(Tabla_p9$hi,
                           labels = paste((Tabla_p9$hi)*100, "%"),
                           col= 2:5,
                           main="Diagrama de sectores")

Punto 10

Ha medido el perímetro craneal a niños de edad comprendida entre los dos y tres años, obteniéndose los siguientes datos:

Código
Vector10 <- c(41,39.5,43.2,40.5,42.3,44.5,38.5,
             42.5,40.3,46.3,45.6,44.2,40.1,43.5,
             40.2,42.7,45,45.2,46.7,39.4,41,
             39,39.6,43,42.8,47.9,46.5,40.2)
Punto10 <- matrix(Vector10,nrow=4, ncol=7)

kable(Punto10) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
41.0 42.3 40.3 40.1 45.0 41.0 42.8
39.5 44.5 46.3 43.5 45.2 39.0 47.9
43.2 38.5 45.6 40.2 46.7 39.6 46.5
40.5 42.5 44.2 42.7 39.4 43.0 40.2

Se quiere realizar un estudio de estos datos, agrupándolos en intervalos de amplitud. Obténgase la tabla de frecuencias, el histograma, el polígono y la ojiva.

Código
caracteristicas_punto_10 <- data.frame("Caracteristicas" = caracteristicas,
                                      "Información"= c("Medición en centímetros del perímetro craneal a todos los niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices.",
                                                       "Medición en centímetros del perímetro craneal a 28 niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices.",
                                                       "Los 28 niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices.",
                                                       "Medición en centímetros del perímetro craneal",
                                                       "Variable Cuantitativa Continua",
                                                       "Razón"))

kable(caracteristicas_punto_10) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
Caracteristicas Información
Población Medición en centímetros del perímetro craneal a todos los niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices.
Muestra Medición en centímetros del perímetro craneal a 28 niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices.
Objetivos de estudio Los 28 niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices.
Variables Medición en centímetros del perímetro craneal
Tipo de variable sgún su naturaleza Variable Cuantitativa Continua
Tipo de variable su escala de medición Razón

Tabla N° 9: Distribución de frecuencias para 28 niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices, según su medición en centímetros del perímetro craneal.

Código
Distribución_p10 <- hist(Vector10, plot = FALSE)
Tabla_p10 <- table.freq(Distribución_p10)
kable(Tabla_p10) %>% 
  kable_styling(bootstrap_options = "striped",
                full_width = F,
                position = "center")
Lower Upper Main Frequency Percentage CF CPF
38 40 39 5 17.9 5 17.9
40 42 41 7 25.0 12 42.9
42 44 43 7 25.0 19 67.9
44 46 45 5 17.9 24 85.7
46 48 47 4 14.3 28 100.0

Gráfica N° 15: Histograma de frecuencias para 28 niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices, según su medición en centímetros del perímetro craneal.

Código
Grafica_histo_p10 <- hist(Vector10, 
                         xlab = "medida", 
                         ylab = "N° de niños",
                         main = "Histograma de frecuencias",
                         col = 1:8)

Gráfica N° 16: Polígono de frecuencias para 28 niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices, según su medición en centímetros del perímetro craneal.

Código
Grafica_lineas_p10 <- plot(x =Tabla_p10$Main,
                          y =Tabla_p10$Frequency,
                          type="b",
                          pch=20,
                          lty=1,
                          xlab = "meida", 
                          ylab = "N° de niños",
                          main = "Poligono de frecuencias") %>%
  lines(x =Tabla_p10$Main,
        y =Tabla_p10$Frequency) %>% 
  axis(side=1,Tabla_p10$Main,labels=TRUE)

Gráfica N° 17: Ojiva de frecuencias para 28 niños de edad comprendida entre los dos y tres años inscritos en la escuela Caritas Felices, según su medición en centímetros del perímetro craneal.

Código
Grafica_ojivas_p10 <- plot(x =Tabla_p10$Main,
                          y =Tabla_p10$CPF,
                          type="b",
                          pch=20,
                          lty=1,
                          xlab = "Medida", 
                          ylab = "N° de niños",
                          main = "Ojiva de frecuencias") %>%
  lines(x =Tabla_p10$Main,
        y =Tabla_p10$CPF) %>% 
  axis(side=1,Tabla_p10$Main,labels=TRUE)