Estadistica
Para Realizar Este trabajo de Matemática a modo de practica he usado
Rstudio Ya que es mi herramienta de trabajo diaria Como científico de
datos. Ademasen las imágenes Insertadas estarán en Color Azul los
valores respuestas.
Actividad 1:
- Cantidad de ganado vacuno en las provincias de la Mesopotamia
Argentina: Cuantitativa.
- Religión de los padres de familia de la comunidad educativa de una
escuela: Cualitativa.
- Ingresos de los trabajadores de la construcción: Cuantitativa.
- Cantidad de alumnos de las diferentes carreras de la Facultad de
Filosofía y Letras: Cuantitativa.
- Género femenino o masculino de los socios de un club:
Cualitativa.
- Estado civil de los habitantes de la ciudad de Rosario:
Cualitativa.
- Cantidad de películas nacionales estrenadas durante un año:
Cuantitativa.
- Color de cabello de los trabajadores de una empresa:
Cualitativa.
- Puntaje obtenido por los alumnos ingresantes a la carrera de
Medicina: Cuantitativa.
Actividad 2:
Ejemplos de variables cuantitativas: 1. Edad de los estudiantes de
una universidad. 2. Temperatura en grados Celsius registrada durante un
día.
Ejemplos de variables cualitativas: 1. Marcas de automóviles
preferidas por los consumidores. 2. Tipos de alimentos favoritos de un
grupo de personas.
Actividad 3:
Cantidad de hermanos: 0 hermanos (15), 1 hermano (18), 2 hermanos
(10), más de 2 hermanos (7).
Equipo de fútbol con el que simpatizan o son hinchas: Equipo:
Boca (35), Talleres (25), River (20), Otro (10), No sigue el fútbol
(10).
Precio promedio mensual del dólar: Año 2021 (167.875), Año 2022
(254.625), Año 2023 (446.714).
Consumo de energía eléctrica:
- Obtener información de las facturas de electricidad de los últimos
dos años. Por ejemplo, el consumo promedio mensual de energía eléctrica
en los últimos dos años podría ser: Año 1 (250 kWh), Año 2 (280
kWh).
Programa de televisión preferido entre las 20 hs y las 22 hs:
Programa A (20), Programa B (15), Programa C (10), Otro (5).
Marca de automóviles más vendidos en Argentina: Fiat Cronos
(4.183), Peugeot 208 (3.814), Toyota Hilux (2.957).
Precio promedio mensual de la soja en Argentina: ser: Año 1
($300), Año 2 ($320), Año 3 ($310).
Organizacion de Datos:

Tabla De Frecuencias: 
Actividad 4
En el hall de un aeropuerto internacional se entrevistó a los
turistas que partían para preguntarles cuántas veces antes de ésta
habían tomado vacaciones en el exterior. Las respuestas de una muestra
de 40 entrevistados fueron las siguientes:
2 0 1 2 1 0 2 0 2 0 2 0 2 1 2 2 0 0 2 2 1 3 0 1 0 2 1 0 0 2 0 0 0 1 2
3 0 3 2 1
- ¿Cuál es la variable considerada en esta situación?
Clasificarla.
- Respuesta: Variable Cuantitativa Discreta
- Realiza una tabla de frecuencias.
Vacaciones_en_Exterior
0 1 2 3
15 8 14 3
- ¿Qué fracción de los turistas salía al exterior por primera
vez?
Vacaciones_en_Exterior
0 1 2 3
37.5 20.0 35.0 7.5
La Proporcion de encuestados que sale al exterior por primera vez es
el 20.0% de encuestados
Actividad 5. La siguiente tabla de frecuencias corresponde a los
resultados obtenidos en una encuesta
realizada a los 180 trabajadores de una fábrica de baterías, en la
que se pretendía saber si los empleados eran fumadores o no

Actividad 6
En las últimas elecciones del centro vecinal del barrio Amanecer los
candidatos a presidente eran: Aníbal (A), Bernardo (B), Clara (C),
Esteban (E) y Lucía (L). Se realizó una encuesta a boca de urna a 50
personas obteniendo los siguientes resultados: A A B A B A B A B A A C B
C E L A B A A A A A B A E A B A A A B B A B A C B C L B A A B C A B A A
A
- ¿Cuál es la variable considerada en esta situación?
Clasificarla.
- Realiza una tabla de frecuencias.
Elecciones_Barrio_Amanecer
A B C E L
25 15 5 2 2
- ¿Quién será el presidente según esta encuesta? El presidente segun
esta encuesta Sera Abel con el 51% de los votos
porcentajes2 <- prop.table(tabla_frecuencias2) * 100
print(porcentajes2)
Elecciones_Barrio_Amanecer
A B C E L
51.020408 30.612245 10.204082 4.081633 4.081633
- El presidente segun esta encuesta Sera Aníbal con el 51% de los
votos
Actividad 7
Realiza una tabla de frecuencias para organizar los datos recopilados
en la actividad 3 para cada una de las dos variables elegidas
Actividad 8
. La siguiente tabla de frecuencias corresponde a los resultados de
una encuesta realizada a 40 personas sobre el medio de transporte que
utilizarán este año para sus vacaciones. Completa los datos
faltantes.

Gráficos estadísticos
Los gráficos estadísticos permiten una interpretación simple y rápida
de la información, y pueden conducir a extraer conclusiones sobre el
tema de estudio. Al comienzo de esta sección analizamos algunos
gráficos, publicados por el INDEC, que nos mostraban información
obtenida del censo realizado en 2010. A continuación, estudiaremos
algunos gráficos estadísticos que permiten representar gráficamente
variables cuantitativas y cualitativas. Para ello comenzaremos
resolviendo una actividad

- Gráfico o Diagrama de barras El diagrama de barras es utilizado para
representar gráficamente variables tanto cualitativas como
cuantitativas.
Para confeccionar un diagrama de barras se ubican en el eje
horizontal los diferentes valores de la variable (respetando un orden si
existiese) y en el eje vertical se ubican los valores de la frecuencia
absoluta, relativa o porcentual respetando una escala conveniente. Luego
se trazan las barras para cada valor de la variable. Éstas deben tener
el mismo ancho y su altura la determina la frecuencia elegida en el eje
vertical.
Actividad 9
Considera nuevamente las situaciones propuestas en las actividades 4
y 5 y realiza, para cada una de ellas, un diagrama de barras.
- Respuesta de Actividad 9 diagrama de barras de la actividad 4

- Respuesta de Actividad 9 diagrama de barras de la actividad 5

Actividad 10
La familia Gonzalez es dueña del supermercado del pueblo por varias
generaciones. Al finalizar cada mes, realiza un análisis de las ventas
realizadas por rubro. La siguiente tabla corresponde a las ventas
realizadas el mes pasado.

Realiza un gráfico de barras.
Si las ventas de ese mes sumaron aproximadamente $25 000, ¿cuánto
dinero facturaron por artículos de limpieza?
Respuesta a:

Respuesta b:
Si las ventas de ese mes sumaron aproximadamente $25 000
La fórmula para calcular el porcentaje de un número es:
\[ Porcentaje = 25,000 \times 0.15 = 3,750
\]
Entonces, el 15% de 25,000 es igual a 3,750.
Gráfico circular
Este tipo de gráfico resulta útil cuando se pretende comparar datos
entre sí y es posible utilizarlo para todo tipo de variables. Mediante
los distintos sectores se representa la proporción entre los valores de
la variable. Es conveniente que el número de sectores sea pequeño y sus
áreas estén bien diferenciadas para interpretar mejor la información que
representa.
Para confeccionar un gráfico circular, se traza un círculo y uno de
sus radios. A partir de dicho radio, se traza un ángulo cuya amplitud se
obtiene con la fórmula 100 fp ⋅360º , donde fp es la frecuencia
porcentual del primer valor de la variable. Así se obtiene el primer
sector, y repitiendo este procedimiento para los restantes valores de
las variables, se divide al círculo original en tantos sectores como
valores posee la variable que se desea representar.
Veamos un ejemplo. Si consideramos la información presente en la
siguiente tabla, debemos realizar la siguiente construcción

Actividad 11
Une con flechas cada gráfico circular con la información que
representa 
Actividad 12
En la fábrica Rielescor planean modificar su playa de estacionamiento
para empleados con la intención de mejorar la circulación en el horario
de salida. Para ello comenzaron con una encuesta a todos los empleados
sobre el medio de transporte que utilizan para concurrir al trabajo. Los
resultados se muestran en el gráfico circular 
- ¿Cuál es el porcentaje de empleados que va en bicicleta?
- el porcentaje de empleado que va en bicicleta es del 12%
- ¿Cuál es el medio de transporte más utilizado? ¿y el menos
utilizado?
- El medio de transporte mas utilizado es el Auto y el menos utilizado
es el colectivo
- ¿Qué porcentaje de empleados usa moto o bicicleta? -El porcentaje de
empleados que usa moto o bicicleta es del 37%
- ¿Qué porcentaje no va en auto?
- el porcentaje de empleados que no va en auto es del 60%
- Si hay un total de 200 empleados, ¿cuántos utilizan cada medio de
transporte
3% de 200: \(200 \times 0.03 = 6\)
Empleados usa colectivo
25% de 200: \(200 \times 0.25 = 50\)
Empleados usa Moto
12% de 200: \(200 \times 0.12 = 24\)
Empleados usa Bicicleta
60% de 200: \(200 \times 0.60 =
120\) Empleados usa Auto
Actividad 13
Con el objetivo de decidir sobre el color del envase de un nuevo
producto, se hizo una encuesta a 150 personas. A cada una se le pidió
que eligiera el color preferido entre azul, verde, rojo y blanco. Los
resultados fueron:
Confecciona un gráfico circular y un
diagrama de barras que muestre los resultados de la encuesta.
Color <- c("green", "blue", "red", "white")
Preferencias <- c(30, 15, 75, 30)
# Crear un marco de datos con los datos
data_barras <- data.frame(Color = Color, Preferencias = Preferencias)
# Calcular los porcentajes
total_preferencias <- sum(Preferencias)
porcentajes <- (Preferencias / total_preferencias) * 100
# Crear el gráfico de barras con porcentajes y borde negro
grafico_barras <- ggplot(data = data_barras, aes(x = Color, y = Preferencias, fill = Color)) +
geom_bar(stat = "identity", color = "black") + # Barras con borde negro
geom_text(aes(label = paste0(porcentajes, "%")), position = position_stack(vjust = 0.5)) + # Agregar porcentajes
labs(title = "Gráfico de Barras - Preferencias de Color", x = "Color", y = "Preferencias") +
scale_fill_manual(values = Color) + theme_minimal()
# Crear el gráfico circular con borde negro
grafico_circular <- ggplot(data = data_barras, aes(x = "", y = Preferencias, fill = Color)) +
geom_bar(stat = "identity", width = 1, color = "black") + # Barras con borde negro
geom_bar(stat = "identity", width = 1) + # Barras rellenas
coord_polar("y", start = 0) +
geom_text(aes(label = paste0(porcentajes, "%")), position = position_stack(vjust = 0.5)) +
scale_fill_manual(values = Color) +
labs(title = "Gráfico Circular - Preferencias de Color", fill = "Color") +
theme_minimal()
# Mostrar los gráficos
print(grafico_circular)

print(grafico_barras)

Actividad 14
A la salida de un cine se realizó una encuesta a 40 personas para
conocer el género que prefería. Las respuestas fueron las
siguientes:
Arma una tabla de frecuencias y realiza
un gráfico circular que represente esta información:
# Vector con los géneros preferidos
genero_preferido <- c(
"Acción", "Romántica", "Acción", "Acción", "Romántica",
"Comedia", "Comedia", "Comedia", "Acción", "Terror",
"Terror", "Romántica", "Comedia", "Acción", "Romántica",
"Acción", "Acción", "Acción", "Acción", "Acción",
"Romántica", "Comedia", "Comedia", "Comedia", "Comedia",
"Comedia", "Acción", "Comedia", "Romántica", "Comedia",
"Romántica", "Comedia", "Acción", "Terror", "Acción", "Terror", "Acción"
)
# Crear la tabla de frecuencias
tabla_frecuencia <- table(genero_preferido)
# Convertir la tabla de frecuencias a un marco de datos
data_tabla <- as.data.frame(tabla_frecuencia)
colnames(data_tabla) <- c("Genero", "Frecuencia")
# Calcular los porcentajes
total_frecuencia <- sum(data_tabla$Frecuencia)
data_tabla$Porcentaje <- (data_tabla$Frecuencia / total_frecuencia) * 100
# Crear el gráfico de torta con porcentajes y borde negro
grafico_torta <- ggplot(data_tabla, aes(x = "", y = Frecuencia, fill = Genero)) +
geom_bar(stat = "identity", color = "black") +
coord_polar("y") +
labs(title = "Gráfico de Torta - Géneros Preferidos") +
theme_void() +
scale_fill_brewer(palette = "Set3") +
geom_text(aes(label = paste0(round(Porcentaje, 1), "%")), position = position_stack(vjust = 0.5))
# Mostrar el gráfico de torta
print(grafico_torta)

NA
NA
- Pictograma Los pictogramas son gráficos estadísticos en los que las
frecuencias se representan por medio de dibujos relacionados con la
variable de estudio
Para confeccionar un pictograma se dibujan dos ejes perpendiculares y
en uno de ellos, se ubican los valores de la variable. Luego, se debe
elegir una imagen que represente la variable de estudio y se debe hallar
el máximo común divisor entre las frecuencias de todos los valores de la
variable, para que cada imagen represente esa cantidad. Por último, se
alinean sobre el valor de la variable tantas imágenes como le
correspondan a su frecuencia.
Por ejemplo, si consideramos la situación presente en la actividad 13
y calculamos sus frecuencias absolutas, obtenemos los siguientes
resultados:

Viendo los valores de las frecuencias, su mcd es 4, por lo que al
elegir una imagen conveniente, cada una de ellas representará 4 personas
encuestadas. Debido a esto, para el valor de la variable comedia
deberemos usar 3 imágenes para representar las 12 personas
encuestadas
## Actividad 15
El siguiente pictograma representa la cantidad de viajes realizados
por una empresa de camiones en el primer cuatrimestre de este año:
Completa la siguiente tabla:

MEDICIÓN DE DATOS:
La interpretación de los datos de una población se facilita cuando se
realiza y analiza de un gráfico estadístico. Pero cuando se trata de una
población muy grande, se observa además que los datos tienden a
distribuirse alrededor de ciertos valores. Estos valores se llaman
parámetros de posición central y permiten resumir o sintetizar los datos
correspondientes a toda una población en un solo número que representa
al conjunto total. Los parámetros más comunes son la media, la moda y la
mediana, y pueden obtenerse cuando la variable de estudio es
cuantitativa. Para las variables cualitativas solo se calcula su moda.
Para obtener sus definiciones comenzaremos resolviendo la siguiente
actividad.
Mario se entrena a diario para participar en una maratón. Esta semana
realizó los siguientes recorridos: Lunes Martes Miércoles Jueves Viernes
Sábado Domingo 9 km 7 km 15 km 15 km 13 km 11 km 3 km
- Calcula la distancia promedio que recorrió esta semana, para lo cual
se deben sumar todas las distancias recorridas y dividir dicha suma por
7.
Kilometros<-c(9,7,15,15,13,11,3)
mean(Kilometros)
[1] 10.42857
- ¿Cuál fue la distancia que más se repitió en esta semana?
- La distancia que mas se repitio fue de 15km
- Ordena las distancias de menor a mayor e identificar la distancia
que se encuentra en la ubicación central.
# Ordenar los números de menor a mayor
Valores_ordenados <- sort(Kilometros)
# Calcular el valor central (mediana)
valor_central <- median(Valores_ordenados)
print(Valores_ordenados)
[1] 3 7 9 11 13 15 15
print(valor_central)
[1] 11
Actividad 16
Halla la media, la moda y la mediana de cada una de las siguientes
muestras y realizar un análisis del significado de los valores
obtenidos.
- Cantidad de horas extras mensuales trabajadas por 9 obreros. 40 25
36 12 40 25 40 32 38
- La moda de estos Datos es 25 y 40 por lo que es bimodal, A
continuación, se realizará el cálculo del promedio y la mediana
horas_Extra9_obreros <- c(40, 25, 36, 12, 40, 25, 40, 32, 38)
Promedio<-mean(horas_Extra9_obreros)
Mediana<-median(horas_Extra9_obreros)
print(Promedio)
[1] 32
print(Mediana)
[1] 36
- Años de antigüedad en el trabajo de 8 profesores. 7 2 20 12 9 3 18
6
- Estos Valores no tiene un valor repetido, A continuación, se
realizará el cálculo del promedio y la mediana
años_de_antiguedad_8_Profesionales <- c(7, 2, 20, 12, 9, 3, 18, 6)
Promedio<- mean(años_de_antiguedad_8_Profesionales)
Mediana<-median(años_de_antiguedad_8_Profesionales)
print(Promedio)
[1] 9.625
print(Mediana)
[1] 8
- Precio, en pesos, de un chicle en 6 kioscos. 0,42 0,47 0,44 0,49
0,47 0,42 -La moda de esos valores es 0,42. A continuación, se realizará
el cálculo del promedio y la mediana
Precio <- c(0.42, 0.47, 0.44, 0.49, 0.47, 0.42)
Promedio<-mean(Precio)
Mediana<-median(Precio)
print(Promedio)
[1] 0.4516667
print(Mediana)
[1] 0.455
Actividad 17
En la siguiente tabla se detalla la cantidad de colectivos que toman
los empleados de una fábrica para asistir a su trabajo. Halla la moda de
la cantidad de colectivos que toman los trabajadores e interpretar el
significado de dicho número.
Vemos que el valor 0 se repite con mayor
frecuencia (15 veces), seguido por el valor 1 (10 veces) y luego el
valor 2 (5 veces). Por lo tanto, la moda en este caso es 0. Esto
significa que la cantidad de trabajadores que no toman ningún colectivo
es el valor más común en esta fábrica. Es decir, hay más trabajadores
que no toman colectivos que los que toman 1 o 2 colectivos para ir al
trabajo.
Actividad 18
En un instituto de música enseñan bajo y batería. Observa los
gráficos y luego responde las preguntas.

- ¿Cuántos alumnos estudian batería?
- 20 Alumnos Estudian Bateria.
- ¿Cuántos de los alumnos que estudian bateria tienen como mínimo 16
años?
- 11 Alumnos que estudian Bateria tiene al menos 16 años
- ¿Cuál es el porcentaje de los alumnos que estudian batería que
tienen entre 14 y 16 años?
- El porcentaje de alumnos que estudian bateria y tiene entre 14 y 16
años es del 55% del total
- Si 6 alumnos que tienen 15 años representan el 10% de los alumnos
que estudian bajo, ¿cuántos alumnos de 17 años concurren al instituto a
aprender este instrumento?
- 36 alumnos de 17 vienen aprender Bajo.
¿Cuál es el promedio de edades de los estudiantes de bajo?
¿Coincide el promedio con la moda?
Calcular el promedio de edades:
\[
\begin{align*}
\text{Promedio} &= (18 \times 0.25) + (15 \times 0.10) + (16 \times
0.05) + (17 \times 0.60)
\end{align*}
\] c. Comparar el promedio con la moda:
\[
\begin{align*}
\text{Promedio} &= 16.95 \\
\text{Moda} &= 17 \\
\\
\text{Promedio es igual a Moda} &: \text{ } \text{Promedio} =
\text{Moda}
\end{align*}
\]
La moda es el valor más común en un conjunto de datos. Según el
gráfico de torta, la edad más común es 17 años (60% de los alumnos). El
promedio calculado anteriormente es cercano a 17 años. Por lo tanto, el
promedio y la moda no coinciden exactamente, pero son bastante
similares.
Actividad 19
Para realizar un análisis sobre las ausencias de sus estudiantes, un
CENMA observó un grupo de 20 alumnos durante un mes y registró los
siguientes valores.
a. Ordena los datos en una tabla de
frecuencias. b. Realiza un gráfico circular. c. Indica el número de
ausencias más frecuentes ese mes. d. Halla el promedio y la mediana
ausencias <- c(1, 3, 2, 5, 1, 0, 0, 1, 1, 2, 2, 1, 2, 2, 2, 4)
Frecuencia_Ausencia <-table(ausencias)
porcentajes_Ausencias <- prop.table(Frecuencia_Ausencia) * 100
print(Frecuencia_Ausencia)
ausencias
0 1 2 3 4 5
2 5 6 1 1 1
print(porcentajes_Ausencias)
ausencias
0 1 2 3 4 5
12.50 31.25 37.50 6.25 6.25 6.25
# Etiquetas con porcentajes formateados
etiquetas_con_porcentaje <- paste0(names(Frecuencia_Ausencia), "\n", round(porcentajes_Ausencias, 1), "%")
# Crear el gráfico de torta con etiquetas de porcentajes
pie(porcentajes_Ausencias, labels = etiquetas_con_porcentaje, main = "Gráfico de Torta - Ausencias")

El numero de Usencias mas frecuente de ese mes es de 2
Ausencias.
Acontinuacion se realizara el calculo del promedio y la
mediana.
Promedio<-mean(ausencias)
Mediana<-median(ausencias)
print(Promedio)
[1] 1.8125
print(Mediana)
[1] 2
Actividad 20
Una casa de deportes vendió, durante los tres últimos años, 4500
pares de zapatillas para adulto. La siguiente tabla muestra la
distribución de las ventas según el número de calzado
El administrador decidió comprar para
este año 1200 pares, de los cuales 700 son número 38. ¿Es acertada la
decisión?
# Valores de ventas históricas
ventas_historicas <- c(10, 60, 200, 910, 1720, 1170, 350, 70, 10)
numero_calzado <- 35:43
# Calcular el total de ventas históricas
total_ventas_historicas <- sum(ventas_historicas)
# Calcular la proporción de ventas históricas para cada número de calzado
proporcion_ventas_historicas <- ventas_historicas / total_ventas_historicas
# Crear un marco de datos con la distribución de ventas históricas
data_ventas_historicas <- data.frame(Numero_Calzado = numero_calzado, Proporcion = proporcion_ventas_historicas)
# Cantidad de pares de zapatillas a comprar este año
total_compras_planificadas <- 1200
compras_numero_38 <- 700
# Calcular la proporción de compras de número 38 respecto al total de compras
proporcion_compras_numero_38 <- compras_numero_38 / total_compras_planificadas
# Calcular la proporción de compras para otros números de calzado
proporcion_compras_otros_numeros <- 1 - proporcion_compras_numero_38
# Crear un marco de datos con la distribución de compras planificadas
data_compras_planificadas <- data.frame(
Numero_Calzado = c("38", "Otros"),
Proporcion = c(proporcion_compras_numero_38, proporcion_compras_otros_numeros)
)
print(data_ventas_historicas)
NA
print(data_compras_planificadas)
Comparando las proporciones de ventas históricas y compras
planificadas, podemos ver lo siguiente:
Para las ventas históricas:
La proporción de ventas del número 38 es aproximadamente 0.202
(20.2%). Para las compras planificadas:
La proporción de compras del número 38 es 0.583 (58.3%). La
proporción de ventas históricas del número 38 es significativamente más
baja que la proporción de compras planificadas. Esto podría indicar que
se están comprando más zapatillas número 38 de lo que se ha vendido
históricamente en comparación con otros números.
Dado que la proporción de compras planificadas para el número 38 es
mucho mayor que la proporción de ventas históricas, podría haber un
exceso en la cantidad de zapatillas número 38 que se está planeando
comprar. Sería recomendable revisar las cifras y considerar ajustar las
compras planificadas para asegurarse de que estén alineadas con las
tendencias históricas de ventas.
Actividad 21
Una empresa textil compra rollos de tela que presentan cierto número
de defectos por rollo. En su última operación, la empresa compró 100
rollos de tela con las cantidades de defectos por rollo que se muestran
en la tabla. El gerente de compras analiza la partida y rechaza la
compra si el promedio de defectos por rollo es mayor a 2. ¿Rechazará
esta compra?

# Definir los datos
defectos <- c(0, 1, 2, 3, 4, 5)
cantidades <- c(15, 18, 25, 15, 12, 15)
total_rollos <- sum(cantidades)
# Calcular el promedio de defectos por rollo
promedio_defectos <- sum(defectos * cantidades) / total_rollos
# Umbral para el rechazo
umbral_rechazo <- 2
# Ver si la compra será rechazada o no
if (promedio_defectos > umbral_rechazo) {
decision <- "Rechazada"
} else {
decision <- "Aceptada"
}
# Imprimir resultados
cat("Promedio de defectos por rollo:", promedio_defectos, "\n")
Promedio de defectos por rollo: 2.36
cat("Decisión:", decision)
Decisión: Rechazada
Actividad 22
Una empresa de transporte interurbano quiere informar a sus usuarios
el tiempo de viaje entre dos ciudades que ofrece el servicio. Para ello,
eligieron 55 de sus unidades, evaluaron cuánto tardaron en llegar a
destino y volcaron los registros en una tabla como la siguiente. ¿Cuál
es el tiempo promedio de viaje que la empresa usará para informar a sus
usuarios

# Definir los datos
tiempo <- c(42, 45, 46, 47, 48, 50, 52)
frecuencia <- c(6, 7, 8, 8, 10, 8, 8)
total_unidades <- sum(frecuencia)
# Calcular el tiempo promedio de viaje
tiempo_promedio <- sum(tiempo * frecuencia) / total_unidades
# Imprimir el tiempo promedio de viaje
cat("El tiempo promedio de viaje es:", tiempo_promedio, "minutos")
El tiempo promedio de viaje es: 47.4 minutos
Actividad 23
Se arrojó un dado una cierta cantidad de veces y los resultados se
registraron en el siguiente gráfico. Observa y luego responde:
a. ¿Cuántas veces se arrojó el dado? - El
dado se arrojo 35 veces.
- ¿Qué número salió más veces? ¿y menos?
- El numero dos salio mas veces(8) y el tres el que menos (4).
- ¿Qué número salió las mismas veces que su valor?
- ¿Cuántas veces salió un número menor que 5? ¿Y cuántas un número
mayor que 3?
- Salio 22 veces un numero menor a 5 y 18 veces mayor al numero
3.
- Calcula el promedio.
- Encuentra la moda y la mediana
# Definir los datos
resultados <- c(rep(1, 5), rep(2, 8), rep(3, 4), rep(4, 5), rep(5, 7), rep(6, 6))
# Calcular el promedio
promedio <- mean(resultados)
# Calcular la mediana
mediana <- median(resultados)
# Calcular la moda
moda <- as.numeric(names(sort(table(resultados), decreasing = TRUE)[1]))
# Imprimir los resultados
cat("Promedio:", promedio, "\n")
Promedio: 3.542857
cat("Mediana:", mediana, "\n")
Mediana: 4
cat("Moda:", moda, "\n")
Moda: 2
OTRA AGRUPACIÓN DE DATOS:
Cuando una muestra posee numerosos o variados datos cuantitativos es
posible agruparlos para facilitar su manipulación. Esos agrupamientos,
llamados intervalos de clase, deben incluir a todos los individuos de la
muestra y deben tener la misma extensión. La cantidad de agrupamientos
que se toman no debe ser excesiva para que su manipulación no sea
dificultosa, ni escasa para que no se pierda precisión. Para comprender
esta nueva organización de los datos, realizaremos la siguiente
actividad
En la tabla anterior se agruparon las
estaturas imponiendo la condición de ser mayor o igual a un número y
menor a otro. A dicha agrupación se la llama intervalo de clase.
Un intervalo de clase, representado por [m ; n), agrupa todos los
datos comprendidos ente m y n, incluyendo a m pero no a n. La amplitud
de un intervalo se obtiene con la diferencia m - n
En el caso de agrupar los datos en intervalos de clase, la tabla de
frecuencias es muy similar a las usadas previamente, solo difiere la
primer columna, en la cual, en lugar de enumerar todos los valores
posibles de la variable aparecen los intervalos de clase.
Para armar los intervalos de clase, se debe considerar el menor y el
mayor dato, y establecer primero el número de intervalos que se desean
obtener teniendo en cuenta que: todos los intervalos deben tener la
misma amplitud. cada dato debe pertenecer a un solo intervalo
Las frecuencias absolutas, relativas y porcentuales se calculan de la
misma manera que definimos anteriormente y su total, es la suma de todos
los valores de esa columna. Teniendo en cuenta esto, completa la
siguiente tabla de frecuencias:
La amplitud de todos los intervalos
usados en la tabla anterior es 0,05. Para el cálculo de los parámetros
de posición es necesario agregar a la tabla de frecuencias dos columnas
más, una para la llamada frecuencia acumulada y otra para el punto medio
de cada intervalo
Se llama frecuencia acumulada, representada por F, a la cantidad de
veces que se repite un valor de la variable o cualquier otro que sea
menor y se obtiene sumando la frecuencia absoluta de ese intervalo con
la de frecuencia absoluta de todos los intervalos anteriores.
El punto medio de un intervalo es el valor central del mismo, se
representa por c y se obtiene calculando el promedio entre sus extremos.
Para un intervalo [m ; n), su punto medio es
\[ c = \frac{m + n}{2} \]
Actividad 24
Un médico está investigando una enfermedad cardíaca y su relación con
el colesterol. Para ello registró las mediciones de colesterol (en mg
por dl de sangre) de los análisis clínicos de 30 de sus pacientes. Los
datos fueron los siguientes:
1 | 185 | 225 | 198 | 214 | 195 | 237 |
2 | 190 | 230 | 215 | 215 | 197 | 215 |
3 | 187 | 238 | 195 | 213 | 205 | 203 |
4 | 210 | 234 | 254 | 186 | 203 | 225 |
5 | 233 | 224 | 235 | 216 | 240 | 239 |
- Completa la siguiente tabla.

- ¿Cuántos pacientes tienen una medición de colesterol por debajo de
220?
En la tabla de frecuencias, observamos que la frecuencia acumulada
para el intervalo [200 ; 220) es 13. Por lo tanto, hay 13 pacientes
cuyas mediciones de colesterol están por debajo de 220 mg/dl.
- Si se consideran valores normales aquellos que están entre 180 y
200, ¿qué porcentaje de los pacientes está fuera de esos
parámetros?
Basado en la tabla de frecuencias corregida, la frecuencia acumulada
para el intervalo [180 ; 200) es 4. Dado que el total de pacientes es 30
(suma de todas las frecuencias), el número de pacientes fuera del rango
de valores normales es 30 - 4 = 26.
El porcentaje de pacientes fuera del rango de valores normales
es:
= 100%
%
%
En resumen, aproximadamente el 86.67% de los pacientes tienen
mediciones de colesterol fuera del rango considerado como valores
normales (180-200 mg/dl).
Actividad 25
Los siguientes datos corresponden a las temperaturas máximas durante
el mes de junio.

Confecciona una tabla de frecuencias y para ello, se sugiere
considerar intervalos a partir de 7ºC con una amplitud de 3ºC.
| [7, 10) |
7 |
| [10, 13) |
6 |
| [13, 16) |
7 |
| [16, 19) |
5 |
| [19, 22) |
3 |
Actividad 26
. En una empresa, se recabó información sobre la antigüedad que
tenían sus empleados en el trabajo. Los valores obtenidos en una muestra
de 30 empleados fueron los siguientes:
5 4 11 3 16 0 3 9 21 13 10 2 6 6 8 4 15 2 25 7 14 3 8 15 9 15 10 19
24 4
- Completa la siguiente tabla

- Indicar cuál es el porcentaje de empleados que tienen una antigüedad
inferior a 14 años.
Frecuencia de [0, 7): 6 empleados Frecuencia de [7, 14): 10
empleados
Total de empleados con antigüedad inferior a 14 años: 6 + 10 = 16
empleados.
Porcentaje de empleados con antigüedad inferior a 14 años: \[ \frac{16}{30} \times 100 = 53.33\% \]
El 53.33% de los empleados tienen una antigüedad inferior a 14
años.
GRAFICOS ESTADISTICOS:
Para las variables cuantitativas que se agrupan sus valores en
intervalos de clase, también se pueden representar gráficamente usando
gráficos estadísticos. A continuación, estudiaremos nuevamente los
gráficos circulares y definiremos dos tipos de gráficos nuevos: el
histograma y el polígono de frecuencia. 1. Histograma Cuando la variable
en estudio está agrupada en intervalos de clase un gráfico apropiado es
un histograma, el cual consiste en una serie de rectángulos
consecutivos.
Para confeccionar un histograma se trazan dos ejes perpendiculares y
luego se trazan rectángulos consecutivos, cuya base en el eje
horizontal, está determinada por los intervalos de clase, y su altura,
en el eje vertical, por la frecuencia absoluta o relativa
correspondiente a ese intervalo.
Si consideramos nuevamente la actividad inicial, en la que se
estudiaron las estaturas de los jugadores de básquet, se podría
representar por medio de un histograma de la siguiente manera:

POLIGONO DE FRECUENCIAS:
El polígono de frecuencia se obtiene a partir del histograma, uniendo
los puntos medios de los lados opuestos a las bases de cada rectángulo,
incluyendo el anterior al primero y el posterior al último. Considerando
nuevamente el ejemplo inicial, su polígono de frecuencias es:

GRAFICO CIRCULAR:
El gráfico circular, como mencionamos anteriormente, permite
visualizar claramente la proporción que ocupa cada intervalo respecto a
los restantes y su construcción se realiza de la misma manera que
aprendimos en la primera sección. El gráfico circular correspondiente a
las estaturas de los jugadores de básquet será el siguiente:
## Actividad 27
El histograma muestra la distribución de los sueldos de los empleados
de una empresa. Observa y luego resuelve:

- ¿Cuántos empleados tiene la empresa?
- La emepresa Tiene un Total de 40 Empleados
- ¿Cuántos ganan menos de $3500? ¿Y más de $4000?
- 17 Empleados Ganan Menos de $3500 y 16 Empleados mas de $4000
- Trazar sobre el histograma el poligono de frecuencias.

- Completa la siguiente tabla.

- Realiza un gráfico circular
# Vector de porcentajes
porcentajes <- c(22, 20, 17, 15, 25)
# Etiquetas para cada porcentaje
etiquetas <- c("[2.500;3.000)", "[3.000;3.500)", "[3.500;4.000)", "[4.000;4.500)", "[4.500;5.000]")
# Crear las etiquetas con porcentajes
etiquetas_con_porcentajes <- paste(etiquetas, "(", porcentajes, "%)", sep = " ")
# Crear el gráfico circular
pie(porcentajes, labels = etiquetas_con_porcentajes, main = "Gráfico Circular De Sueldos")

Actividad 28
Realizar un histograma y un polígono de frecuencias para representar
cada una de las situaciones estudiadas en las actividades 1, 2 y 3 de
esta sección.
# Crear un gráfico circular (gráfico de pastel)
# Crear un gráfico circular (gráfico de pastel)
porcentajes <- c(13.33, 30.00, 26.67, 30.00) # Valores en porcentaje
nombres_intervalos <- c("[180 ; 200)", "[200 ; 220)", "[220 ; 240)", "[240 ; 260)")
pie_data <- data.frame(intervalos = nombres_intervalos, porcentaje = porcentajes)
pie_plot <- ggplot(pie_data, aes(x = "", y = porcentaje, fill = intervalos)) +
geom_bar(stat = "identity") +
coord_polar("y", start = 0) +
labs(title = "Gráfico Circular de Frecuencias") +
theme_void()
# Agregar porcentajes como etiquetas en el gráfico circular
labels <- paste(nombres_intervalos, "\n", porcentajes, "%")
pie_plot <- pie_plot + geom_text(aes(label = labels), position = position_stack(vjust = 0.5))
print(pie_plot)

# Crear un gráfico de barras
barras_data <- data.frame(intervalos = nombres_intervalos, frecuencia = c(4, 9, 8, 9))
bar_plot <- ggplot(barras_data, aes(x = intervalos, y = frecuencia, fill = intervalos)) +
geom_bar(stat = "identity") +
labs(title = "Gráfico de Barras de Frecuencias", x = "Intervalos", y = "Frecuencia") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))
print(bar_plot)

# Datos de temperaturas máximas
temperaturas <- c(7.3, 12, 14, 16, 16.3, 9.3,
16.4, 14.7, 10, 8, 9, 7.4,
10.4, 21, 13.7, 15, 8, 15.7,
12, 12.4, 12.5, 8.6, 7, 10.1,
18, 15, 14.5, 8.3, 10, 7)
# Crear la tabla de frecuencias
frecuencia_temperaturas <- table(cut(temperaturas, seq(7, 25, by = 3), right = FALSE))
# Crear el gráfico circular
etiquetas <- paste(names(frecuencia_temperaturas), " (", frecuencia_temperaturas, ")", sep = "")
pie(frecuencia_temperaturas, labels = etiquetas, main = "Gráfico Circular - Temperaturas Máximas")

# Calcular el punto medio de cada intervalo
puntos_medios <- seq(8, 23, by = 3)
# Crear el polígono de frecuencias
plot(puntos_medios, frecuencia_temperaturas, type = "n", main = "Polígono de Frecuencias - Temperaturas Máximas",
xlab = "Temperatura Máxima (ºC)", ylab = "Frecuencia", ylim = c(0, max(frecuencia_temperaturas) + 2))
polygon(c(7, puntos_medios, 25), c(0, frecuencia_temperaturas, 0), col = "lightblue")
lines(puntos_medios, frecuencia_temperaturas, col = "blue", lwd = 2)

# Crear el histograma
hist(temperaturas, breaks = seq(7, 25, by = 3), freq = FALSE,
main = "Histograma - Temperaturas Máximas", xlab = "Temperatura Máxima (ºC)", ylab = "Densidad", col = "lightgreen")
lines(density(temperaturas), col = "blue", lwd = 2)

NA
NA
MEDIDAS PARA DATOS AGRUPADOS: Cuando los datos
aparecen en las tablas de frecuencias agrupados en intervalos de clase,
también es posible calcular sus parámetros de posición. Si bien éstos se
obtienen de una manera diferente, su interpretación es la misma que
definimos anteriormente.
La media aritmética o promedio se obtiene dividiendo por el total de
observaciones a la suma de los productos de los puntos medios con las
frecuencias absolutas de cada intervalo
El intervalo que contiene a la mediana es el que tiene su frecuencia
acumulada igual o mayor a la mitad de las observaciones. La mediana será
el punto medio de dicho intervalo
La moda se aproxima como el punto medio del intervalo de mayor
frecuencia absoluta.
Veamos cómo se calculan la media, la moda y la mediana a partir de un
ejemplo. La siguiente tabla de frecuencias muestra la cantidad de dinero
que invierte una familia en abono de telefonía celular para todos sus
integrantes. Los datos se obtuvieron de una encuesta realizada a 100
familias.
Que Me = 700 significa que la mitad de
las familias encuestadas destinan menos de $700 al pago de abono en
telefonía celular y que la otra mitad, gasta más de $700 en ese
servicio. Para la interpretación de la media, podemos decir que las
familias encuestadas invierten aproximadamente $718 en promedio para el
servicio de telefonía celular. Por último, que Mo = 500 significa que
ese monto es, aproximadamente, el que más veces se repite, por lo que es
la cantidad de dinero que más familias destinan al pago del servicio de
telefonía.
Actividad 29
La siguiente tabla muestra los datos obtenidos del peso en kg de 400
personas.
- Completa.

Promedio (Media):
Para calcular el promedio, necesitamos utilizar el producto de la
frecuencia y el punto medio (\(c \cdot
f\)) para cada intervalo, y luego sumar todos estos productos y
dividir entre el total de la frecuencia total.
\[
\text{Promedio} = \frac{\sum (c \cdot f)}{\text{Total de la frecuencia}}
\]
En este caso, usando los valores que proporcionaste en la tabla, el
cálculo sería:
\[
\text{Promedio} = \frac{2107 + 2907 + 4940 + 5256 + 8910 + 4450}{400}
\approx 68.825
\]
Moda:
La moda es el valor o intervalo que más frecuentemente se repite. En
este caso, el intervalo con la mayor frecuencia es [77 ; 85), con una
frecuencia de 108. Por lo tanto, la moda es el intervalo [77 ; 85).
Mediana:
La mediana es el valor que se encuentra en el medio cuando los datos
se ordenan de menor a mayor. En este caso, como tenemos intervalos,
primero necesitamos encontrar el intervalo que contiene la mediana.
Para encontrar el intervalo mediano, calculamos la frecuencia
acumulada y encontramos el intervalo donde la frecuencia acumulada es
igual o superior a la mitad del total de frecuencias. En este caso, el
intervalo mediano es [69 ; 77).
Luego, usamos la fórmula de la mediana para intervalos:
\[
\text{Mediana} = L + \frac{\frac{n}{2} - F}{f} \cdot w
\]
Donde:
\(L\) es el límite inferior del
intervalo mediano (69 en este caso) \(n\) es el total de frecuencias (400) \(F\) es la frecuencia acumulada del
intervalo anterior (170 en este caso) \(f\) es la frecuencia del intervalo mediano
(72 en este caso) \(w\) es el ancho del
intervalo (8 en este caso)
Sustituyendo estos valores en la fórmula:
\[
\text{Mediana} = 69 + \frac{\frac{400}{2} - 170}{72} \cdot 8 \approx
76.5
\]
Por lo tanto, el promedio es aproximadamente 68.825, la moda es el
intervalo [77 ; 85) y la mediana es aproximadamente 76.5.
Actividad 30
Los siguientes datos son las velocidades, en km/h, que registró el
radar policial de 40 automóviles que circulaban frente un puesto de
control en una ruta nacional.

Organiza los datos en una tabla de frecuencias con intervalos de
20 km/h de ancho.
Traza un histograma.
Calcula la velocidad promedio, la moda y la mediana.
Escribe una interpretación del significado de los parámetros
calculados.
Organizar los datos en una tabla de frecuencias con intervalos de
20 km/h de ancho:
Intervalo Frecuencia [50 ; 70) 4 [70 ; 90) 8 [90 ; 110) 10 [110 ;
130) 10 [130 ; 150) 8
- Trazar un histograma:
# Datos de velocidades
velocidades <- c(45, 115, 100, 95, 70, 110, 80, 100,
85, 130, 105, 120, 65, 105, 90, 60,
105, 100, 90, 75, 115, 55, 110, 50,
65, 135, 115, 70, 80, 95, 100, 95,
95, 100, 85, 100, 90, 105, 80, 120)
# Crear un histograma
hist(velocidades, breaks = seq(45, 155, by = 20), col = "skyblue",
main = "Histograma de Velocidades", xlab = "Velocidad (km/h)", ylab = "Frecuencia")

- Calcular la velocidad promedio, la moda y la mediana:
# Calcular el promedio
promedio <- mean(velocidades)
# Calcular la moda
moda <- as.numeric(names(sort(table(velocidades), decreasing = TRUE)[1]))
# Calcular la mediana
mediana <- median(velocidades)
promedio # Imprimir el promedio
[1] 92.625
moda # Imprimir la moda
[1] 100
mediana # Imprimir la mediana
[1] 95
- Interpretación del significado de los parámetros calculados:
Promedio: La velocidad promedio de los automóviles en la muestra es
aproximadamente 92.625 km/h. Moda: La velocidad más común entre los
automóviles en la muestra es de 100 km/h. Mediana: La velocidad mediana
entre los automóviles en la muestra es de 95 km/h, lo que significa que
la mitad de los automóviles están por debajo de esta velocidad y la otra
mitad están por encima. Ademas se puede ver que la distrubucion de la
variable Velocidad tiene una distrubicion normal es decir una
distribucion de Gauss
Actividad 31
Los siguientes datos corresponden al tiempo aproximado, en minutos,
transcurridos desde que fue solicitado un taxi hasta que hizo contacto
con el pasajero:

Realiza una tabla de frecuencia utilizando 5 intervalos de clase y
calcular sus parámetros de posición indicando cuál es su
interpretación.
# Datos de tiempo
tiempo <- c(7, 8, 4, 3, 2, 5, 15, 6, 4, 4, 5, 3, 7, 11,
7, 9, 13, 10, 9, 8, 12, 7, 4, 3, 16, 8, 5, 14)
# Calcular las modas
tabla_frecuencias <- table(tiempo)
modas <- as.numeric(names(tabla_frecuencias)[tabla_frecuencias == max(tabla_frecuencias)])
# Calcular promedio (media)
promedio <- mean(tiempo)
# Calcular mediana
mediana <- median(tiempo)
Promedio (Media):
El tiempo promedio en minutos desde que se solicitó un taxi hasta que hizo contacto con el pasajero es de aproximadamente 7.46 minutos.
El tiempo mediano en minutos desde que se solicitó un taxi hasta que hizo contacto con el pasajero es de aproximadamente 7 minutos, lo que significa que la mitad de los tiempos son menores a este valor y la otra mitad son mayores.
Moda:
El tiempo más común en minutos desde que se solicitó un taxi hasta que hizo contacto con el pasajero son los siguientes valores: 4 y 7 minutos.
Actividad 32
Completa la siguiente tabla correspondiente a al tiempo, en minutos,
que demoran 60 trabajadores en llegar a su casa

# Datos de tiempo y frecuencias
tiempo <- c(3.5, 10.5, 17.5, 24.5, 31.5)
frecuencias <- c(20, 13, 18, 5, 4)
# Calcular el tiempo promedio
promedio <- sum(tiempo * frecuencias) / sum(frecuencias)
# Calcular la moda (los valores con mayor frecuencia)
moda <- tiempo[frecuencias == max(frecuencias)]
# Calcular la mediana
mediana <- median(rep(tiempo, frecuencias))
# Imprimir resultados
cat("a. Resultados:\n")
a. Resultados:
cat("Tiempo promedio en minutos:", round(promedio, 2), "minutos\n")
Tiempo promedio en minutos: 12.83 minutos
cat("Moda (tiempo más común):", moda, "minutos\n")
Moda (tiempo más común): 3.5 minutos
cat("Mediana (tiempo en el medio):", mediana, "minutos\n\n")
Mediana (tiempo en el medio): 10.5 minutos
# Crear gráfico de barras
barplot(frecuencias, names.arg = tiempo, main = "Gráfico de Barras de Frecuencias", xlab = "Tiempo (minutos)", ylab = "Frecuencia", col = "skyblue")

# Porcentaje de trabajadores que tardan más de 21 minutos
porcentaje_mas_21 <- sum(frecuencias[tiempo > 21]) / sum(frecuencias) * 100
cat("c. Porcentaje de trabajadores que tardan más de 21 minutos:", round(porcentaje_mas_21, 2), "%\n")
c. Porcentaje de trabajadores que tardan más de 21 minutos: 15 %
