automovil <- read.csv("automobile_prices_economics_2019_2023.csv")Analitica de datos y programación basica en R Studio
Respuestas Parcial 03
Preparación de la maquina
1. Cargar Datos
Descripción
Este conjunto de datos contiene registros mensuales de precios de automóviles (nuevos y usados), indicadores macroeconómicos (inflación y tasas de interés) y unidades vendidas entre enero de 2019 y diciembre de 2023 del automobil Toyota Camry. Permite explorar el impacto de las variables económicas en los precios y la demanda de este vehiculo.
Características principales:
- 60 puntos de datos mensuales
- Diseño que facilita la correlación para modelos econométricos o de aprendizaje automático
- Útil para pronósticos, análisis de tendencias y simulación de políticas.
head(automovil) Month.Year New.Price.... Used.Price.... Inflation.Rate.... Interest.Rate....
1 19-Jan 25,000 18,000 1.60% 2.40%
2 19-Feb 25,000 17,900 1.50% 2.40%
3 19-Mar 25,000 17,800 1.90% 2.40%
4 19-Apr 25,000 17,700 2.00% 2.40%
5 19-May 25,000 17,600 1.80% 2.40%
6 19-Jun 25,000 17,500 1.60% 2.40%
Units.Sold
1 28,500
2 29,000
3 31,500
4 30,000
5 32,000
6 33,000
1.2 Descripción
Nuestro df (automobile) cuenta con 61 observaciones distribuidas en 6 variables descritas a continuación:
| Variables | Descripción |
|---|---|
Month.Year |
Indica los meses del año de los que se encuentran las fluctuaciones de precios |
New.Price.... |
Indica los presios del Toyota Camry en dolar |
Used.Price.... |
Indica la valoracion de los Toyota Camry despues de comprado y usado en dolar |
Inflation.Rate.... |
Indica el porcentaje inflacionario como un indicador macroeconomico |
Interest.Rate.... |
Indica el porcentaje de las tasas de interes como un indicador macroeconomico |
Units.Sold |
Indica el nuevo valor por unidad vendida de Toyota Camry |
2. Limpieza de datos
summary(automovil) Month.Year New.Price.... Used.Price.... Inflation.Rate....
Length:61 Length:61 Length:61 Length:61
Class :character Class :character Class :character Class :character
Mode :character Mode :character Mode :character Mode :character
Interest.Rate.... Units.Sold
Length:61 Length:61
Class :character Class :character
Mode :character Mode :character
colSums(is.na(automovil)) Month.Year New.Price.... Used.Price.... Inflation.Rate....
0 0 0 0
Interest.Rate.... Units.Sold
0 0
# Eliminar filas con NA
automovil2 <- na.omit(automovil)Confirmar que las variables sean numericas:
automovil2$New.Price.... <- as.numeric(gsub("[^0-9.]", "", as.character(automovil2$New.Price....)))
automovil2$Units.Sold <- as.numeric(gsub("[^0-9.]", "", as.character(automovil2$Units.Sold)))
automovil2$Used.Price.... <- as.numeric(gsub("[^0-9.]", "", as.character(automovil2$Used.Price....)))
automovil2$Inflation.Rate.... <- as.numeric(gsub("[^0-9.]", "", as.character(automovil2$Inflation.Rate....)))
automovil2$Interest.Rate.... <- as.numeric(gsub("[^0-9.]", "", as.character(automovil2$Interest.Rate....)))automovil2$FechaVenta <- parse_date_time(automovil2$Month.Year, orders = "y-b")automovil2 <- automovil2 %>%
mutate(
FechaVenta = as.Date(FechaVenta),
Year = year(FechaVenta)
)# Agrupar y resumir ventas por año
ventas_por_anio <- automovil2 %>%
group_by(Year) %>%
summarise(Unidades_Vendidas = sum(Units.Sold, na.rm = TRUE))3. Preguntas
Analisis de los precios del TOYOTA CAMRY
1. ¿Cuál es la distribución de los precios deL Toyota Camry?
ggplot(automovil2, aes(x = automovil2$New.Price....)) +
geom_histogram(binwidth =61, fill = "skyblue", color = "black") +
labs(title = "Distribución de precios de automóviles",
x = "Precio",
y = "Frecuencia") +
theme_minimal()Warning: Use of `automovil2$New.Price....` is discouraged.
ℹ Use `New.Price....` instead.
Warning: Removed 1 row containing non-finite outside the scale range
(`stat_bin()`).
Con los datos de la tabla podemos observar que el precio de los carros nuevos no varian en los primeros 3 años (2019, 2020 y 2021) en ningun mes del año; y en los dos años siguientes varian proporcinalmente, mientras que los carros usados tienen una variacion en todos los meses del año producida por los cambios en la tasa de la inflaccion.
2. ¿Cómo han cambiado los precios de unidades vendidas del Toyota Camry entre 2019 y 2023?
ggplot(automovil2, aes(x = Year, y = Units.Sold)) +
geom_boxplot(fill = "lightgreen") +
labs(title = "Precios del Toyota Camry de Unidades Vendidas(2019-2023)",
x = "Año",
y = "Precio") +
theme_minimal()Warning: Continuous x aesthetic
ℹ did you forget `aes(group = ...)`?
Warning: Removed 1 row containing missing values or values outside the scale range
(`stat_boxplot()`).
El Toyota campari en sus precios por unidad vendida ha tenido un cambio relativo en los precios; aunque en el 2019 y el 2020 no hubieron ningún tipo de cambios, pero en el 2021 hubo un pequeño cambio y desde el 2022 hasta el 2023 los cambios aumentaron considerablemente por mes.
3. ¿Se notan efectos de la pandemia en los precios nuevos y usados de 2020-2021?
# Graficar ambos en un solo plot
ggplot(automovil2, aes(x = Year)) +
# Línea de Precio Nuevo
geom_line(aes(y = New.Price....), color = "blue", size = 1) +
# Línea de Precio Usado, escalada para compartir eje
geom_line(aes(y = Used.Price.... * 1), color = "red", linetype = "dashed", size = 1) +
scale_y_continuous(
name = "Precio Nuevo (USD)", # Eje izquierdo
sec.axis = sec_axis(~./1, name = "Precio Usado (USD)") # Eje derecho (inflación)
) +
labs(title = "Precio Carro Nuevo y Precio Carro Usado en Toyota Camry",
x = "Fecha") +
theme_minimal() +
theme(
axis.title.y = element_text(color = "blue"),
axis.title.y.right = element_text(color = "red"))Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
ℹ Please use `linewidth` instead.
Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_line()`).
Removed 1 row containing missing values or values outside the scale range
(`geom_line()`).
Es evidente que la pandemia afecto la valoración de los carros usados, más no la de los carros nuevos, ya que el precio de los carros nuevos sigue ascendente de forma constante y tuvo una alta subida en el 2022 para luego volver a acender masivamente en el 2023; sin embargo,los carros usados tuvieron una caida bastante representativa hasta el 2021; para en el 2022 estabillizarse.
4. ¿Cuál fue el año con el precio promedio de Toyota Camry más alto y más bajo?
precio_promedio_camry <- automovil2 %>%
group_by(Year) %>%
summarise(precio_promedio = mean(New.Price...., na.rm = TRUE))
# Ahora graficamos en línea
plot(precio_promedio_camry$Year, precio_promedio_camry$precio_promedio,
type = "o", # "o" para línea con puntos
col = "blue",
pch = 16, # tipo de punto sólido
lwd = 2, # grosor de la línea
xlab = "Año",
ylab = "Precio Promedio ($)",
main = "Precio Promedio del Toyota Camry por Año")
# Agregamos los valores encima de cada punto
text(precio_promedio_camry$Year,
precio_promedio_camry$precio_promedio,
labels = round(precio_promedio_camry$precio_promedio, 0), # redondear los precios
pos = 3, # 3 significa "arriba" del punto
cex = 0.8, # tamaño de letra
col = "black")El precio promedio mas bajo de la Toyota Camey fuel en el año 2019 con un valor de 25000 en todos los meses sin ningún tipo de cambio; mientas que el precio promedio mas alto fue el del año 20223, ya que en todos los mese hubo cambios de los precios comenzando en el mes de enero con un valor de 26000 y finalizando el año en el mes de diciembre con un valor de 27000, por eso fue el año con ms variaciones.
5. Haz un analisis general de la valoración de los carros por año, para ver su valor promedio, maximos y minimos.
# Análisis por año
resumen_anual <- automovil2 %>%
group_by(Year) %>%
summarize(
precio_promedio = mean(Used.Price....),
precio_minimo = min(Used.Price....),
precio_maximo = max(Used.Price....)
)
print(resumen_anual)# A tibble: 6 × 4
Year precio_promedio precio_minimo precio_maximo
<dbl> <dbl> <dbl> <dbl>
1 2019 17450 16900 18000
2 2020 16250 15700 16800
3 2021 15050 14500 15600
4 2022 14100 13800 14400
5 2023 15050 14500 15600
6 NA NA NA NA
Tendencia general decreciente : De 2019 a 2022 hay una disminución constante en los precios promedio, pasando de $17,450 a $14,100 (una caída del 19.2%). Recuperación en 2023 : Se observa un cambio en la tendencia durante 2023, donde los precios promedio se recuperaron a $15,050, un aumento del 6.7% respecto a 2022. Reducción del rango de precios : La diferencia entre precio máximo y mínimo se reduce significativamente, de $1,100 en 2019 a apenas $1,100 en 2023, lo que sugiere un mercado más homogéneo. Punto de inflexión : 2022 representa el valor más bajo para todos los indicadores (promedio, mínimo y máximo), marcando un punto de cambio en la tendencia.
6. ¿Cuál es la relación entre el precio del automobil usado y el año del automóvil?
# Gráfico de evolución de precios por año
ggplot(resumen_anual, aes(x = Year, y = precio_promedio, group = 1)) +
geom_boxplot(aes(group = Year), fill = "lightblue") +
geom_smooth(method = "lm", color = "red", se = FALSE) +
labs(title = "Relación entre Precio de Automóviles Usados y Año",
x = "Año",
y = "Precio ($)") +
theme_minimal()Warning: Removed 1 row containing missing values or values outside the scale range
(`stat_boxplot()`).
`geom_smooth()` using formula = 'y ~ x'
Warning: Removed 1 row containing non-finite outside the scale range
(`stat_smooth()`).
# Modelo de regresión lineal simple
boxplot(Used.Price.... ~ Year, data = automovil2)Teniendo en cuenta el analisis del punto anterior y siendo en las graficas explicito que los valores son representativos, y se mantienen en la media del valor promedio por año; podemos identificar que existe una relación negativa entre el año y el precio de los automóviles usados durante el periodo 2019-2023; indicando que a medida que avanzan los años los precios de los automóviles usados disminuyen significativamente.
Los precios cayeron aproximadamente $17.450 en 2019 a $15.050 en 2023, esto representa una reducción del 13.8%, la disminución es constante año tras año sin periodos de recuperación significativos.Todo esto se debe a los cambios en las preferencias del consumidor, muy probablemente a automóviles nuevos con tecnologías avanzadas, aumento en la oferta de vehículos usados e impacto de la pandemia.
En conclusión el precio de los automóviles usados tiene un comportamiento atípico en el contexto de un mercado con inflación positiva dentro del mismo período.
7. ¿Cual es el cambio de los precios entre los automobiles nuevos y usados?
# Calcular la diferencia entre precios nuevos y usados
automovil2$diferencia <- automovil2$New.Price.... - automovil2$Used.Price....# Normalizar precios
automovil2$Precio_Nuevo_Norm <- automovil2$New.Price.... / max(automovil2$New.Price...., na.rm = TRUE)
automovil2$Precio_Usado_Norm <- automovil2$Used.Price.... / max(automovil2$Used.Price...., na.rm = TRUE)
# Graficar precios normalizados
plot(automovil2$FechaVenta, automovil2$Precio_Nuevo_Norm,
type = "l", col = "blue", lwd = 2,
xlab = "Tiempo (Fechas)", ylab = "Precio Normalizado",
main = "Precios Normalizados de Automóviles Nuevos y Usados 2019-2023")
lines(automovil2$FechaVenta, automovil2$Precio_Usado_Norm, col = "red", lwd = 2, lty = 2)
legend("topleft", legend = c("Nuevos", "Usados"), col = c("blue", "red"), lty = c(1,2), lwd = 2, bty = "n")# Visualizar la diferencia de precios
plot(automovil2$FechaVenta, automovil2$diferencia, type="l", col="purple",
xlab="Tiempo (fecha)", ylab="Diferencia ($)",
main="Diferencia entre Precios de Autos Nuevos y Usados")Cómo podemos observar en la gráfica se muestra una clara diferencia en los precios a lo largo de los años, mientras que los automóviles nuevos han aumentado el precio constantemente en un 8% aproximadamente, los precios de los automóviles usados disminuyen su precio en un 13.3% aproximadamente. En cuanto a la diferencia entre los precios de automóviles nuevos y usados va creciendo significativamente, al inicio del 2019 la diferencia era de $7.000 para finales del 2023 aumenta a $11.400 lo cual representa un incremento del 63% en la diferencia de los precios.
Este es del punto de la diferencia de los precios de autos nuevos y usados a lo largo del tiempo 2019-2023
8. ¿Cómo ha cambiado el precio de un Toyota Camry nuevo con el tiempo (basado en la fecha de venta)?
automovil2$FechaVenta <- parse_date_time(automovil2$Month.Year, orders = "y-b")# Graficar evolución del precio nuevo por fecha de venta
ggplot(automovil2, aes(x = FechaVenta, y = New.Price....)) +
geom_line(color = "green", size = 1) +
geom_point(color = "darkgreen", size = 2) +
labs(title = "Evolución del precio nuevo de autos por fecha de venta",
x = "Fecha de Venta",
y = "Precio Nuevo ($)") +
theme_minimal()Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_line()`).
Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_point()`).
El gráfico de líneas ilustra cómo ha fluctuado el precio de un Toyota Camry nuevo desde 2019 hasta 2023. Esto indica que durante los primeros años (2019-2020), el precio se mantuvo bastante constante y a partir de 2021, se percibe un aumento constante, con un notable incremento en los precios durante 2022 y 2023.
El gráfico de líneas ilustra cómo ha fluctuado el precio de un Toyota Camry nuevo desde 2019 hasta 2023. Esto indica que durante los primeros años (2019-2020), el precio se mantuvo bastante constante y a partir de 2021, se percibe un aumento constante, con un notable incremento en los precios durante 2022 y 2023.
9. ¿De qué manera cambia el precio del Toyota Camry según si se trata de un auto nuevo o usado?
# Gráfico de dispersión
ggplot(automovil2, aes(x = Used.Price...., y = New.Price....)) +
geom_point(color = "blue") +
labs(title = "Relación entre precio de autos usados y nuevos",
x = "Precio de autos usados ($)",
y = "Precio de autos nuevos ($)")Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_point()`).
En el gráfico de dispersión, se puede ver la conexión entre el precio de un automóvil usado y el precio de uno nuevo. Se evidencia una relación positiva: los vehículos que son más costosos al comprarlos nuevos suelen tener también un alto precio como autos de segunda mano. No obstante, los datos no son completamente lineales, sino que presentan agrupaciones. Esto puede ser resultado de variaciones en versiones, equipamientos o condiciones de los vehículos.
Analisis de los Toyota Camry según la fecha e indicadores macroeconomicos
10. ¿En que año se vendieron más Toyota Camry según el dataset?
# Agrupar y resumir ventas por año
ventas_por_anio <- automovil2 %>%
group_by(Year) %>%
summarise(Unidades_Vendidas = sum(Units.Sold, na.rm = TRUE))# Graficar
ggplot(ventas_por_anio, aes(x = Year, y = Unidades_Vendidas)) +
geom_col(fill = "skyblue") +
labs(
title = "Unidades Vendidas de Toyota Camry por Año",
x = "Año",
y = "Unidades Vendidas"
) +
theme_minimal()Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_col()`).
El gráfico nos muestra el cambio en las ventas del Toyota Camry desde el año 2019 hasta 2023. Se puede ver una disminución en 2020, seguida de un aumento constante que comenzó en 2021. Siendo el año 2023 donde se registran mas ventas alcanzando más de 800,000 unidades. Esto podría indicar una mejora en la demanda del automóvil.
11. ¿Qué conexión existe entre el precio por unidad vendida del Toyota Camry y la tasa de inflación?
Ahora creamos una nueva columna para calcular el promedio:
# Crear una nueva columna: precio promedio por unidad vendida
automovil2Price_per_Unit <- automovil2$New.Price.... / automovil2$Units.Sold# Gráfico de dispersión entre precio por unidad y porcentaje de inflación
ggplot(automovil2, aes(x = Inflation.Rate...., y = automovil2Price_per_Unit)) +
geom_point(color = "red") +
labs(title = "Relación entre inflación y precio por unidad vendida",
x = "Tasa de inflación (%)",
y = "Precio por unidad vendida ($)")Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_point()`).
El diagrama de dispersión muestra cómo varía el precio por unidad vendida en relación con el porcentaje de inflación. Se observa que con tasas de inflación más bajas (entre 0% y 2%), hay una mayor variabilidad en los precios de las unidades vendidas, con algunos precios más elevados en ciertas ocasiones. Sin embargo, cuando la inflación aumenta (de 4% a 8%), los precios por unidad vendida tienden a agruparse en valores más bajos. Esto sugiere que, con niveles más altos de inflación, los precios por unidad vendida suelen bajar, lo que podría explicarse por la disminución del poder adquisitivo de los compradores y la necesidad de ajustar los precios de los automóviles para mantener el interés del mercado.
12. ¿Existen diferencias significativas en el precio de compra de Toyota Camry según la tasa de interés vigente?
ggplot(automovil2, aes(x = Interest.Rate...., y = New.Price....)) +
geom_boxplot(fill = "lightblue") +
labs(x = "Tasa de interés", y = "Precio de compra", title = "Precio vs Tasa de interés en Toyota Camry")Warning: Continuous x aesthetic
ℹ did you forget `aes(group = ...)`?
Warning: Removed 1 row containing missing values or values outside the scale range
(`stat_boxplot()`).
Se puede indicar que los valores son representativos ya que se han generado aproximadamente en la mitad de ambos valores, consistentes entre 25000 y 25500 hacia 26000; con una cantidad de datos atipicos ubicados en la parte superior de la grafica pero que no son tan representativos; dejandonos concluir con que independientemente del valor de la tasa de interes, el costo del toyota camry es constante; por ende, no se evidencian diferencias significativas entre ambos valores.
13. ¿Qué fechas el Toyota Camry han mostrado el mayor aumento en el porcentaje de inflación relacionado con el precio nuevo?
ggplot(automovil2, aes(x = Year, y = Inflation.Rate....)) +
geom_line(color = "blue", size = 1.2) +
geom_point(color = "red", size = 2) +
labs(
title = "Aumento porcentual del precio nuevo del Toyota Camry por año",
x = "Año de producción",
y = "Aumento porcentual (%)"
) +
theme_minimal()Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_line()`).
Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_point()`).
Basado en el grafico de lineas y puntos, es posible ver el incremento sustancial generado enyre el 2021 y el 2022; dejando el 2022 como el año con mayor aumento porcentual inflacionario con un valor mayor al 7.5%
14. Basados en la pregunta anterior, ¿se podria decir que existe alguna correlación entre el porcentaje de inflación relacionado con el precio nuevo?
# Graficar ambos en un solo plot
ggplot(automovil2, aes(x = Year)) +
# Línea de Precio Nuevo
geom_line(aes(y = New.Price....), color = "blue", size = 1) +
# Línea de Inflación (%), escalada para compartir eje
geom_line(aes(y = Inflation.Rate.... * 100), color = "red", linetype = "dashed", size = 1) +
scale_y_continuous(
name = "Precio Nuevo (USD)", # Eje izquierdo
sec.axis = sec_axis(~./100, name = "Inflación (%)") # Eje derecho (inflación)
) +
labs(title = "Precio Nuevo y Porcentaje de Inflación en Toyota Camry",
x = "Fecha") +
theme_minimal() +
theme(
axis.title.y = element_text(color = "blue"),
axis.title.y.right = element_text(color = "red"))Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_line()`).
Removed 1 row containing missing values or values outside the scale range
(`geom_line()`).
Ahora, discriminando ambos valores en lineas separadas, se puede ver que los precios se han mantenido de forma ascendente y cuando han habido aumentos sustanciales dentro de la inflación, los valores aumentan un poco mas, visible en el 2022; sin embargo, en el 2023 deciende y los precios se disparan; razón por la cual no se podria decir que hay una influencia tan constante entre ambos valores; ya que independientemente de que la inflación aumente o disminuya, el costo por vehiculo siempre es ascendente.
15. ¿Hay alguna correlación entre la tasa de interes y la tasa de inflación del Toyota Camry?
# Graficar ambos en un solo plot
ggplot(automovil2, aes(x = Year)) +
# Línea de Tasa de Interes
geom_line(aes(y = Interest.Rate....), color = "blue", size = 1) +
# Línea de Inflación (%), escalada para compartir eje
geom_line(aes(y = Inflation.Rate.... * 1), color = "red", linetype = "dashed", size = 1) +
scale_y_continuous(
name = "Tasa de Interes (%)", # Eje izquierdo
sec.axis = sec_axis(~./1, name = "Inflación (%)") # Eje derecho (inflación)
) +
labs(title = "Tasa de interes y Tasa de Inflación en Toyota Camry",
x = "Fecha") +
theme_minimal() +
theme(
axis.title.y = element_text(color = "blue"),
axis.title.y.right = element_text(color = "red"))Warning: Removed 1 row containing missing values or values outside the scale range
(`geom_line()`).
Removed 1 row containing missing values or values outside the scale range
(`geom_line()`).
Es observable la relación que existe entre la tasa de interes y la tasa de inflación, siendo estas directamente proporcionales, si la inflación es estable la tasa de interes se mantiene estable, si baja, bajan al tiempo, si vuelve a estar estable y aumenta masivamente, se retrasa en actuar pero sigue el mismo comportamiento; lo que indica que según el comportamiento de la inflación será la tasa de interes para comprar un toyota camry.