En la actualiad, encontramos varias empresas de ceulares como lo puede ser Apple, Samsung, Oppo, y muchas más, las cuales tienen a la venta diversas gamas de celulares, como gama baja, media, alta y muy alta, las cuales se clasifican dependiendo de la velocidad del microprocesador, los megapixeles de las cámaras tanto frontal como de la trasera, el número de nucleos del procesador, la ram, el tiempo de carga y demás variables. Por lo que en el presente análisis buscamos caracterizar el rango de precios y lograr estimar muestras significativas de la misma,de una base de datos de Kaggle, la cual recopiló datos de ventas de teléfonos móviles de varias empresas.
battery_power
:
clock_speed
:
int_memory
:
ram
:
fc
:
pc
:
px_height
:
px_width
:
m_dep
:
mobile_wt
:
sc_h
:
sc_w
:
talk_time
:
bluetooth
:
dual_sim
:
three_g
:
four_g
:
touch_screen
:
wifi
:
n_cores
:
price_range
:
Importamos la base de datos y renombramos para trabajar en un análisis descriptivo
## # A tibble: 6 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 842 0 2.2 7 2 2549 0 0
## 2 1021 1 0.5 53 3 2631 1 1
## 3 563 1 0.5 41 5 2603 1 1
## 4 615 1 2.5 10 6 2769 0 1
## 5 1821 1 1.2 44 2 1411 0 1
## 6 1859 0 0.5 22 1 1067 1 1
## # ℹ 13 more variables: four_g <dbl>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <dbl>, wifi <dbl>, price_range <dbl>
## # A tibble: 6 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 858 0 2.2 50 1 3978 0 1
## 2 794 1 0.5 2 6 668 1 1
## 3 1965 1 2.6 39 4 2032 1 1
## 4 1911 0 0.9 36 8 3057 1 1
## 5 1512 0 0.9 46 5 869 0 1
## 6 510 1 2 45 6 3919 1 1
## # ℹ 13 more variables: four_g <dbl>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <dbl>, wifi <dbl>, price_range <dbl>
## [1] 2000 21
## battery_power bluetooth clock_speed int_memory n_cores
## 0 0 0 0 0
## ram dual_sim three_g four_g fc
## 0 0 0 0 0
## pc px_height px_width m_dep mobile_wt
## 0 0 0 0 0
## sc_h sc_w talk_time touch_screen wifi
## 0 0 0 0 0
## price_range
## 0
## battery_power bluetooth clock_speed int_memory
## Min. : 501.0 Min. :0.000 Min. :0.500 Min. : 2.00
## 1st Qu.: 851.8 1st Qu.:0.000 1st Qu.:0.700 1st Qu.:16.00
## Median :1226.0 Median :0.000 Median :1.500 Median :32.00
## Mean :1238.5 Mean :0.495 Mean :1.522 Mean :32.05
## 3rd Qu.:1615.2 3rd Qu.:1.000 3rd Qu.:2.200 3rd Qu.:48.00
## Max. :1998.0 Max. :1.000 Max. :3.000 Max. :64.00
## n_cores ram dual_sim three_g
## Min. :1.000 Min. : 256 Min. :0.0000 Min. :0.0000
## 1st Qu.:3.000 1st Qu.:1208 1st Qu.:0.0000 1st Qu.:1.0000
## Median :4.000 Median :2146 Median :1.0000 Median :1.0000
## Mean :4.521 Mean :2124 Mean :0.5095 Mean :0.7615
## 3rd Qu.:7.000 3rd Qu.:3064 3rd Qu.:1.0000 3rd Qu.:1.0000
## Max. :8.000 Max. :3998 Max. :1.0000 Max. :1.0000
## four_g fc pc px_height
## Min. :0.0000 Min. : 0.000 Min. : 0.000 Min. : 0.0
## 1st Qu.:0.0000 1st Qu.: 1.000 1st Qu.: 5.000 1st Qu.: 282.8
## Median :1.0000 Median : 3.000 Median :10.000 Median : 564.0
## Mean :0.5215 Mean : 4.309 Mean : 9.916 Mean : 645.1
## 3rd Qu.:1.0000 3rd Qu.: 7.000 3rd Qu.:15.000 3rd Qu.: 947.2
## Max. :1.0000 Max. :19.000 Max. :20.000 Max. :1960.0
## px_width m_dep mobile_wt sc_h
## Min. : 500.0 Min. :0.1000 Min. : 80.0 Min. : 5.00
## 1st Qu.: 874.8 1st Qu.:0.2000 1st Qu.:109.0 1st Qu.: 9.00
## Median :1247.0 Median :0.5000 Median :141.0 Median :12.00
## Mean :1251.5 Mean :0.5018 Mean :140.2 Mean :12.31
## 3rd Qu.:1633.0 3rd Qu.:0.8000 3rd Qu.:170.0 3rd Qu.:16.00
## Max. :1998.0 Max. :1.0000 Max. :200.0 Max. :19.00
## sc_w talk_time touch_screen wifi
## Min. : 0.000 Min. : 2.00 Min. :0.000 Min. :0.000
## 1st Qu.: 2.000 1st Qu.: 6.00 1st Qu.:0.000 1st Qu.:0.000
## Median : 5.000 Median :11.00 Median :1.000 Median :1.000
## Mean : 5.767 Mean :11.01 Mean :0.503 Mean :0.507
## 3rd Qu.: 9.000 3rd Qu.:16.00 3rd Qu.:1.000 3rd Qu.:1.000
## Max. :18.000 Max. :20.00 Max. :1.000 Max. :1.000
## price_range
## Min. :0.00
## 1st Qu.:0.75
## Median :1.50
## Mean :1.50
## 3rd Qu.:2.25
## Max. :3.00
De acuerdo al análisis descriptivo encontramos que 6 variables son cualitativas nominales y cuantitativas continuas son 2 y las 13 variables restantes son cuantitativas discretas.
selected_vars <- names(data)[c(1,3,4,6,18,10)]
data_selected <- data[, selected_vars]
# Convertir a formato largo
data_long <- pivot_longer(data_selected, cols = everything(), names_to = "Variable", values_to = "Dispersion")
# Graficar con facet_wrap para mostrar 4 boxplots en una cuadrícula
ggplot(data_long, aes(x = Variable, y = Dispersion, fill = Variable)) +
geom_boxplot() +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
labs(title = "Boxplots")+
scale_fill_brewer(palette = "Set2") +
facet_wrap(~ Variable, scales = "free")
Variables cualitativas: Nominal - Ordinal
Inicialmente vamos a convertir variables númericas a factores
Se realiza un análisis descriptivo de las variables bluetooth, doble
sim, wifi, touch_screen (pantalla táctil), en las que se observa si el
dispositivo tiene o no estás funciones (0 dispositivos que no tienen
está función y 1 cuando si), se muestra la cantidad de cada uno de ellos
con su respectivo porcentaje.
Para obtener la matriz de varianzas y covarianzas de las variables objetivo para ello se utiliza la función cov(datos de interes)
## battery_power clock_speed int_memory ram
## battery_power 193088.359838 4.116921836 -31.92357204 -3.112180e+02
## clock_speed 4.116922 0.665862869 0.09691383 3.047585e+00
## int_memory -31.923572 0.096913832 329.26697124 6.458695e+02
## ram -311.218050 3.047584542 645.86953027 1.176644e+06
## fc 63.592320 -0.001537144 -2.29503927 7.110563e+01
## pc 83.782186 -0.025955103 -3.66144797 1.906581e+02
## px_height 2905.736870 -5.259132566 84.08051826 -9.797075e+03
## px_width -1595.644609 -3.341840795 -65.36665408 1.924610e+03
## m_dep 4.319702 -0.003380628 0.03603664 -2.951498e+00
## mobile_wt 28.689738 0.356738119 -21.97756728 -9.909058e+01
## sc_h -55.464653 -0.099969610 2.88769160 7.310627e+01
## sc_w -41.005692 -0.026228864 0.92729815 1.681137e+02
## talk_time 126.075334 -0.050970235 -0.27664982 6.412922e+01
## fc pc px_height px_width
## battery_power 63.592320410 83.78218584 2905.736870 -1595.644609
## clock_speed -0.001537144 -0.02595510 -5.259133 -3.341841
## int_memory -2.295039270 -3.66144797 84.080518 -65.366654
## ram 71.105629315 190.65811456 -9797.075042 1924.610004
## fc 18.848133817 16.97082866 -19.247050 -9.711403
## pc 16.970828664 36.77591571 -49.694829 10.997543
## px_height -19.247049525 -49.69482941 196941.408040 97946.365509
## px_width -9.711402951 10.99754302 97946.365509 186796.361941
## m_dep -0.002242746 0.04596911 3.233478 2.937617
## mobile_wt 3.629749375 4.04531416 14.756486 1.373327
## sc_h -0.201462481 0.12615583 111.466131 39.330164
## sc_w -0.234003502 -0.62927014 83.205267 65.332778
## talk_time -0.161985493 0.48566133 -25.812594 15.869264
## m_dep mobile_wt sc_h sc_w talk_time
## battery_power 4.319702476 28.6897384 -55.46465258 -41.00569235 126.07533417
## clock_speed -0.003380628 0.3567381 -0.09996961 -0.02622886 -0.05097024
## int_memory 0.036036643 -21.9775673 2.88769160 0.92729815 -0.27664982
## ram -2.951498499 -99.0905823 73.10626863 168.11368584 64.12922161
## fc -0.002242746 3.6297494 -0.20146248 -0.23400350 -0.16198549
## pc 0.045969110 4.0453142 0.12615583 -0.62927014 0.48566133
## px_height 3.233477739 14.7564862 111.46613107 83.20526663 -25.81259430
## px_width 2.937616683 1.3733272 39.33016433 65.33277789 15.86926413
## m_dep 0.083183529 0.2221253 -0.03080178 -0.02310380 0.02679415
## mobile_wt 0.222125313 1253.1355668 -5.04934317 -3.20158379 1.20086143
## sc_h -0.030801776 -5.0493432 17.75143347 9.29005953 -0.39907104
## sc_w -0.023103802 -3.2015838 9.29005953 18.97820010 -0.54320860
## talk_time 0.026794147 1.2008614 -0.39907104 -0.54320860 29.85480640
Después de estudiar la asociación de las variables, se delimita la información a través de la matriz de correlación.
Para visualizar mejor la anterior información se sugiere ver la matriz de correlación en un mapa de calor a través de la función corplot
cat(
" \"Tabla de distribución de frecuencias : Doble sim\"\n"
)
## "Tabla de distribución de frecuencias : Doble sim"
tabla_dft= fdt_cat(data$dual_sim)
tabla_dft
## Category f rf rf(%) cf cf(%)
## 1 1019 0.51 50.95 1019 50.95
## 0 981 0.49 49.05 2000 100.00
La primera tabla es de la variable Doble sim, en la que se evidencia que los dispositivos que tienen doble sim (1), son 1019, valor el cual representa el 51% de los datos, por otro lado, están los dispositivos que no tienen (0), son 981 con un valor porcentual del 49% respecto al total.
cat(
"\"Tabla de distribución de frecuencias : bluetooth\"\n"
)
## "Tabla de distribución de frecuencias : bluetooth"
tabla_bluetooth= fdt_cat(data$bluetooth)
tabla_bluetooth
## Category f rf rf(%) cf cf(%)
## 0 1010 0.5 50.5 1010 50.5
## 1 990 0.5 49.5 2000 100.0
La tabla de la variable bluetooth, indica los dispositivos que tienen bluetooth representado con el número (1), con un total de 1010, representando el 50.5% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 990 y un valor porcentual del 49.5% respecto al total.
cat(
"\"Tabla de distribución de frecuencias : touch_screen\"\n"
)
## "Tabla de distribución de frecuencias : touch_screen"
tabla_touch_screen= fdt_cat(data$touch_screen)
tabla_touch_screen
## Category f rf rf(%) cf cf(%)
## 1 1006 0.5 50.3 1006 50.3
## 0 994 0.5 49.7 2000 100.0
La tabla de la variable touch_screen, indica los dispositivos que tienen pantalla táctil representado con el número (1), con un total de 1006, representando el 50.3% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 994 y un valor porcentual del 49.7% respecto al total.
cat(
"\"Tabla de distribución de frecuencias : wifi\"\n"
)
## "Tabla de distribución de frecuencias : wifi"
tabla_wifi = fdt_cat(data$wifi)
tabla_wifi
## Category f rf rf(%) cf cf(%)
## 1 1014 0.51 50.7 1014 50.7
## 0 986 0.49 49.3 2000 100.0
La tabla de la variable wifi, indica los dispositivos que tienen wifi representado con el número (1), con un total de 1014, representando el 50.7% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 986 y un valor porcentual del 49.3% respecto al total.
cat(
"\"Tabla de distribución de frecuencias : three_g\"\n"
)
## "Tabla de distribución de frecuencias : three_g"
tabla_three_g = fdt_cat(data$three_g)
tabla_three_g
## Category f rf rf(%) cf cf(%)
## 1 1523 0.76 76.15 1523 76.15
## 0 477 0.24 23.85 2000 100.00
Tabla_three_g <- data %>% group_by(three_g ) %>% summarise(Total=n()) %>%
dplyr::mutate(Porcentaje = round(Total/sum(Total)*100, 1)) #16
ggplot(Tabla_three_g, aes(x = three_g, y=Total,fill=three_g) ) +
geom_bar(width = 0.9, stat="identity", position = position_dodge())+
ylim(c(0,1600))+
labs(x="three_g", y= "Frecuencia \n (Porcentajes)") + #17
labs(fill = "")+
geom_text(aes(label=paste0(Total," ", "", "(", Porcentaje, "%",")")), #18
vjust=-0.9,
color="black",
hjust=0.5,
position = position_dodge(0.9),
angle=0,
size=4.0
) +
scale_fill_discrete(name = "El dispositivo tiene 3G", labels = c("No", "Si")) + #19
theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1)) + #20
#theme_bw(base_size = 14) +
facet_wrap(~"Variable 3G")
#plot_grid(Barra1, Barra2, nrow= 1, align = "h")
La tabla de la variable three_g, indica los dispositivos que tienen 3G representado con el número (1), con un total de 1523, representando el 76.1% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 477 y un valor porcentual del 23.8% respecto al total. Adicionalmente, se evidencia la gráfica con esta información.
cat(
"\"Tabla de distribución de frecuencias : four_g\"\n"
)
## "Tabla de distribución de frecuencias : four_g"
tabla_four_g = fdt_cat(data$four_g)
tabla_four_g
## Category f rf rf(%) cf cf(%)
## 1 1043 0.52 52.15 1043 52.15
## 0 957 0.48 47.85 2000 100.00
Tabla_four_g <- data %>% group_by(four_g ) %>% summarise(Total=n()) %>%
dplyr::mutate(Porcentaje = round(Total/sum(Total)*100, 1)) #16
ggplot(Tabla_four_g, aes(x = four_g, y=Total,fill=four_g) ) +
geom_bar(width = 0.9, stat="identity", position = position_dodge())+
ylim(c(0,1100))+
labs(x="four_g", y= "Frecuencia \n (Porcentajes)") + #17
labs(fill = "")+
geom_text(aes(label=paste0(Total," ", "", "(", Porcentaje, "%",")")), #18
vjust=-0.9,
color="black",
hjust=0.5,
position = position_dodge(0.9),
angle=0,
size=4.0
) +
scale_fill_discrete(name = "El dispositivo tiene 4G", labels = c("No", "Si")) + #19
theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1)) + #20
#theme_bw(base_size = 14) +
facet_wrap(~"Variable 4G")
#plot_grid(Barra1, Barra2, nrow= 1, align = "h")
La tabla de la variable four_g, indica los dispositivos que tienen 4G representado con el número (1), con un total de 1043, representando el 52.1% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 957 y un valor porcentual del 47.9% respecto al total. Adicionalmente, se evidencia la gráfica con esta información.
## "Medidas descriptivas: ram "
## Descriptive Statistics
## data$ram
## N: 2000
##
## ram
## ----------------- ---------
## Mean 2124.21
## Std.Dev 1084.73
## Min 256.00
## Q1 1207.00
## Median 2146.50
## Q3 3065.00
## Max 3998.00
## MAD 1382.52
## IQR 1857.00
## CV 0.51
## Skewness 0.01
## SE.Skewness 0.05
## Kurtosis -1.19
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: ram "
## Class limits f rf rf(%) cf cf(%)
## [253.44,568.8183) 168 0.08 8.40 168 8.40
## [568.8183,884.1967) 176 0.09 8.80 344 17.20
## [884.1967,1199.575) 149 0.07 7.45 493 24.65
## [1199.575,1514.953) 195 0.10 9.75 688 34.40
## [1514.953,1830.332) 150 0.07 7.50 838 41.90
## [1830.332,2145.71) 161 0.08 8.05 999 49.95
## [2145.71,2461.088) 188 0.09 9.40 1187 59.35
## [2461.088,2776.467) 179 0.09 8.95 1366 68.30
## [2776.467,3091.845) 145 0.07 7.25 1511 75.55
## [3091.845,3407.223) 164 0.08 8.20 1675 83.75
## [3407.223,3722.602) 176 0.09 8.80 1851 92.55
## [3722.602,4037.98) 149 0.07 7.45 2000 100.00
## "Test de normalidad de Shapiro-Wilk: ram "
##
## Shapiro-Wilk normality test
##
## data: ram
## W = 0.95462, p-value < 2.2e-16
## "Test de Wilcoxon Signed-Rank Test: ram "
##
## Wilcoxon signed rank test with continuity correction
##
## data: data$ram
## V = 2001000, p-value < 2.2e-16
## alternative hypothesis: true location is not equal to 0
## Size (n) Missing Minimum 1st Qu Mean Median
## 2000.000 0.000 256.000 1207.500 2124.213 2146.500
## TrMean 3rd Qu Max Stdev Var SE Mean
## 2123.541 3064.500 3998.000 1084.732 1176643.606 24.255
## I.Q.R. Range Kurtosis Skewness SW p-val
## 1857.000 3742.000 -1.194 0.007 0.000
Según las gráficas podemos observar que la distribución de los datos es bastante uniforme, o rectangular dado el histograma que se realizó, también observamos que podría existir multimodalidad, es decir que podrían haber subgrupos, tenemos posiblemente simetría, no hay outliers, y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 2124.21 con una desviación estandar de 1084.73, lo que significa que los datos son muy dispersos, con una mediana de 2146.50, valor el cual es cercano a la media y el valor mínimo del conjunto de datos es 256 y el máximo de 3998, con un coeficiente de variación del 0.51, adicionalmente se observa que el valor del sesgo es de 0.01, el cual es un valor cerca a 0 lo que indica que posiblemente es simétrico y curtosis de -1.19 es decir que tiene una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95462, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas
## "Medidas descriptivas: battery_power "
## Descriptive Statistics
## data$battery_power
## N: 2000
##
## battery_power
## ----------------- ---------------
## Mean 1238.52
## Std.Dev 439.42
## Min 501.00
## Q1 851.50
## Median 1226.00
## Q3 1615.50
## Max 1998.00
## MAD 566.35
## IQR 763.50
## CV 0.35
## Skewness 0.03
## SE.Skewness 0.05
## Kurtosis -1.23
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: battery_power "
## Class limits f rf rf(%) cf cf(%)
## [495.99,622.8225) 184 0.09 9.20 184 9.20
## [622.8225,749.655) 175 0.09 8.75 359 17.95
## [749.655,876.4875) 178 0.09 8.90 537 26.85
## [876.4875,1003.32) 166 0.08 8.30 703 35.15
## [1003.32,1130.153) 165 0.08 8.25 868 43.40
## [1130.153,1256.985) 162 0.08 8.10 1030 51.50
## [1256.985,1383.818) 163 0.08 8.15 1193 59.65
## [1383.818,1510.65) 156 0.08 7.80 1349 67.45
## [1510.65,1637.483) 174 0.09 8.70 1523 76.15
## [1637.483,1764.315) 166 0.08 8.30 1689 84.45
## [1764.315,1891.148) 167 0.08 8.35 1856 92.80
## [1891.148,2017.98) 144 0.07 7.20 2000 100.00
## "Test de normalidad de Shapiro-Wilk: battery_power "
##
## Shapiro-Wilk normality test
##
## data: battery_power
## W = 0.95188, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean
## 2000.000 0.000 501.000 851.750 1238.518 1226.000 1237.268
## 3rd Qu Max Stdev Var SE Mean I.Q.R. Range
## 1615.250 1998.000 439.418 193088.360 9.826 763.500 1497.000
## Kurtosis Skewness SW p-val
## -1.226 0.032 0.000
Según las gráficas podemos observar que la distribución de los datos es uniforme, tenemos posiblemente simetría, no hay outliers, y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 1238.52 con una desviación estandar de 439.42, lo que significa que los datos son moderadamente dispersos, con una mediana de 1226, valor el cual está cerca a la media y nos sugiere que la distribución es bastante simétrica, adicionalmente, el valor mínimo del conjunto de datos es 501 y el máximo de 1998, con un coeficiente de variación del 0.35 lo que sugiere una variabilidad relativamente baja en comparación con la media, además, se observa que el valor del sesgo es de 0.03, valor el cual es cercano a 0, lo que indica que posiblemente es simétrico y curtosis de -1.23 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95188, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas
## "Medidas descriptivas: clock_speed "
## Descriptive Statistics
## data$clock_speed
## N: 2000
##
## clock_speed
## ----------------- -------------
## Mean 1.52
## Std.Dev 0.82
## Min 0.50
## Q1 0.70
## Median 1.50
## Q3 2.20
## Max 3.00
## MAD 1.19
## IQR 1.50
## CV 0.54
## Skewness 0.18
## SE.Skewness 0.05
## Kurtosis -1.32
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: clock_speed "
## Class limits f rf rf(%) cf cf(%)
## [0.495,0.7062) 551 0.28 27.55 551 27.55
## [0.7062,0.9175) 116 0.06 5.80 667 33.35
## [0.9175,1.129) 112 0.06 5.60 779 38.95
## [1.129,1.34) 124 0.06 6.20 903 45.15
## [1.34,1.551) 137 0.07 6.85 1040 52.00
## [1.551,1.762) 136 0.07 6.80 1176 58.80
## [1.762,1.974) 127 0.06 6.35 1303 65.15
## [1.974,2.185) 143 0.07 7.15 1446 72.30
## [2.185,2.396) 137 0.07 6.85 1583 79.15
## [2.396,2.607) 187 0.09 9.35 1770 88.50
## [2.607,2.819) 140 0.07 7.00 1910 95.50
## [2.819,3.03) 90 0.04 4.50 2000 100.00
## "Test de normalidad de Shapiro-Wilk: clock_speed "
##
## Shapiro-Wilk normality test
##
## data: clock_speed
## W = 0.91123, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 0.500 0.700 1.522 1.500 1.502 2.200
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 3.000 0.816 0.666 0.018 1.500 2.500 -1.325 0.178
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de los datos es bimodal ya que hay una cola más larga hacia la derecha, lo que indica asimetría positiva o sesgo a la derecha, en el boxplot, los bigotes se extienden hasta los valores máximos y mínimos dentro de un rango definido y se evidencia que el bigote derecho es más largo que el izquierdo, lo que confirma la asimetría positiva y se tiene un posible outlier en los valores más altos, adicionalmente, el Q-Q Plot indica que posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 1.52 con una desviación estandar de 0.82, lo que significa que los datos son moderadamente dispersos, con una mediana de 1.50, valor el cual está cerca a la media y nos sugiere que la distribución es bastante simétrica, adicionalmente, el valor mínimo del conjunto de datos es 0.50 y el máximo de 3, con un coeficiente de variación del 0.54 lo que sugiere una variabilidad relativamente baja en comparación con la media, además, el valor del sesgo es de 0.18, lo que indica que posiblemente tiene asimetría positiva y curtosis de -1.32 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.91123, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
## "Medidas descriptivas: int_memory "
## Descriptive Statistics
## data$int_memory
## N: 2000
##
## int_memory
## ----------------- ------------
## Mean 32.05
## Std.Dev 18.15
## Min 2.00
## Q1 16.00
## Median 32.00
## Q3 48.00
## Max 64.00
## MAD 23.72
## IQR 32.00
## CV 0.57
## Skewness 0.06
## SE.Skewness 0.05
## Kurtosis -1.22
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: int_memory "
## Class limits f rf rf(%) cf cf(%)
## [1.98,7.2017) 200 0.10 10.00 200 10.00
## [7.2017,12.423) 178 0.09 8.90 378 18.90
## [12.423,17.645) 177 0.09 8.85 555 27.75
## [17.645,22.867) 156 0.08 7.80 711 35.55
## [22.867,28.088) 192 0.10 9.60 903 45.15
## [28.088,33.31) 159 0.08 7.95 1062 53.10
## [33.31,38.532) 139 0.07 6.95 1201 60.05
## [38.532,43.753) 161 0.08 8.05 1362 68.10
## [43.753,48.975) 157 0.08 7.85 1519 75.95
## [48.975,54.197) 193 0.10 9.65 1712 85.60
## [54.197,59.418) 152 0.08 7.60 1864 93.20
## [59.418,64.64) 136 0.07 6.80 2000 100.00
## "Test de normalidad de Shapiro-Wilk: int_memory "
##
## Shapiro-Wilk normality test
##
## data: int_memory
## W = 0.95274, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 2.000 16.000 32.047 32.000 31.953 48.000
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 64.000 18.146 329.267 0.406 32.000 62.000 -1.218 0.058
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de los datos es uniforme, tenemos posiblemente simetría, no hay outliers, y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 32.05 con una desviación estandar de 18.15, lo que significa que los datos son moderadamente dispersos, con una mediana de 32, valor el cual está cerca a la media y nos sugiere que la distribución es bastante simétrica, adicionalmente, el valor mínimo del conjunto de datos es 2 y el máximo es 64, con un coeficiente de variación de 0.57 lo que sugiere una variabilidad moderada en comparación con la media, además, se observa que el valor del sesgo es de 0.06, valor el cual es cercano a 0, lo que indica que posiblemente es simétrico y curtosis de -1.22 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95274, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas
## "Medidas descriptivas: Megapíxeles de la cámara principal. "
## Descriptive Statistics
## data$pc
## N: 2000
##
## pc
## ----------------- ---------
## Mean 9.92
## Std.Dev 6.06
## Min 0.00
## Q1 5.00
## Median 10.00
## Q3 15.00
## Max 20.00
## MAD 7.41
## IQR 10.00
## CV 0.61
## Skewness 0.02
## SE.Skewness 0.05
## Kurtosis -1.17
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: pc "
## Class limits f rf rf(%) cf cf(%)
## [0,1.683) 205 0.10 10.25 205 10.25
## [1.683,3.367) 192 0.10 9.60 397 19.85
## [3.367,5.05) 154 0.08 7.70 551 27.55
## [5.05,6.733) 95 0.05 4.75 646 32.30
## [6.733,8.417) 208 0.10 10.40 854 42.70
## [8.417,10.1) 234 0.12 11.70 1088 54.40
## [10.1,11.78) 79 0.04 3.95 1167 58.35
## [11.78,13.47) 175 0.09 8.75 1342 67.10
## [13.47,15.15) 196 0.10 9.80 1538 76.90
## [15.15,16.83) 88 0.04 4.40 1626 81.30
## [16.83,18.52) 181 0.09 9.05 1807 90.35
## [18.52,20.2) 193 0.10 9.65 2000 100.00
## "Test de normalidad de Shapiro-Wilk: pc "
##
## Shapiro-Wilk normality test
##
## data: pc
## W = 0.95126, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 0.000 5.000 9.916 10.000 9.907 15.000
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 20.000 6.064 36.776 0.136 10.000 20.000 -1.173 0.017
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de los datos es bimodal, con posible asimétria hacía la derecha, el punto en el boxplot nos sugiere que la mediana está ligeramente desplazada hacia la izquierda de la caja, y el bigote derecho es ligeramente más largo que el izquierdo, además, hay algunos puntos fuera del bigote derecho, lo que sugiere la posible presencia de outliers en los valores más altos de “pc” y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 9.92 con una desviación estandar de 6.06, lo que significa que los datos son moderadamente dispersos, con una mediana de 10, valor el cual está cerca a la media, adicionalmente, el valor mínimo del conjunto de datos es 0 y el máximo es 20, con un coeficiente de variación de 0.61 lo que sugiere una variabilidad moderada en comparación con la media, además, se observa que el valor del sesgo es de 0.02, lo que indica que posiblemente es ligeramente asimétrico hacía la derecha y curtosis de -1.17 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95126, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas
## "Medidas descriptivas: Megapíxeles de la cámara frontal "
## Descriptive Statistics
## data$fc
## N: 2000
##
## fc
## ----------------- ---------
## Mean 4.31
## Std.Dev 4.34
## Min 0.00
## Q1 1.00
## Median 3.00
## Q3 7.00
## Max 19.00
## MAD 4.45
## IQR 6.00
## CV 1.01
## Skewness 1.02
## SE.Skewness 0.05
## Kurtosis 0.27
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: fc "
## Class limits f rf rf(%) cf cf(%)
## [0,1.5992) 719 0.36 35.95 719 35.95
## [1.5992,3.1983) 359 0.18 17.95 1078 53.90
## [3.1983,4.7975) 133 0.07 6.65 1211 60.55
## [4.7975,6.3967) 251 0.13 12.55 1462 73.10
## [6.3967,7.9958) 100 0.05 5.00 1562 78.10
## [7.9958,9.595) 155 0.08 7.75 1717 85.85
## [9.595,11.194) 113 0.06 5.65 1830 91.50
## [11.194,12.793) 45 0.02 2.25 1875 93.75
## [12.793,14.393) 60 0.03 3.00 1935 96.75
## [14.393,15.992) 23 0.01 1.15 1958 97.90
## [15.992,17.591) 30 0.01 1.50 1988 99.40
## [17.591,19.19) 12 0.01 0.60 2000 100.00
## "Test de normalidad de Shapiro-Wilk: fc "
##
## Shapiro-Wilk normality test
##
## data: fc
## W = 0.87374, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 0.000 1.000 4.310 3.000 3.942 7.000
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 19.000 4.341 18.848 0.097 6.000 19.000 0.270 1.018
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de la mayoría de los datos son demasiado bajos y tienen una cola larga, posible asimétria hacía la derecha, el punto en el boxplot nos sugiere que la mediana está desplazada hacia la izquierda de la caja, y el bigote derecho es más largo que el izquierdo, además, hay puntos fuera del bigote derecho, lo que sugiere la posible presencia de outliers en los valores más altos y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 4.31 con una desviación estandar de 4.34, lo que significa que los datos son considerablemente dispersos, con una mediana de 3, valor el cual es menor a la media y nos sugiere asimétria positiva, adicionalmente, el valor mínimo del conjunto de datos es 0 y el máximo es 19, con un coeficiente de variación de 1.01 lo que sugiere una alta variabilidad en comparación con la media, además, se observa que el valor del sesgo es de 1.02, lo que indica que posiblemente es asimétrico hacía la derecha y curtosis de 0.27 es decir que los datos tienen una distribución leptocúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.87374, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
## "Medidas descriptivas: Resolución de píxeles Altura "
## Descriptive Statistics
## data$px_height
## N: 2000
##
## px_height
## ----------------- -----------
## Mean 645.11
## Std.Dev 443.78
## Min 0.00
## Q1 282.50
## Median 564.00
## Q3 947.50
## Max 1960.00
## MAD 471.47
## IQR 664.50
## CV 0.69
## Skewness 0.67
## SE.Skewness 0.05
## Kurtosis -0.32
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: Resolución de píxeles Altura "
## Class limits f rf rf(%) cf cf(%)
## [0,164.967) 269 0.13 13.45 269 13.45
## [164.967,329.933) 320 0.16 16.00 589 29.45
## [329.933,494.9) 300 0.15 15.00 889 44.45
## [494.9,659.867) 262 0.13 13.10 1151 57.55
## [659.867,824.833) 217 0.11 10.85 1368 68.40
## [824.833,989.8) 183 0.09 9.15 1551 77.55
## [989.8,1154.77) 143 0.07 7.15 1694 84.70
## [1154.77,1319.73) 128 0.06 6.40 1822 91.10
## [1319.73,1484.7) 77 0.04 3.85 1899 94.95
## [1484.7,1649.67) 50 0.03 2.50 1949 97.45
## [1649.67,1814.63) 35 0.02 1.75 1984 99.20
## [1814.63,1979.6) 16 0.01 0.80 2000 100.00
## "Test de normalidad de Shapiro-Wilk: Resolución de píxeles Altura "
##
## Shapiro-Wilk normality test
##
## data: px_height
## W = 0.9469, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean
## 2000.000 0.000 0.000 282.750 645.108 564.000 621.618
## 3rd Qu Max Stdev Var SE Mean I.Q.R. Range
## 947.250 1960.000 443.781 196941.408 9.923 664.500 1960.000
## Kurtosis Skewness SW p-val
## -0.321 0.665 0.000
Según las gráficas podemos observar que la distribución de la mayoría de los datos son demasiado bajos y tienen una cola larga, posible asimétria hacía la derecha, el punto dentro de la caja representa la mediana en el boxplot nos sugiere que la mediana está desplazada hacia la izquierda de la caja, y el bigote derecho es más largo que el izquierdo, además, hay un punto fuera del bigote derecho, lo que sugiere la posible presencia de outliers en los valores más altos y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 645.11 con una desviación estandar de 443.78, lo que significa que los datos son considerablemente dispersos, con una mediana de 564, valor el cual es menor a la media y nos sugiere asimétria positiva, adicionalmente, el valor mínimo del conjunto de datos es 0 y el máximo es 1960, con un coeficiente de variación de 0.69 lo que sugiere una alta variabilidad en comparación con la media, además, se observa que el valor del sesgo es de 0.67, lo que indica que posiblemente es asimétrico hacía la derecha y curtosis de -0.32 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.9469, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
## "Medidas descriptivas: Ancho de resolución de píxeles "
## Descriptive Statistics
## data$px_width
## N: 2000
##
## px_width
## ----------------- ----------
## Mean 1251.52
## Std.Dev 432.20
## Min 500.00
## Q1 874.50
## Median 1247.00
## Q3 1633.00
## Max 1998.00
## MAD 557.46
## IQR 758.25
## CV 0.35
## Skewness 0.01
## SE.Skewness 0.05
## Kurtosis -1.19
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: Resolución de píxeles Altura "
## Class limits f rf rf(%) cf cf(%)
## [495,621.915) 147 0.07 7.35 147 7.35
## [621.915,748.83) 178 0.09 8.90 325 16.25
## [748.83,875.745) 176 0.09 8.80 501 25.05
## [875.745,1002.66) 158 0.08 7.90 659 32.95
## [1002.66,1129.575) 170 0.09 8.50 829 41.45
## [1129.575,1256.49) 186 0.09 9.30 1015 50.75
## [1256.49,1383.405) 171 0.09 8.55 1186 59.30
## [1383.405,1510.32) 175 0.09 8.75 1361 68.05
## [1510.32,1637.235) 146 0.07 7.30 1507 75.35
## [1637.235,1764.15) 177 0.09 8.85 1684 84.20
## [1764.15,1891.065) 156 0.08 7.80 1840 92.00
## [1891.065,2017.98) 160 0.08 8.00 2000 100.00
## "Test de normalidad de Shapiro-Wilk: Resolución de píxeles Altura "
##
## Shapiro-Wilk normality test
##
## data: px_width
## W = 0.95604, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean
## 2000.000 0.000 500.000 874.750 1251.515 1247.000 1251.566
## 3rd Qu Max Stdev Var SE Mean I.Q.R. Range
## 1633.000 1998.000 432.199 186796.362 9.664 758.250 1498.000
## Kurtosis Skewness SW p-val
## -1.188 0.015 0.000
Según las gráficas podemos observar que la distribución de los datos es uniforme y posiblemente es simétrica, el punto dentro de la caja representa la mediana en el boxplot lo que nos indica que la mediana está aproximadamente en el centro de la distribución, además, no hay outliers y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 1251.52 con una desviación estandar de 432.20, lo que significa que los datos tienen una variabilidad moderada, con una mediana de 1247, valor el cual es cercano a la media y nos sugiere simetría, adicionalmente, el valor mínimo del conjunto de datos es 500 y el máximo es 1998, con un coeficiente de variación de 0.35 lo que sugiere una baja variabilidad en comparación con la media, además, se observa que el valor del sesgo es de 0.01, lo que indica que posiblemente es simétrico y curtosis de -1.19 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95604, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
## "Medidas descriptivas: Tiempo de la batería "
## Descriptive Statistics
## data$talk_time
## N: 2000
##
## talk_time
## ----------------- -----------
## Mean 11.01
## Std.Dev 5.46
## Min 2.00
## Q1 6.00
## Median 11.00
## Q3 16.00
## Max 20.00
## MAD 7.41
## IQR 10.00
## CV 0.50
## Skewness 0.01
## SE.Skewness 0.05
## Kurtosis -1.22
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: Resolución de píxeles Altura "
## Class limits f rf rf(%) cf cf(%)
## [1.98,3.498) 193 0.10 9.65 193 9.65
## [3.498,5.017) 216 0.11 10.80 409 20.45
## [5.017,6.535) 111 0.06 5.55 520 26.00
## [6.535,8.053) 228 0.11 11.40 748 37.40
## [8.053,9.572) 100 0.05 5.00 848 42.40
## [9.572,11.09) 208 0.10 10.40 1056 52.80
## [11.09,12.61) 99 0.05 4.95 1155 57.75
## [12.61,14.13) 201 0.10 10.05 1356 67.80
## [14.13,15.64) 115 0.06 5.75 1471 73.55
## [15.64,17.16) 214 0.11 10.70 1685 84.25
## [17.16,18.68) 100 0.05 5.00 1785 89.25
## [18.68,20.2) 215 0.11 10.75 2000 100.00
## "Test de normalidad de Shapiro-Wilk: Resolución de píxeles Altura "
##
## Shapiro-Wilk normality test
##
## data: talk_time
## W = 0.94821, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 2.000 6.000 11.011 11.000 11.012 16.000
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 20.000 5.464 29.855 0.122 10.000 18.000 -1.220 0.009
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de los datos es uniforme y posiblemente es simétrica, el punto dentro de la caja representa la mediana en el boxplot lo que nos indica que la mediana está aproximadamente en el centro de la distribución, además, no hay outliers y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 11.01 con una desviación estandar de 5.46, lo que significa que los datos tienen una variabilidad moderada, con una mediana de 11, valor el cual es cercano a la media y nos sugiere simetría, adicionalmente, el valor mínimo del conjunto de datos es 2 y el máximo es 20, con un coeficiente de variación de 0.50 lo que sugiere una variabilidad moderada en comparación con la media, además, se observa que el valor del sesgo es de 0.01, lo que indica que posiblemente es simétrico y curtosis de -1.22 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95604, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
## "Tabla cruzada entre dual_sim y wifi "
##
## 0 1
## 0 495 486
## 1 491 528
## "Tabla cruzada entre dual_sim y wifi en proporciones "
##
## 0 1
## 0 0.5045872 0.4954128
## 1 0.4818449 0.5181551
##
## Pearson's Chi-squared test with Yates' continuity correction
##
## data: tabla_dual_wifi
## X-squared = 0.94526, df = 1, p-value = 0.3309
Obtenemos un p-valor de 0.3309 el cual es mayor a 0.05, NO hay evidencia estadísticamente significativa para rechazar la hipótesis nula y nos indica que no hay relación significativa entre las variables en dual sim y wifi, es decir, los datos no muestran una asociación clara.
##
## Wilcoxon rank sum test with continuity correction
##
## data: battery_power by three_g
## W = 357419, p-value = 0.5972
## alternative hypothesis: true location shift is not equal to 0
El p-valor es 0.5972, el cual es mayor (p > 0.05), por lo que no se rechaza la hipótesis nula, ya que No hay suficiente evidencia para decir que los grupos son diferentes.
ram según four_g (Celulares con y sin 4G)
##
## Wilcoxon rank sum test with continuity correction
##
## data: ram by four_g
## W = 495130, p-value = 0.7598
## alternative hypothesis: true location shift is not equal to 0
El p-valor es 0.7598, el cual es mayor (p > 0.05), por lo que no se rechaza la hipótesis nula, ya que No hay suficiente evidencia para decir que los grupos son diferentes.
Boxplot para visualizar la distribución de ram por rango de precio de
celular
##
## Kruskal-Wallis rank sum test
##
## data: ram by price_range
## Kruskal-Wallis chi-squared = 1681.5, df = 3, p-value < 2.2e-16
En el gráfico podemos observar que el precio de los celulares respecto a la ram, para el caso de la gama baja, tenemos que el valor de la media es inferior a 1000, pero encontramos outliers que son superiores respecto a la media de los celulares de gama media, por otro lado, los celulares de esta gama, su media se encuentran cercana a 2000 y no presenta outliers, en cambio en el caso, de la gama alta, se tiene una media entre 2000 y 3000, con 1 outlier en la parte superior el cual el valor es muy cercano a 4000, es decir es superior al valor de la media de los dispositivos de gama muy alta, adicionalmente, encontramos otros outliers, en la parte inferior entre 1000 y 2000, en los cuales está cercano a los dispositivos de gama media, por último, los dispositivios de gama muy alta, tienen una media entre 3000 y 4000, con outliers cercanos a la media de los dispositivos de gama alta.
Tenemos un p-value de 2.2e-16, el cual es menor a 0.05, por lo que se rechaza la hipótesis nula e indica que al menos un grupo es significativamente diferente de los demás en términos de ram.
## Tabla ANOVA respecto a la velocidad del microprocesador y la ram
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## ram 1 0 0.0158 0.024 0.878
## Residuals 1998 1331 0.6662
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova_speed_ram
## BP = 5.4721, df = 1, p-value = 0.01932
Al realizar la prueba de Breusch-Pagan el p valor fue de 0.9794, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto a la velocidad del microprocesador y los núcleos
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## n_cores 1 0 0.0436 0.065 0.798
## Residuals 1998 1331 0.6662
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova_speed_ram
## BP = 0.4413, df = 1, p-value = 0.5065
Al realizar la prueba de Breusch-Pagan el p valor fue de 0.6879, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto a la altura y si es táctil
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## touch_screen 1 14 14.23 0.801 0.371
## Residuals 1998 35471 17.75
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_sc_h_touch
## BP = 0.12482, df = 1, p-value = 0.7239
Al realizar la prueba de Breusch-Pagan el p valor fue de 0.7239, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto al poder de la batería y el tiempo de batería
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## talk_time 1 1064287 1064287 5.524 0.0188 *
## Residuals 1998 384919344 192652
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_battery
## BP = 0.55791, df = 1, p-value = 0.4551
Al realizar la prueba de Breusch-Pagan el p valor fue de 0.4551, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto al poder de la batería y la memoria interna
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## int_memory 1 6187 6187 0.032 0.858
## Residuals 1998 385977444 193182
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_batt_mem
## BP = 0.86427, df = 1, p-value = 0.3525
Al realizar la prueba de Breusch-Pagan el p valor fue de 0.3525, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## [1] 21
## [,1] [,2]
## [1,] 1 2
## [2,] 1 3
## [3,] 1 4
## [4,] 1 5
## [5,] 1 6
## [6,] 1 7
## [,1] [,2]
## [1,] 1 2
## [2,] 1 2
## [3,] 1 2
## [4,] 1 1
## [5,] 1 1
## [6,] 1 3
En el ejercicio de la asignación de la probabilidad de selección de muestra se propone el siguiente vector de probabilidades.
## [1] 0.0012394713 0.0019010936 0.0051323664 0.0089478196 0.0070264419
## [6] 0.0003545061
## La suma de p es:
## [1] 1
## [1] FALSE FALSE FALSE FALSE FALSE FALSE
Lo anterior, con el fin de establecer la inclusión a partir de la función indicadora en la selección de la muestra. Se utiliza la función I_k
## [,1] [,2]
## [1,] 1 2
## [2,] 1 2
## [3,] 1 2
## [4,] 1 1
## [5,] 1 1
## [6,] 1 3
## X1 X2 p X1.1 X2.1 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16
## 1 1 2 0.0012394713 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 2 1 2 0.0019010936 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
## 3 1 2 0.0051323664 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
## 4 1 1 0.0089478196 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## 5 1 1 0.0070264419 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
## 6 1 3 0.0003545061 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
## X17 X18 X19 X20 X21
## 1 0 0 0 0 0
## 2 0 0 0 0 0
## 3 0 0 0 0 0
## 4 0 0 0 0 0
## 5 0 0 0 0 0
## 6 0 0 0 0 0
Para la probabilidad de inclusión de cada uno de los elementos, es suficiente realizar el producto entre la probabilidad de selección de muestra p y la función indicadora
## [1] 0.10275612 0.08842468 0.07516065 0.10121523 0.10921212 0.10561863
## [7] 0.07954948 0.10383372 0.09293335 0.08471959 0.09806052 0.10092156
## [13] 0.08468334 0.10184632 0.08969803 0.09838451 0.08539328 0.09872885
## [19] 0.10114455 0.10443491 0.09328058
Existe la función Pk para encontrar dicha probabilidad
## [,1] [,2] [,3] [,4] [,5] [,6] [,7]
## [1,] 0.1027561 0.08842468 0.07516065 0.1012152 0.1092121 0.1056186 0.07954948
## [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,] 0.1038337 0.09293335 0.08471959 0.09806052 0.1009216 0.08468334 0.1018463
## [,15] [,16] [,17] [,18] [,19] [,20] [,21]
## [1,] 0.08969803 0.09838451 0.08539328 0.09872885 0.1011445 0.1044349 0.09328058
Para la probabilidad de inclusión de grado II, se utiliza la función Pikl
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] 0.102756122 0.001239471 0.001901094 0.005132366 0.008947820 0.007026442
## [2,] 0.001239471 0.088424675 0.003908250 0.005462263 0.002653068 0.007494029
## [3,] 0.001901094 0.003908250 0.075160653 0.002734287 0.003578312 0.008485092
## [4,] 0.005132366 0.005462263 0.002734287 0.101215227 0.004133281 0.009624871
## [5,] 0.008947820 0.002653068 0.003578312 0.004133281 0.109212116 0.006377044
## [6,] 0.007026442 0.007494029 0.008485092 0.009624871 0.006377044 0.105618634
## [,7] [,8] [,9] [,10] [,11] [,12]
## [1,] 0.0003545061 0.008763163 0.001057142 0.006529139 0.005500772 0.008070604
## [2,] 0.0002854413 0.003574899 0.007189396 0.002472201 0.005099304 0.003111731
## [3,] 0.0012712882 0.007806515 0.005089391 0.001521902 0.001394619 0.003096005
## [4,] 0.0033378282 0.003463257 0.006208089 0.003058163 0.008693583 0.003702447
## [5,] 0.0002295064 0.007681072 0.006547460 0.007036437 0.008246084 0.004555561
## [6,] 0.0078481353 0.001459609 0.008053919 0.003267473 0.003486949 0.001684241
## [,13] [,14] [,15] [,16] [,17] [,18]
## [1,] 0.003911809 0.006701174 0.004695970 0.0079847911 0.0044177173 0.006612322
## [2,] 0.001426053 0.008524180 0.005019247 0.0061648199 0.0084400769 0.001946033
## [3,] 0.003236337 0.001943881 0.003035796 0.0005254251 0.0005997091 0.005131140
## [4,] 0.006609794 0.007757918 0.001043382 0.0062600768 0.0018234199 0.003781729
## [5,] 0.003397889 0.008670752 0.005678851 0.0048252189 0.0081846445 0.008095912
## [6,] 0.008834684 0.007058217 0.003486632 0.0041664590 0.0026877124 0.004886981
## [,19] [,20] [,21]
## [1,] 0.005323561 0.001761355 0.0068249041
## [2,] 0.001566921 0.004852064 0.0079952272
## [3,] 0.001052628 0.009661975 0.0091870089
## [4,] 0.002703014 0.008995378 0.0066900795
## [5,] 0.003391984 0.005253534 0.0017276867
## [6,] 0.001747672 0.007377980 0.0005644932
## [,1]
## [1,] 0
## [2,] 0
## [3,] 0
## [4,] 0
## [5,] 0
## [6,] 0
## # A tibble: 2 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 1954 0 0.5 24 4 700 1 1
## 2 769 1 2.9 9 5 3946 1 0
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
## [1] 0.28757752 0.78830514 0.40897692 0.88301740 0.94046728 0.04555650
## [7] 0.52810549 0.89241904 0.55143501 0.45661474 0.95683335 0.45333416
## [13] 0.67757064 0.57263340 0.10292468 0.89982497 0.24608773 0.04205953
## [19] 0.32792072 0.95450365 0.88953932
## $Ksel
## [1] 14
##
## $ns
## [1] 1
## # A tibble: 1 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 803 1 2.1 17 4 2680 0 1
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
Para realizar el proceso de estimación a partir de la muestra, es necesario, nombrar las columnas de las muestras
## # A tibble: 1 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 803 1 2.1 17 4 2680 0 1
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
Para las estimaciones se utiliza la funcion E.BE
1.1 Estimacion del total del poder de la batería
## N y
## Estimation 8.285004 6652.858
## Standard Error 7.768931 6238.452
## CVE 93.770998 93.771
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 6652.858 38918279 6238.452 93.771 NaN NaN NA
Tenemos un valor total de 6652.858, con una varianza del estimador de 38918279, valor el cual es demasiado alto y nos indica dispersión en los datos, el cual nos ayuda a evaluar que tal funciona estimar la proporción, con un error estándar de 6238.45% el cual nos indica que no hay precisión y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.
1.2 Estimacion del total de la memoria interna
## N y
## Estimation 8.285004 140.8451
## Standard Error 7.768931 132.0718
## CVE 93.770998 93.7710
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 140.8451 17442.97 132.0718 93.771 NaN NaN NA
Tenemos un valor total de 140.8451 , con una varianza del estimador de 17442.97, el cual nos ayuda a evaluar que tal funciona estimar la proporción y tenemos que es un valor muy alto por lo que podemos decir que los datos son muy dispersos,un error estándar de 132.07% el cual nos indica que no tenemos precisión y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.
1.3 Estimacion del total de la ram
## N y
## Estimation 8.285004 22203.811
## Standard Error 7.768931 20820.735
## CVE 93.770998 93.771
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 22203.81 433503014 20820.74 93.771 NaN NaN NA
Tenemos un valor total de 22203.81, con una varianza del estimador de 433503014, el cual nos ayuda a evaluar que tal funciona estimar la proporción y este valor tan grande nos indica que no tenemos buena dispersió, un error estándar de 20820.74, valor que nos indica que no hay buena precisión y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.
1.4 Estimacion del total de la altura de la resolución de los megapixeles
## N y
## Estimation 8.285004 2850.041
## Standard Error 7.768931 2672.512
## CVE 93.770998 93.771
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 2850.041 7142322 2672.512 93.771 NaN NaN NA
Tenemos un valor total de 2850.041, con una varianza del estimador de 7142322, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y un error estándar de 2672.512 nos indica que hay baja precisión y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.
1.5 Estimacion del total de la altura de la altura de la pantalla
## N y
## Estimation 8.285004 57.99503
## Standard Error 7.768931 54.38252
## CVE 93.770998 93.77100
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 57.99503 2957.458 54.38252 93.771 NaN NaN NA
Tenemos un valor total de 57.99503, con una varianza del estimador de 2957.458, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y nos da un error estándar de 54.38% el cual nos indica que no es preciso y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.
2.1 Estimación de la batería promedio
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 803 0 0 0 NaN NaN
Tenemos un valor promedio de 1215.095, con una varianza del estimador de 749.0558, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y nos da un error estándar de 27.368% el cual nos indica que no es preciso y un coeficiente de variación del estimador de 2.252407% que nos indica que no es precisa, con intervalos de confianza inferior de 1161.45 e intervalos de confianza superior de 1268.74.
2.2 Estimación de la memoria interna
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 17 0 0 0 NaN NaN
Tenemos un valor promedio de 31.76%, con una varianza del estimador de 1.098%, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso nos indica que no son tan dispersos, y nos da un error estándar de 1.04% el cual nos indica que es preciso y un coeficiente de variación del estimador de 3.3% que nos indica que hay buena precisión, con intervalos de confianza inferior de 29.70% e intervalos de confianza superior de 33.81%, la distancia que hay en los intervalos de confianza no varía mucho, por lo que podemos decir que no hay demasiada dispersión.
2.3 Estimación de la ram
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 2680 0 0 0 NaN NaN
Tenemos un valor promedio de 2156.28%, con una varianza del estimador de 4243.67%, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso nos indica que son demasiado dispersos, y nos da un error estándar de 65.14% el cual nos indica que no es preciso y un coeficiente de variación del estimador de 3.02% que nos indica que hay buena precisión, con intervalos de confianza inferior de 2028.598% e intervalos de confianza superior de 2283.956%, la distancia que hay en los intervalos de confianza varían mucho, por lo que podemos decir que hay demasiada dispersión.
2.4 Estimación de la altura de la resolución de los megapixeles
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 344 0 0 0 NaN NaN
Tenemos un valor promedio de 607.7975%, con una varianza del estimador de 622.9393%, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso nos indica que son demasiado dispersos, y nos da un error estándar de 24.95875% el cual nos indica que no es preciso y un coeficiente de variación del estimador de 4.1% que nos indica que hay buena precisión, con intervalos de confianza inferior de 558.88% e intervalos de confianza superior de 656.72%, la distancia que hay en los intervalos de confianza varían mucho, por lo que podemos decir que hay demasiada dispersión.
2.5 Estimación de la altura de la pantalla
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 7 0 0 0 NaN NaN
Tenemos un valor promedio de 12.55%, con una varianza del estimador de 0.067%, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso nos indica que no son dispersos, y nos da un error estándar de 0.26% el cual nos indica que es preciso y un coeficiente de variación del estimador de 2.05% que nos indica que hay buena precisión, con intervalos de confianza inferior de 12.04% e intervalos de confianza superior de 13.06%, la distancia que hay en los intervalos de confianza varían mucho, por lo que podemos decir que no hay gran dispersión.
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 200.75 0 0 0 NaN NaN
El ratio nos indica que en promedio, el poder de la batería es 115.27 mayor que el tiempo de la batería, con una varianza estimada del total de 19.25, valor el cual es alto y nos indica que hay dispersión, un error estándar de 4.39 indica que es precisa y un coeficiente de variación de 3.80%, es confiable, en los límites de confianza de 106.67% como el inferior y de 123.87% como el superior, vemos que la distancia entre los intervalos es muy grande entonces podemos decir que hay gran dispersión.
3.2 Estimación de la razón entre la altura de la resolución de los megapixeles Vs el ancho de la resolución de los megapixeles
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 0.2388889 0 0 0 NaN NaN
El ratio nos indica que en promedio, la altura de la resolución de los megapixeles es 0.503 mayor que el ancho de la resolución de los megapixeles, con una varianza estimada del total de 0.00034, valor el cual es bajo y nos indica que no hay dispersión, un error estándar de 0.018 indica que es precisa y un coeficiente de variación de 3.69%, es confiable, en los límites de confianza de 0.47% como el inferior y de 0.54% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que no hay demasiada dispersión.
La razón comparación de magnitudes entre la altura de la pantalla Vs el ancho de la pantalla
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 7 0 0 0 NaN NaN
El ratio nos indica que en promedio, la altura de la pantalla es 2.19 mayor que el ancho de la pantalla, con una varianza estimada del total de 0.007, valor el cual es bajo y nos indica que no hay dispersión, un error estándar de 0.086 indica que es precisa y un coeficiente de variación de 3.92%, es confiable, en los límites de confianza de 2.03% como el inferior y de 2.36% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que no hay demasiada dispersión.
## $Estimation
## Uz prop Vest e.e Cve IC.inf IC.sup
## 1 0 0.493 0.000109891 0.01048289 2.126347 0.4724539 0.5135461
## 2 1 0.507 0.000109891 0.01048289 2.067631 0.4864539 0.5275461
Nos indica la proporción para los que no tienen wifi de 0.493, en cambio los que si tienen de 0.507, con una varianza del estimador de 0.000109891 para los que no tiene wifi y para los que si, en el caso de los errores estándar el valor también es igual para ambos casos 0.01048289, con un coeficiente de variación del estimador de 2.126347 para quienes no tiene wifi y de 2.067631 para los que si, en unos intervalos de confianza, inferior de 0.4723212 y superior de 0.5135461 para los dispositivos sin wifi y de los intervalos son: inferior de 0.4863212 y superior de 0.5276788.
## [1] 2000
## $n
## [1] 327
##
## $no
## [1] 391
Se utiliza la función S.SI de TeachingSampling para obtener una muestra MAS.
## [,1]
## [1,] 0
## [2,] 0
## [3,] 3
## [4,] 4
## [5,] 0
## [6,] 0
## $Ksel
## [1] 7 10 12 14 19 24 29 38 39 42 49 51 52 58 76
## [16] 84 91 92 102 103 104 112 120 125 129 134 137 141 144 158
## [31] 162 165 172 174 175 182 184 197 201 217 222 224 227 232 238
## [46] 246 270 275 286 289 294 295 300 304 314 315 337 340 344 350
## [61] 371 372 374 385 391 393 395 397 401 402 403 406 411 425 426
## [76] 428 429 444 458 469 471 486 494 500 510 525 527 533 534 535
## [91] 536 540 542 552 563 564 571 580 588 593 594 601 608 612 617
## [106] 628 629 632 633 634 647 651 661 673 680 687 688 701 702 705
## [121] 706 710 711 715 729 736 737 741 746 749 759 762 774 775 783
## [136] 812 821 827 830 831 832 846 849 851 853 858 884 890 892 901
## [151] 902 907 909 915 918 926 932 936 938 941 947 954 956 972 974
## [166] 978 981 996 1000 1002 1012 1013 1020 1022 1040 1048 1055 1056 1063 1066
## [181] 1069 1073 1075 1089 1104 1107 1114 1116 1123 1130 1134 1136 1139 1145 1155
## [196] 1167 1170 1178 1180 1189 1210 1214 1219 1223 1239 1240 1246 1251 1252 1253
## [211] 1256 1259 1269 1276 1277 1285 1290 1294 1310 1333 1335 1341 1342 1343 1363
## [226] 1369 1378 1379 1383 1393 1398 1404 1405 1409 1411 1413 1415 1421 1450 1451
## [241] 1458 1465 1466 1470 1474 1479 1481 1489 1498 1507 1516 1535 1536 1541 1545
## [256] 1548 1557 1559 1577 1599 1600 1610 1611 1623 1625 1631 1637 1638 1641 1644
## [271] 1654 1657 1658 1659 1660 1677 1683 1686 1691 1692 1698 1700 1706 1712 1713
## [286] 1716 1718 1721 1732 1733 1736 1739 1740 1742 1744 1769 1772 1796 1799 1803
## [301] 1812 1814 1816 1825 1829 1835 1837 1852 1872 1876 1879 1882 1887 1892 1893
## [316] 1896 1900 1912 1924 1925 1928 1947 1966 1971 1991 1995 2000
La muestra seleccionada finalmente es la muestra 2, se procede a visualizar la muestra y hacer estimaciones, la cual es de dimensión 327 observaciones y 21 variables.
## # A tibble: 327 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 1821 0 1.7 10 8 3220 0 1
## 2 509 1 0.6 9 5 513 1 1
## 3 1520 1 2.2 33 8 3826 0 1
## 4 803 1 2.1 17 4 2680 0 1
## 5 1131 1 0.5 49 5 1835 1 1
## 6 1602 1 2.8 38 3 1037 1 1
## 7 1453 0 1.6 52 2 2373 1 1
## 8 1725 1 1.6 6 2 3429 1 1
## 9 790 0 2 11 6 3169 1 1
## 10 1646 1 2.3 41 2 3339 0 1
## # ℹ 317 more rows
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
## [1] 327 21
Para la estimación de los parámetros poblacionales renombramos las columnas del dataframe de la muestra.
## # A tibble: 6 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 1821 0 1.7 10 8 3220 0 1
## 2 509 1 0.6 9 5 513 1 1
## 3 1520 1 2.2 33 8 3826 0 1
## 4 803 1 2.1 17 4 2680 0 1
## 5 1131 1 0.5 49 5 1835 1 1
## 6 1602 1 2.8 38 3 1037 1 1
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
## $Estimation
## Uz prop Vest e.e Cve IC.inf IC.sup
## 1 o 0.2507645 0.0004820952 0.02195667 8.755890 0.2077303 0.2937988
## 2 1 0.2415902 0.0004701448 0.02168282 8.975042 0.1990927 0.2840878
## 3 2 0.2477064 0.0004781597 0.02186686 8.827734 0.2048482 0.2905647
## 4 3 0.2599388 0.0004936136 0.02221742 8.547171 0.2163935 0.3034842
La proporción de los rangos de precio bajo es de 0.23%, con un varianza estimada del total de la población de 0.00047%, el cual nos sugiere buena precisión, con un error estándar de 0.021% el cual nos dice que hay buena precisión y un coeficiente de variación de 9.05% nos indica que son poco precisas, los límites de confianza se encuentra en 0.196% el límite inferior y el superior es de 0.28%, el cual no es tan amplio y nos sugiere mejor confianza en la estimación.
La proporción del rango de precio 2 (medio) es de 0.25%, con una varianza estimada del total de 0.00048%, lo que nos indica buena precisión, un eror estándar de 0.022% diciendonos que tiene buena precisión y un coeficiente de variación de 8.76%, el cual es alto y nos indica precisión estable, los límites de confianza se encuentra en 0.21% el límite inferior y el superior es de 0.29%, no son tan lejanos por lo que podemos decir que no hay gran dispersión.
La proporción de los rangos de precio bajo es de 0.26%, con un varianza estimada del total de la población de 0.00049%, el cual nos sugiere buena precisión, con un error estándar de 0.022% el cual nos dice que hay buena precisión y un coeficiente de variación de 8.61% nos indica que son poco precisas, los límites de confianza se encuentra en 0.21% el límite inferior y el superior es de 0.30%, el cual no es tan amplio y nos sugiere mejor confianza en la estimación.
La proporción de los rangos de precio bajo es de 0.25%, con un varianza estimada del total de la población de 0.00049%, el cual nos sugiere buena precisión, con un error estándar de 0.022% el cual nos dice que hay buena precisión y un coeficiente de variación de 8.685% nos indica que son poco precisas, los límites de confianza se encuentra en 0.21% el límite inferior y el superior es de 0.30%, el cual no es tan amplio y nos sugiere mejor confianza en la estimación.
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 1224.284 508.4189 22.54815 1.841741 1180.091 1268.478
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## 1 2448569 2033675666 45096.29 1.841741 2360182 2536956
La media del poder de la batería es de 1209.737 con una varianza del estimador de 493.71%, el cual evalúa como funciona estimar la proporción, nos dice que es un valor alto y nos indica que son muy dispersos, un error estándar de 22.22% nos dice que la estimación no es precisa y un coeficiente de variación del estimador de 1.83%, el cual nos indica que es confiable en los intervalos de confianza 1166.19 para el límite inferior y 1253.287 para el límite superior indicando que las distancias son lejanas entonces tendríamos gran dispersión.
La sumatoria total de la caracteristica de poder de la batería es de 2419474 con una varianza del estimador de 1974835659, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 44439.12 y nos dice que no es precisa, ya que esta demasiado alto y un coeficiente de variación del estimador de 1.83%, el cual nos indica que es confiable en los intervalos de confianza 2332375 para el límite inferior y 2506573 para el límite superior.
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 32.8318 0.7809574 0.8837179 2.691652 31.09975 34.56386
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## 1 65663.61 3123829 1767.436 2.691652 62199.5 69127.72
La media de la memoria interna es de 32.70% con una varianza del estimador de 0.91%, el cual evalúa como funciona estimar la proporción, nos dice que es un valor bajo y nos indica que no son muy dispersos, un error estándar de 0.95% nos dice que la estimación es precisa y un coeficiente de variación del estimador de 2.9%, el cual nos indica que es confiable en los intervalos de confianza 30.83% para el límite inferior y 34.57% para el límite superior indicando que las distancias son lejanas entonces tendríamos gran dispersión.
La sumatoria total de la caracteristica de la memoria interna es de 65400.61% con una varianza del estimador de 3630707%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 1905.441, nos dice que no es precisa, ya que esta demasiado alto y un coeficiente de variación del estimador de 2.9%, el cual nos indica que es confiable en los intervalos de confianza 61666.02% para el límite inferior y 69135.21% para el límite superior.
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 9.874618 0.09814848 0.3132866 3.172645 9.260587 10.48865
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## 1 19749.24 392593.9 626.5732 3.172645 18521.17 20977.3
La media de los megapixeles de la cámara principal es de 10.07% con una varianza del estimador de 0.096%, el cual evalúa como funciona estimar la proporción, nos dice que es un valor bajo y nos indica que no son muy dispersos, un error estándar de 0.31% nos dice que la estimación es precisa y un coeficiente de variación del estimador de 3.08%, el cual nos indica que es confiable en los intervalos de confianza 9.46% para el límite inferior y 10.68% para el límite superior indicando que las distancias son lejanas entonces tendríamos gran dispersión.
La sumatoria total de los megapixeles de la cámara principal es de 20140.67% con una varianza del estimador de 385108.7%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 620.5712, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 3.08%, el cual nos indica que es confiable en los intervalos de confianza 18924.38% para el límite inferior y 21356.97% para el límite superior.
## [1] "Estimación del dominio universal =estm.Ud"
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## o 550367.0 2781289068 52737.93 9.582321 447002.5 653731.4
## 1 584434.3 3278215819 57255.71 9.796774 472215.1 696653.4
## 2 622899.1 3555671396 59629.45 9.572891 506027.5 739770.7
## 3 690868.5 3928635341 62678.83 9.072468 568020.3 813716.7
La sumatoria total de los megapixeles de la cámara principal es de 559322.3% respecto al rango de precio 0 (bajo), con una varianza del estimador de 4108930290%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 64100.94%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.4%, el cual nos indica que no es confiable en los intervalos de confianza 433686.8% para el límite inferior y 684957.8% para el límite superior.
La sumatoria total de los megapixeles de la cámara principal es de 592264.5% respecto al rango de precio 1 (medio), con una varianza del estimador de 4545383650%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 67419.46%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.38%, el cual nos indica que no es confiable en los intervalos de confianza 460124.7% para el límite inferior y 724404.2% para el límite superior.
La sumatoria total de los megapixeles de la cámara principal es de 610900.8% respecto al rango de precio 2 (alto), con una varianza del estimador de 4810034610%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 69354.41%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.35%, el cual nos indica que no es confiable en los intervalos de confianza 474968.7% para el límite inferior y 746833% para el límite superior.
La sumatoria total de los megapixeles de la cámara principal es de 667702.5% respecto al rango de precio 3 (muy alto), con una varianza del estimador de 5675953437%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 75338.92%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.28%, el cual nos indica que no es confiable en los intervalos de confianza 520040.9% para el límite inferior y 815364.1% para el límite superior.
## [1] "Estimación del dominio universal =estm.Ud"
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## o 2042.813 74290.17 272.5622 13.34249 1508.601 2577.026
## 1 1810.398 70749.97 265.9887 14.69228 1289.069 2331.726
## 2 2489.297 104534.74 323.3183 12.98834 1855.604 3122.989
## 3 2348.624 99909.32 316.0843 13.45828 1729.110 2968.138
La sumatoria total de los megapixeles de la cámara frontal es de 2049.587% respecto al rango de precio 0 (bajo), con una varianza del estimador de 110676.1%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 332.6802%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 16.23%, el cual nos indica que no es confiable en los intervalos de confianza 1397.55% para el límite inferior y 2701.63% para el límite superior.
La sumatoria total de los megapixeles de la cámara frontal es de 2066.116% respecto al rango de precio 1 (medio), con una varianza del estimador de 110669.1%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 332.6697%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 16.10%, el cual nos indica que no es confiable en los intervalos de confianza 1414.095% para el límite inferior y 2718.136% para el límite superior.
La sumatoria total de los megapixeles de la cámara frontal es de 2239.669% respecto al rango de precio 2 (alto), con una varianza del estimador de 122110.8%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 349.4435%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 15.60%, el cual nos indica que no es confiable en los intervalos de confianza 1554.77% para el límite inferior y 2924.56% para el límite superior.
La sumatoria total de los megapixeles de la cámara frontal es de 667702.5% respecto al rango de precio 3 (muy alto), con una varianza del estimador de 5675953437%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 75338.92%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.28%, el cual nos indica que no es confiable en los intervalos de confianza 520040.9% para el límite inferior y 815364.1% para el límite superior.
## [1] "Estimación del dominio universal =estm.Ud"
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## o 784.7095 6653.923 81.57158 10.395132 624.8321 944.5868
## 1 729.0520 6009.771 77.52271 10.633359 577.1103 880.9937
## 2 775.5352 6321.218 79.50609 10.251771 619.7061 931.3642
## 3 781.6514 6085.226 78.00786 9.979879 628.7588 934.5440
La sumatoria total de la velocidad del procesador es de 809.09% respecto al rango de precio 0 (bajo), con una varianza del estimador de 9511.02%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 97.52%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 12.05%, el cual nos indica que no es confiable en los intervalos de confianza 617.94% para el límite inferior y 1000.23% para el límite superior.
La sumatoria total de la velocidad del procesador es de 780.16% respecto al rango de precio 1 (medio), con una varianza del estimador de 9231.97%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 96.08%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 12.31%, el cual nos indica que no es confiable en los intervalos de confianza 591.85% para el límite inferior y 968.48% para el límite superior.
La sumatoria total de la velocidad del procesador es de 736.36% respecto al rango de precio 2 (alto), con una varianza del estimador de 8377.64%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 91.52%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 12.42%, el cual nos indica que no es confiable en los intervalos de confianza 556.97% para el límite inferior y 915.76% para el límite superior.
La sumatoria total de la velocidad del procesador es de 722.31% respecto al rango de precio 3 (muy alto), con una varianza del estimador de 8202.20%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 90.56%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 12.53%, el cual nos indica que no es confiable en los intervalos de confianza 544.81% para el límite inferior y 899.82% para el límite superior.
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 0.008804994 6.908386e-08 0.0002628381 2.985102 0.008289841 0.009320147
El ratio nos indica que en promedio, el tiempo de la batería es 0.0087 mayor que el poder de la batería, con una varianza estimada del total de la población de 1.09465e-07, valor el cual es bajo y nos indica que es estable, un error estándar de 0.00033 indica que es precisa y un coeficiente de variación de 3.81%, es confiable, en los límites de confianza de 0.008% como el inferior y de 0.0093% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que es precisa y confiable.
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 0.003663147 1.143e-08 0.0001069112 2.918562 0.003453605 0.003872689
El ratio nos indica que en promedio, la profundidad del dispositivo es 0.0038 mayor que el ancho del dispositivo, con una varianza estimada del total de la población de 1.637805e-08 , valor el cual es bajo y nos indica que es estable, un error estándar de 0.00012 indica que es precisa y un coeficiente de variación de 3.33%, es confiable, en los límites de confianza de 0.0036% como el inferior y de 0.0041% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que es precisa y confiable.
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 21.38219 0.6360173 0.7975069 3.729771 19.81911 22.94528
El ratio nos indica que en promedio, la memoria interna es 20.84056 mayor que la velocidad del microprocesador, con una varianza estimada del total de la población de 0.9824306, valor el cual es bajo y nos indica que es estable, un error estándar de 0.9912 indica que es precisa y un coeficiente de variación de 4.76%, es confiable, en los límites de confianza de 0.0036% como el inferior y de 22.78% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que es precisa y confiable.