tle: “Avance Proyecto II” |
thor: “Jenny Moceton” |
te: “2025-02-22” |
tput: html_document |
En la actualiad, encontramos varias empresas de ceulares como lo puede ser Apple, Samsung, Oppo, y muchas más, las cuales tienen a la venta diversas gamas de celulares, como gama baja, media, alta y muy alta, las cuales se clasifican dependiendo de la velocidad del microprocesador, los megapixeles de las cámaras tanto frontal como de la trasera, el número de nucleos del procesador, la ram, el tiempo de carga y demás variables. Por lo que en el presente análisis buscamos caracterizar el rango de precios y lograr estimar muestras significativas de la misma,de una base de datos de Kaggle, la cual recopiló datos de ventas de teléfonos móviles de varias empresas.
battery_power
:
clock_speed
:
int_memory
:
ram
:
fc
:
pc
:
px_height
:
px_width
:
m_dep
:
mobile_wt
:
sc_h
:
sc_w
:
talk_time
:
bluetooth
:
dual_sim
:
three_g
:
four_g
:
touch_screen
:
wifi
:
n_cores
:
price_range
:
Importamos la base de datos y renombramos para trabajar en un análisis descriptivo
## # A tibble: 6 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 842 0 2.2 7 2 2549 0 0
## 2 1021 1 0.5 53 3 2631 1 1
## 3 563 1 0.5 41 5 2603 1 1
## 4 615 1 2.5 10 6 2769 0 1
## 5 1821 1 1.2 44 2 1411 0 1
## 6 1859 0 0.5 22 1 1067 1 1
## # ℹ 13 more variables: four_g <dbl>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <dbl>, wifi <dbl>, price_range <dbl>
## # A tibble: 6 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 858 0 2.2 50 1 3978 0 1
## 2 794 1 0.5 2 6 668 1 1
## 3 1965 1 2.6 39 4 2032 1 1
## 4 1911 0 0.9 36 8 3057 1 1
## 5 1512 0 0.9 46 5 869 0 1
## 6 510 1 2 45 6 3919 1 1
## # ℹ 13 more variables: four_g <dbl>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <dbl>, wifi <dbl>, price_range <dbl>
## [1] 2000 21
## battery_power bluetooth clock_speed int_memory n_cores
## 0 0 0 0 0
## ram dual_sim three_g four_g fc
## 0 0 0 0 0
## pc px_height px_width m_dep mobile_wt
## 0 0 0 0 0
## sc_h sc_w talk_time touch_screen wifi
## 0 0 0 0 0
## price_range
## 0
## battery_power bluetooth clock_speed int_memory
## Min. : 501.0 Min. :0.000 Min. :0.500 Min. : 2.00
## 1st Qu.: 851.8 1st Qu.:0.000 1st Qu.:0.700 1st Qu.:16.00
## Median :1226.0 Median :0.000 Median :1.500 Median :32.00
## Mean :1238.5 Mean :0.495 Mean :1.522 Mean :32.05
## 3rd Qu.:1615.2 3rd Qu.:1.000 3rd Qu.:2.200 3rd Qu.:48.00
## Max. :1998.0 Max. :1.000 Max. :3.000 Max. :64.00
## n_cores ram dual_sim three_g
## Min. :1.000 Min. : 256 Min. :0.0000 Min. :0.0000
## 1st Qu.:3.000 1st Qu.:1208 1st Qu.:0.0000 1st Qu.:1.0000
## Median :4.000 Median :2146 Median :1.0000 Median :1.0000
## Mean :4.521 Mean :2124 Mean :0.5095 Mean :0.7615
## 3rd Qu.:7.000 3rd Qu.:3064 3rd Qu.:1.0000 3rd Qu.:1.0000
## Max. :8.000 Max. :3998 Max. :1.0000 Max. :1.0000
## four_g fc pc px_height
## Min. :0.0000 Min. : 0.000 Min. : 0.000 Min. : 0.0
## 1st Qu.:0.0000 1st Qu.: 1.000 1st Qu.: 5.000 1st Qu.: 282.8
## Median :1.0000 Median : 3.000 Median :10.000 Median : 564.0
## Mean :0.5215 Mean : 4.309 Mean : 9.916 Mean : 645.1
## 3rd Qu.:1.0000 3rd Qu.: 7.000 3rd Qu.:15.000 3rd Qu.: 947.2
## Max. :1.0000 Max. :19.000 Max. :20.000 Max. :1960.0
## px_width m_dep mobile_wt sc_h
## Min. : 500.0 Min. :0.1000 Min. : 80.0 Min. : 5.00
## 1st Qu.: 874.8 1st Qu.:0.2000 1st Qu.:109.0 1st Qu.: 9.00
## Median :1247.0 Median :0.5000 Median :141.0 Median :12.00
## Mean :1251.5 Mean :0.5018 Mean :140.2 Mean :12.31
## 3rd Qu.:1633.0 3rd Qu.:0.8000 3rd Qu.:170.0 3rd Qu.:16.00
## Max. :1998.0 Max. :1.0000 Max. :200.0 Max. :19.00
## sc_w talk_time touch_screen wifi
## Min. : 0.000 Min. : 2.00 Min. :0.000 Min. :0.000
## 1st Qu.: 2.000 1st Qu.: 6.00 1st Qu.:0.000 1st Qu.:0.000
## Median : 5.000 Median :11.00 Median :1.000 Median :1.000
## Mean : 5.767 Mean :11.01 Mean :0.503 Mean :0.507
## 3rd Qu.: 9.000 3rd Qu.:16.00 3rd Qu.:1.000 3rd Qu.:1.000
## Max. :18.000 Max. :20.00 Max. :1.000 Max. :1.000
## price_range
## Min. :0.00
## 1st Qu.:0.75
## Median :1.50
## Mean :1.50
## 3rd Qu.:2.25
## Max. :3.00
De acuerdo al análisis descriptivo encontramos que 6 variables son cualitativas nominales y cuantitativas continuas son 2 y las 13 variables restantes son cuantitativas discretas.
Variables cualitativas: Nominal - Ordinal
Inicialmente vamos a convertir variables númericas a factores
Se realiza un análisis descriptivo de las variables bluetooth, doble
sim, wifi, touch_screen (pantalla táctil), en las que se observa si el
dispositivo tiene o no estás funciones (0 dispositivos que no tienen
está función y 1 cuando si), se muestra la cantidad de cada uno de ellos
con su respectivo porcentaje.
Se realizan las tablas de distribución para cada una de las variables:
cat(
" \"Tabla de distribución de frecuencias : Doble sim\"\n"
)
## "Tabla de distribución de frecuencias : Doble sim"
tabla_dft= fdt_cat(data$dual_sim)
tabla_dft
## Category f rf rf(%) cf cf(%)
## 1 1019 0.51 50.95 1019 50.95
## 0 981 0.49 49.05 2000 100.00
La primera tabla es de la variable Doble sim, en la que se evidencia que los dispositivos que tienen doble sim (1), son 1019, valor el cual representa el 51% de los datos, por otro lado, están los dispositivos que no tienen (0), son 981 con un valor porcentual del 49% respecto al total.
cat(
"\"Tabla de distribución de frecuencias : bluetooth\"\n"
)
## "Tabla de distribución de frecuencias : bluetooth"
tabla_bluetooth= fdt_cat(data$bluetooth)
tabla_bluetooth
## Category f rf rf(%) cf cf(%)
## 0 1010 0.5 50.5 1010 50.5
## 1 990 0.5 49.5 2000 100.0
La tabla de la variable bluetooth, indica los dispositivos que tienen bluetooth representado con el número (1), con un total de 1010, representando el 50.5% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 990 y un valor porcentual del 49.5% respecto al total.
cat(
"\"Tabla de distribución de frecuencias : touch_screen\"\n"
)
## "Tabla de distribución de frecuencias : touch_screen"
tabla_touch_screen= fdt_cat(data$touch_screen)
tabla_touch_screen
## Category f rf rf(%) cf cf(%)
## 1 1006 0.5 50.3 1006 50.3
## 0 994 0.5 49.7 2000 100.0
La tabla de la variable touch_screen, indica los dispositivos que tienen pantalla táctil representado con el número (1), con un total de 1006, representando el 50.3% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 994 y un valor porcentual del 49.7% respecto al total.
cat(
"\"Tabla de distribución de frecuencias : wifi\"\n"
)
## "Tabla de distribución de frecuencias : wifi"
tabla_wifi = fdt_cat(data$wifi)
tabla_wifi
## Category f rf rf(%) cf cf(%)
## 1 1014 0.51 50.7 1014 50.7
## 0 986 0.49 49.3 2000 100.0
La tabla de la variable wifi, indica los dispositivos que tienen wifi representado con el número (1), con un total de 1014, representando el 50.7% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 986 y un valor porcentual del 49.3% respecto al total.
cat(
"\"Tabla de distribución de frecuencias : three_g\"\n"
)
## "Tabla de distribución de frecuencias : three_g"
tabla_three_g = fdt_cat(data$three_g)
tabla_three_g
## Category f rf rf(%) cf cf(%)
## 1 1523 0.76 76.15 1523 76.15
## 0 477 0.24 23.85 2000 100.00
Tabla_three_g <- data %>% group_by(three_g ) %>% summarise(Total=n()) %>%
dplyr::mutate(Porcentaje = round(Total/sum(Total)*100, 1)) #16
ggplot(Tabla_three_g, aes(x = three_g, y=Total,fill=three_g) ) +
geom_bar(width = 0.9, stat="identity", position = position_dodge())+
ylim(c(0,1600))+
labs(x="three_g", y= "Frecuencia \n (Porcentajes)") + #17
labs(fill = "")+
geom_text(aes(label=paste0(Total," ", "", "(", Porcentaje, "%",")")), #18
vjust=-0.9,
color="black",
hjust=0.5,
position = position_dodge(0.9),
angle=0,
size=4.0
) +
scale_fill_discrete(name = "El dispositivo tiene 3G", labels = c("No", "Si")) + #19
theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1)) + #20
#theme_bw(base_size = 14) +
facet_wrap(~"Variable 3G")
#plot_grid(Barra1, Barra2, nrow= 1, align = "h")
La tabla de la variable three_g, indica los dispositivos que tienen 3G representado con el número (1), con un total de 1523, representando el 76.1% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 477 y un valor porcentual del 23.8% respecto al total. Adicionalmente, se evidencia la gráfica con esta información.
cat(
"\"Tabla de distribución de frecuencias : four_g\"\n"
)
## "Tabla de distribución de frecuencias : four_g"
tabla_four_g = fdt_cat(data$four_g)
tabla_four_g
## Category f rf rf(%) cf cf(%)
## 1 1043 0.52 52.15 1043 52.15
## 0 957 0.48 47.85 2000 100.00
Tabla_four_g <- data %>% group_by(four_g ) %>% summarise(Total=n()) %>%
dplyr::mutate(Porcentaje = round(Total/sum(Total)*100, 1)) #16
ggplot(Tabla_four_g, aes(x = four_g, y=Total,fill=four_g) ) +
geom_bar(width = 0.9, stat="identity", position = position_dodge())+
ylim(c(0,1100))+
labs(x="four_g", y= "Frecuencia \n (Porcentajes)") + #17
labs(fill = "")+
geom_text(aes(label=paste0(Total," ", "", "(", Porcentaje, "%",")")), #18
vjust=-0.9,
color="black",
hjust=0.5,
position = position_dodge(0.9),
angle=0,
size=4.0
) +
scale_fill_discrete(name = "El dispositivo tiene 4G", labels = c("No", "Si")) + #19
theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1)) + #20
#theme_bw(base_size = 14) +
facet_wrap(~"Variable 4G")
#plot_grid(Barra1, Barra2, nrow= 1, align = "h")
La tabla de la variable four_g, indica los dispositivos que tienen 4G representado con el número (1), con un total de 1043, representando el 52.1% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 957 y un valor porcentual del 47.9% respecto al total. Adicionalmente, se evidencia la gráfica con esta información.
## "Medidas descriptivas: ram "
## Descriptive Statistics
## data$ram
## N: 2000
##
## ram
## ----------------- ---------
## Mean 2124.21
## Std.Dev 1084.73
## Min 256.00
## Q1 1207.00
## Median 2146.50
## Q3 3065.00
## Max 3998.00
## MAD 1382.52
## IQR 1857.00
## CV 0.51
## Skewness 0.01
## SE.Skewness 0.05
## Kurtosis -1.19
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: ram "
## Class limits f rf rf(%) cf cf(%)
## [253.44,568.8183) 168 0.08 8.40 168 8.40
## [568.8183,884.1967) 176 0.09 8.80 344 17.20
## [884.1967,1199.575) 149 0.07 7.45 493 24.65
## [1199.575,1514.953) 195 0.10 9.75 688 34.40
## [1514.953,1830.332) 150 0.07 7.50 838 41.90
## [1830.332,2145.71) 161 0.08 8.05 999 49.95
## [2145.71,2461.088) 188 0.09 9.40 1187 59.35
## [2461.088,2776.467) 179 0.09 8.95 1366 68.30
## [2776.467,3091.845) 145 0.07 7.25 1511 75.55
## [3091.845,3407.223) 164 0.08 8.20 1675 83.75
## [3407.223,3722.602) 176 0.09 8.80 1851 92.55
## [3722.602,4037.98) 149 0.07 7.45 2000 100.00
## "Test de normalidad de Shapiro-Wilk: ram "
##
## Shapiro-Wilk normality test
##
## data: ram
## W = 0.95462, p-value < 2.2e-16
## "Test de Wilcoxon Signed-Rank Test: ram "
##
## Wilcoxon signed rank test with continuity correction
##
## data: data$ram
## V = 2001000, p-value < 2.2e-16
## alternative hypothesis: true location is not equal to 0
## Size (n) Missing Minimum 1st Qu Mean Median
## 2000.000 0.000 256.000 1207.500 2124.213 2146.500
## TrMean 3rd Qu Max Stdev Var SE Mean
## 2123.541 3064.500 3998.000 1084.732 1176643.606 24.255
## I.Q.R. Range Kurtosis Skewness SW p-val
## 1857.000 3742.000 -1.194 0.007 0.000
Según las gráficas podemos observar que la distribución de los datos es bastante uniforme, o rectangular dado el histograma que se realizó, también observamos que podría existir multimodalidad, es decir que podrían haber subgrupos, tenemos posiblemente simetría, no hay outliers, y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 2124.21 con una desviación estandar de 1084.73, lo que significa que los datos son muy dispersos, con una mediana de 2146.50, valor el cual es cercano a la media y el valor mínimo del conjunto de datos es 256 y el máximo de 3998, con un coeficiente de variación del 0.51, adicionalmente se observa que el valor del sesgo es de 0.01, el cual es un valor cerca a 0 lo que indica que posiblemente es simétrico y curtosis de -1.19 es decir que tiene una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95462, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas
## "Medidas descriptivas: battery_power "
## Descriptive Statistics
## data$battery_power
## N: 2000
##
## battery_power
## ----------------- ---------------
## Mean 1238.52
## Std.Dev 439.42
## Min 501.00
## Q1 851.50
## Median 1226.00
## Q3 1615.50
## Max 1998.00
## MAD 566.35
## IQR 763.50
## CV 0.35
## Skewness 0.03
## SE.Skewness 0.05
## Kurtosis -1.23
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: battery_power "
## Class limits f rf rf(%) cf cf(%)
## [495.99,622.8225) 184 0.09 9.20 184 9.20
## [622.8225,749.655) 175 0.09 8.75 359 17.95
## [749.655,876.4875) 178 0.09 8.90 537 26.85
## [876.4875,1003.32) 166 0.08 8.30 703 35.15
## [1003.32,1130.153) 165 0.08 8.25 868 43.40
## [1130.153,1256.985) 162 0.08 8.10 1030 51.50
## [1256.985,1383.818) 163 0.08 8.15 1193 59.65
## [1383.818,1510.65) 156 0.08 7.80 1349 67.45
## [1510.65,1637.483) 174 0.09 8.70 1523 76.15
## [1637.483,1764.315) 166 0.08 8.30 1689 84.45
## [1764.315,1891.148) 167 0.08 8.35 1856 92.80
## [1891.148,2017.98) 144 0.07 7.20 2000 100.00
## "Test de normalidad de Shapiro-Wilk: battery_power "
##
## Shapiro-Wilk normality test
##
## data: battery_power
## W = 0.95188, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean
## 2000.000 0.000 501.000 851.750 1238.518 1226.000 1237.268
## 3rd Qu Max Stdev Var SE Mean I.Q.R. Range
## 1615.250 1998.000 439.418 193088.360 9.826 763.500 1497.000
## Kurtosis Skewness SW p-val
## -1.226 0.032 0.000
Según las gráficas podemos observar que la distribución de los datos es uniforme, tenemos posiblemente simetría, no hay outliers, y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 1238.52 con una desviación estandar de 439.42, lo que significa que los datos son moderadamente dispersos, con una mediana de 1226, valor el cual está cerca a la media y nos sugiere que la distribución es bastante simétrica, adicionalmente, el valor mínimo del conjunto de datos es 501 y el máximo de 1998, con un coeficiente de variación del 0.35 lo que sugiere una variabilidad relativamente baja en comparación con la media, además, se observa que el valor del sesgo es de 0.03, valor el cual es cercano a 0, lo que indica que posiblemente es simétrico y curtosis de -1.23 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95188, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas
## "Medidas descriptivas: clock_speed "
## Descriptive Statistics
## data$clock_speed
## N: 2000
##
## clock_speed
## ----------------- -------------
## Mean 1.52
## Std.Dev 0.82
## Min 0.50
## Q1 0.70
## Median 1.50
## Q3 2.20
## Max 3.00
## MAD 1.19
## IQR 1.50
## CV 0.54
## Skewness 0.18
## SE.Skewness 0.05
## Kurtosis -1.32
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: clock_speed "
## Class limits f rf rf(%) cf cf(%)
## [0.495,0.7062) 551 0.28 27.55 551 27.55
## [0.7062,0.9175) 116 0.06 5.80 667 33.35
## [0.9175,1.129) 112 0.06 5.60 779 38.95
## [1.129,1.34) 124 0.06 6.20 903 45.15
## [1.34,1.551) 137 0.07 6.85 1040 52.00
## [1.551,1.762) 136 0.07 6.80 1176 58.80
## [1.762,1.974) 127 0.06 6.35 1303 65.15
## [1.974,2.185) 143 0.07 7.15 1446 72.30
## [2.185,2.396) 137 0.07 6.85 1583 79.15
## [2.396,2.607) 187 0.09 9.35 1770 88.50
## [2.607,2.819) 140 0.07 7.00 1910 95.50
## [2.819,3.03) 90 0.04 4.50 2000 100.00
## "Test de normalidad de Shapiro-Wilk: clock_speed "
##
## Shapiro-Wilk normality test
##
## data: clock_speed
## W = 0.91123, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 0.500 0.700 1.522 1.500 1.502 2.200
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 3.000 0.816 0.666 0.018 1.500 2.500 -1.325 0.178
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de los datos es bimodal ya que hay una cola más larga hacia la derecha, lo que indica asimetría positiva o sesgo a la derecha, en el boxplot, los bigotes se extienden hasta los valores máximos y mínimos dentro de un rango definido y se evidencia que el bigote derecho es más largo que el izquierdo, lo que confirma la asimetría positiva y se tiene un posible outlier en los valores más altos, adicionalmente, el Q-Q Plot indica que posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 1.52 con una desviación estandar de 0.82, lo que significa que los datos son moderadamente dispersos, con una mediana de 1.50, valor el cual está cerca a la media y nos sugiere que la distribución es bastante simétrica, adicionalmente, el valor mínimo del conjunto de datos es 0.50 y el máximo de 3, con un coeficiente de variación del 0.54 lo que sugiere una variabilidad relativamente baja en comparación con la media, además, el valor del sesgo es de 0.18, lo que indica que posiblemente tiene asimetría positiva y curtosis de -1.32 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.91123, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
## "Medidas descriptivas: int_memory "
## Descriptive Statistics
## data$int_memory
## N: 2000
##
## int_memory
## ----------------- ------------
## Mean 32.05
## Std.Dev 18.15
## Min 2.00
## Q1 16.00
## Median 32.00
## Q3 48.00
## Max 64.00
## MAD 23.72
## IQR 32.00
## CV 0.57
## Skewness 0.06
## SE.Skewness 0.05
## Kurtosis -1.22
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: int_memory "
## Class limits f rf rf(%) cf cf(%)
## [1.98,7.2017) 200 0.10 10.00 200 10.00
## [7.2017,12.423) 178 0.09 8.90 378 18.90
## [12.423,17.645) 177 0.09 8.85 555 27.75
## [17.645,22.867) 156 0.08 7.80 711 35.55
## [22.867,28.088) 192 0.10 9.60 903 45.15
## [28.088,33.31) 159 0.08 7.95 1062 53.10
## [33.31,38.532) 139 0.07 6.95 1201 60.05
## [38.532,43.753) 161 0.08 8.05 1362 68.10
## [43.753,48.975) 157 0.08 7.85 1519 75.95
## [48.975,54.197) 193 0.10 9.65 1712 85.60
## [54.197,59.418) 152 0.08 7.60 1864 93.20
## [59.418,64.64) 136 0.07 6.80 2000 100.00
## "Test de normalidad de Shapiro-Wilk: int_memory "
##
## Shapiro-Wilk normality test
##
## data: int_memory
## W = 0.95274, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 2.000 16.000 32.047 32.000 31.953 48.000
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 64.000 18.146 329.267 0.406 32.000 62.000 -1.218 0.058
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de los datos es uniforme, tenemos posiblemente simetría, no hay outliers, y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 32.05 con una desviación estandar de 18.15, lo que significa que los datos son moderadamente dispersos, con una mediana de 32, valor el cual está cerca a la media y nos sugiere que la distribución es bastante simétrica, adicionalmente, el valor mínimo del conjunto de datos es 2 y el máximo es 64, con un coeficiente de variación de 0.57 lo que sugiere una variabilidad moderada en comparación con la media, además, se observa que el valor del sesgo es de 0.06, valor el cual es cercano a 0, lo que indica que posiblemente es simétrico y curtosis de -1.22 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95274, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas
## "Medidas descriptivas: Megapíxeles de la cámara principal. "
## Descriptive Statistics
## data$pc
## N: 2000
##
## pc
## ----------------- ---------
## Mean 9.92
## Std.Dev 6.06
## Min 0.00
## Q1 5.00
## Median 10.00
## Q3 15.00
## Max 20.00
## MAD 7.41
## IQR 10.00
## CV 0.61
## Skewness 0.02
## SE.Skewness 0.05
## Kurtosis -1.17
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: pc "
## Class limits f rf rf(%) cf cf(%)
## [0,1.683) 205 0.10 10.25 205 10.25
## [1.683,3.367) 192 0.10 9.60 397 19.85
## [3.367,5.05) 154 0.08 7.70 551 27.55
## [5.05,6.733) 95 0.05 4.75 646 32.30
## [6.733,8.417) 208 0.10 10.40 854 42.70
## [8.417,10.1) 234 0.12 11.70 1088 54.40
## [10.1,11.78) 79 0.04 3.95 1167 58.35
## [11.78,13.47) 175 0.09 8.75 1342 67.10
## [13.47,15.15) 196 0.10 9.80 1538 76.90
## [15.15,16.83) 88 0.04 4.40 1626 81.30
## [16.83,18.52) 181 0.09 9.05 1807 90.35
## [18.52,20.2) 193 0.10 9.65 2000 100.00
## "Test de normalidad de Shapiro-Wilk: pc "
##
## Shapiro-Wilk normality test
##
## data: pc
## W = 0.95126, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 0.000 5.000 9.916 10.000 9.907 15.000
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 20.000 6.064 36.776 0.136 10.000 20.000 -1.173 0.017
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de los datos es bimodal, con posible asimétria hacía la derecha, el punto en el boxplot nos sugiere que la mediana está ligeramente desplazada hacia la izquierda de la caja, y el bigote derecho es ligeramente más largo que el izquierdo, además, hay algunos puntos fuera del bigote derecho, lo que sugiere la posible presencia de outliers en los valores más altos de “pc” y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 9.92 con una desviación estandar de 6.06, lo que significa que los datos son moderadamente dispersos, con una mediana de 10, valor el cual está cerca a la media, adicionalmente, el valor mínimo del conjunto de datos es 0 y el máximo es 20, con un coeficiente de variación de 0.61 lo que sugiere una variabilidad moderada en comparación con la media, además, se observa que el valor del sesgo es de 0.02, lo que indica que posiblemente es ligeramente asimétrico hacía la derecha y curtosis de -1.17 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95126, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas
## "Medidas descriptivas: Megapíxeles de la cámara frontal "
## Descriptive Statistics
## data$fc
## N: 2000
##
## fc
## ----------------- ---------
## Mean 4.31
## Std.Dev 4.34
## Min 0.00
## Q1 1.00
## Median 3.00
## Q3 7.00
## Max 19.00
## MAD 4.45
## IQR 6.00
## CV 1.01
## Skewness 1.02
## SE.Skewness 0.05
## Kurtosis 0.27
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: fc "
## Class limits f rf rf(%) cf cf(%)
## [0,1.5992) 719 0.36 35.95 719 35.95
## [1.5992,3.1983) 359 0.18 17.95 1078 53.90
## [3.1983,4.7975) 133 0.07 6.65 1211 60.55
## [4.7975,6.3967) 251 0.13 12.55 1462 73.10
## [6.3967,7.9958) 100 0.05 5.00 1562 78.10
## [7.9958,9.595) 155 0.08 7.75 1717 85.85
## [9.595,11.194) 113 0.06 5.65 1830 91.50
## [11.194,12.793) 45 0.02 2.25 1875 93.75
## [12.793,14.393) 60 0.03 3.00 1935 96.75
## [14.393,15.992) 23 0.01 1.15 1958 97.90
## [15.992,17.591) 30 0.01 1.50 1988 99.40
## [17.591,19.19) 12 0.01 0.60 2000 100.00
## "Test de normalidad de Shapiro-Wilk: fc "
##
## Shapiro-Wilk normality test
##
## data: fc
## W = 0.87374, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 0.000 1.000 4.310 3.000 3.942 7.000
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 19.000 4.341 18.848 0.097 6.000 19.000 0.270 1.018
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de la mayoría de los datos son demasiado bajos y tienen una cola larga, posible asimétria hacía la derecha, el punto en el boxplot nos sugiere que la mediana está desplazada hacia la izquierda de la caja, y el bigote derecho es más largo que el izquierdo, además, hay puntos fuera del bigote derecho, lo que sugiere la posible presencia de outliers en los valores más altos y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 4.31 con una desviación estandar de 4.34, lo que significa que los datos son considerablemente dispersos, con una mediana de 3, valor el cual es menor a la media y nos sugiere asimétria positiva, adicionalmente, el valor mínimo del conjunto de datos es 0 y el máximo es 19, con un coeficiente de variación de 1.01 lo que sugiere una alta variabilidad en comparación con la media, además, se observa que el valor del sesgo es de 1.02, lo que indica que posiblemente es asimétrico hacía la derecha y curtosis de 0.27 es decir que los datos tienen una distribución leptocúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.87374, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
## "Medidas descriptivas: Resolución de píxeles Altura "
## Descriptive Statistics
## data$px_height
## N: 2000
##
## px_height
## ----------------- -----------
## Mean 645.11
## Std.Dev 443.78
## Min 0.00
## Q1 282.50
## Median 564.00
## Q3 947.50
## Max 1960.00
## MAD 471.47
## IQR 664.50
## CV 0.69
## Skewness 0.67
## SE.Skewness 0.05
## Kurtosis -0.32
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: Resolución de píxeles Altura "
## Class limits f rf rf(%) cf cf(%)
## [0,164.967) 269 0.13 13.45 269 13.45
## [164.967,329.933) 320 0.16 16.00 589 29.45
## [329.933,494.9) 300 0.15 15.00 889 44.45
## [494.9,659.867) 262 0.13 13.10 1151 57.55
## [659.867,824.833) 217 0.11 10.85 1368 68.40
## [824.833,989.8) 183 0.09 9.15 1551 77.55
## [989.8,1154.77) 143 0.07 7.15 1694 84.70
## [1154.77,1319.73) 128 0.06 6.40 1822 91.10
## [1319.73,1484.7) 77 0.04 3.85 1899 94.95
## [1484.7,1649.67) 50 0.03 2.50 1949 97.45
## [1649.67,1814.63) 35 0.02 1.75 1984 99.20
## [1814.63,1979.6) 16 0.01 0.80 2000 100.00
## "Test de normalidad de Shapiro-Wilk: Resolución de píxeles Altura "
##
## Shapiro-Wilk normality test
##
## data: px_height
## W = 0.9469, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean
## 2000.000 0.000 0.000 282.750 645.108 564.000 621.618
## 3rd Qu Max Stdev Var SE Mean I.Q.R. Range
## 947.250 1960.000 443.781 196941.408 9.923 664.500 1960.000
## Kurtosis Skewness SW p-val
## -0.321 0.665 0.000
Según las gráficas podemos observar que la distribución de la mayoría de los datos son demasiado bajos y tienen una cola larga, posible asimétria hacía la derecha, el punto dentro de la caja representa la mediana en el boxplot nos sugiere que la mediana está desplazada hacia la izquierda de la caja, y el bigote derecho es más largo que el izquierdo, además, hay un punto fuera del bigote derecho, lo que sugiere la posible presencia de outliers en los valores más altos y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 645.11 con una desviación estandar de 443.78, lo que significa que los datos son considerablemente dispersos, con una mediana de 564, valor el cual es menor a la media y nos sugiere asimétria positiva, adicionalmente, el valor mínimo del conjunto de datos es 0 y el máximo es 1960, con un coeficiente de variación de 0.69 lo que sugiere una alta variabilidad en comparación con la media, además, se observa que el valor del sesgo es de 0.67, lo que indica que posiblemente es asimétrico hacía la derecha y curtosis de -0.32 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.9469, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
## "Medidas descriptivas: Ancho de resolución de píxeles "
## Descriptive Statistics
## data$px_width
## N: 2000
##
## px_width
## ----------------- ----------
## Mean 1251.52
## Std.Dev 432.20
## Min 500.00
## Q1 874.50
## Median 1247.00
## Q3 1633.00
## Max 1998.00
## MAD 557.46
## IQR 758.25
## CV 0.35
## Skewness 0.01
## SE.Skewness 0.05
## Kurtosis -1.19
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: Resolución de píxeles Altura "
## Class limits f rf rf(%) cf cf(%)
## [495,621.915) 147 0.07 7.35 147 7.35
## [621.915,748.83) 178 0.09 8.90 325 16.25
## [748.83,875.745) 176 0.09 8.80 501 25.05
## [875.745,1002.66) 158 0.08 7.90 659 32.95
## [1002.66,1129.575) 170 0.09 8.50 829 41.45
## [1129.575,1256.49) 186 0.09 9.30 1015 50.75
## [1256.49,1383.405) 171 0.09 8.55 1186 59.30
## [1383.405,1510.32) 175 0.09 8.75 1361 68.05
## [1510.32,1637.235) 146 0.07 7.30 1507 75.35
## [1637.235,1764.15) 177 0.09 8.85 1684 84.20
## [1764.15,1891.065) 156 0.08 7.80 1840 92.00
## [1891.065,2017.98) 160 0.08 8.00 2000 100.00
## "Test de normalidad de Shapiro-Wilk: Resolución de píxeles Altura "
##
## Shapiro-Wilk normality test
##
## data: px_width
## W = 0.95604, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean
## 2000.000 0.000 500.000 874.750 1251.515 1247.000 1251.566
## 3rd Qu Max Stdev Var SE Mean I.Q.R. Range
## 1633.000 1998.000 432.199 186796.362 9.664 758.250 1498.000
## Kurtosis Skewness SW p-val
## -1.188 0.015 0.000
Según las gráficas podemos observar que la distribución de los datos es uniforme y posiblemente es simétrica, el punto dentro de la caja representa la mediana en el boxplot lo que nos indica que la mediana está aproximadamente en el centro de la distribución, además, no hay outliers y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 1251.52 con una desviación estandar de 432.20, lo que significa que los datos tienen una variabilidad moderada, con una mediana de 1247, valor el cual es cercano a la media y nos sugiere simetría, adicionalmente, el valor mínimo del conjunto de datos es 500 y el máximo es 1998, con un coeficiente de variación de 0.35 lo que sugiere una baja variabilidad en comparación con la media, además, se observa que el valor del sesgo es de 0.01, lo que indica que posiblemente es simétrico y curtosis de -1.19 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95604, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
## "Medidas descriptivas: Tiempo de la batería "
## Descriptive Statistics
## data$talk_time
## N: 2000
##
## talk_time
## ----------------- -----------
## Mean 11.01
## Std.Dev 5.46
## Min 2.00
## Q1 6.00
## Median 11.00
## Q3 16.00
## Max 20.00
## MAD 7.41
## IQR 10.00
## CV 0.50
## Skewness 0.01
## SE.Skewness 0.05
## Kurtosis -1.22
## N.Valid 2000.00
## N 2000.00
## Pct.Valid 100.00
## "Tabla de frecuencia: Resolución de píxeles Altura "
## Class limits f rf rf(%) cf cf(%)
## [1.98,3.498) 193 0.10 9.65 193 9.65
## [3.498,5.017) 216 0.11 10.80 409 20.45
## [5.017,6.535) 111 0.06 5.55 520 26.00
## [6.535,8.053) 228 0.11 11.40 748 37.40
## [8.053,9.572) 100 0.05 5.00 848 42.40
## [9.572,11.09) 208 0.10 10.40 1056 52.80
## [11.09,12.61) 99 0.05 4.95 1155 57.75
## [12.61,14.13) 201 0.10 10.05 1356 67.80
## [14.13,15.64) 115 0.06 5.75 1471 73.55
## [15.64,17.16) 214 0.11 10.70 1685 84.25
## [17.16,18.68) 100 0.05 5.00 1785 89.25
## [18.68,20.2) 215 0.11 10.75 2000 100.00
## "Test de normalidad de Shapiro-Wilk: Resolución de píxeles Altura "
##
## Shapiro-Wilk normality test
##
## data: talk_time
## W = 0.94821, p-value < 2.2e-16
## Size (n) Missing Minimum 1st Qu Mean Median TrMean 3rd Qu
## 2000.000 0.000 2.000 6.000 11.011 11.000 11.012 16.000
## Max Stdev Var SE Mean I.Q.R. Range Kurtosis Skewness
## 20.000 5.464 29.855 0.122 10.000 18.000 -1.220 0.009
## SW p-val
## 0.000
Según las gráficas podemos observar que la distribución de los datos es uniforme y posiblemente es simétrica, el punto dentro de la caja representa la mediana en el boxplot lo que nos indica que la mediana está aproximadamente en el centro de la distribución, además, no hay outliers y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.
Observamos que los datos tienen una media de 11.01 con una desviación estandar de 5.46, lo que significa que los datos tienen una variabilidad moderada, con una mediana de 11, valor el cual es cercano a la media y nos sugiere simetría, adicionalmente, el valor mínimo del conjunto de datos es 2 y el máximo es 20, con un coeficiente de variación de 0.50 lo que sugiere una variabilidad moderada en comparación con la media, además, se observa que el valor del sesgo es de 0.01, lo que indica que posiblemente es simétrico y curtosis de -1.22 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.
En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95604, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.
Análisis Bivariado
## "Tabla cruzada entre dual_sim y wifi "
##
## 0 1
## 0 495 486
## 1 491 528
## "Tabla cruzada entre dual_sim y wifi en proporciones "
##
## 0 1
## 0 0.5045872 0.4954128
## 1 0.4818449 0.5181551
ram según four_g (Celulares con y sin 4G)
Boxplot para visualizar la distribución de ram por rango de precio de
celular
En el gráfico podemos observar que el precio de los celulares respecto a la ram, para el caso de la gama baja, tenemos que el valor de la media es inferior a 1000, pero encontramos outliers que son superiores respecto a la media de los celulares de gama media, por otro lado, los celulares de esta gama, su media se encuentran cercana a 2000 y no presenta outliers, en cambio en el caso, de la gama alta, se tiene una media entre 2000 y 3000, con 1 outlier en la parte superior el cual el valor es muy cercano a 4000, es decir es superior al valor de la media de los dispositivos de gama muy alta, adicionalmente, encontramos otros outliers, en la parte inferior entre 1000 y 2000, en los cuales está cercano a los dispositivos de gama media, por último, los dispositivios de gama muy alta, tienen una media entre 3000 y 4000, con outliers cercanos a la media de los dispositivos de gama alta.
## Tabla ANOVA respecto al poder de la batería y la velocidad del microprocesador
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## clock_speed 1 50883 50883 0.263 0.608
## Residuals 1998 385932748 193160
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova
## BP = 4.7378, df = 1, p-value = 0.02951
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.02951, el cual es menor al nivel de significancia por lo que se rechaza la hipótesis nula de homoscedasticidad, por lo que decimos que se presenta heterocedasticidad.
## Tabla ANOVA respecto a la memoria interna y la velocidad del microprocesador
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## clock_speed 1 28 28.2 0.086 0.77
## Residuals 1998 658176 329.4
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova_memory_clock
## BP = 0.00049605, df = 1, p-value = 0.9822
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.9822, el cual es mayor al nivel de significancia por lo que no se rechaza la hipótesis nula, por lo que decimos que se presenta homoscedasticidad.
## Tabla ANOVA respecto a la memoria interna y el rango del precio
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## price_range 1 1300 1299.6 3.953 0.0469 *
## Residuals 1998 656905 328.8
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova_memory_price
## BP = 0.00084084, df = 1, p-value = 0.9769
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.7535, el cual es mayor al nivel de significancia por lo que no se rechaza la hipótesis nula, por lo que decimos que se presenta homoscedasticidad y la varianza de los errores (residuos) es constante.
## Tabla ANOVA respecto a la memoria interna y la ram
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## ram 1 709 708.7 2.154 0.142
## Residuals 1998 657496 329.1
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova_memory_ram
## BP = 0.00066673, df = 1, p-value = 0.9794
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.9794, el cual es mayor al nivel de significancia por lo que no se rechaza la hipótesis nula, por lo que decimos que se presenta homoscedasticidad y la varianza de los errores (residuos) es constante.
## Tabla ANOVA respecto a la velocidad del microprocesador y la ram
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## ram 1 0 0.0158 0.024 0.878
## Residuals 1998 1331 0.6662
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova_speed_ram
## BP = 5.4721, df = 1, p-value = 0.01932
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.9794, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto a la velocidad del microprocesador y los núcleos
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## n_cores 1 0 0.0436 0.065 0.798
## Residuals 1998 1331 0.6662
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova_speed_ram
## BP = 0.4413, df = 1, p-value = 0.5065
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.6879, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto a los megapixeles de la cárama principal y el rango de los precios
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## price_range 1 83 82.99 2.258 0.133
## Residuals 1998 73432 36.75
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova_pc_price
## BP = 0.13616, df = 1, p-value = 0.7121
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.7678, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto a la altura de la resolución de y los núcleos
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## n_cores 1 18592 18592 0.094 0.759
## Residuals 1998 393667283 197031
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_anova_px_cores
## BP = 0.37192, df = 1, p-value = 0.542
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.202, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto a la profundidad y el peso del móvil
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## mobile_wt 1 0.08 0.07871 0.946 0.331
## Residuals 1998 166.21 0.08319
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_m_dep_wt
## BP = 0.028092, df = 1, p-value = 0.8669
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.8669, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto a la altura y si es táctil
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## touch_screen 1 14 14.23 0.801 0.371
## Residuals 1998 35471 17.75
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_sc_h_touch
## BP = 0.12482, df = 1, p-value = 0.7239
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.7239, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto al poder de la batería y el tiempo de batería
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## talk_time 1 1064287 1064287 5.524 0.0188 *
## Residuals 1998 384919344 192652
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_battery
## BP = 0.55791, df = 1, p-value = 0.4551
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.4551, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto al poder de la batería y la memoria interna
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## int_memory 1 6187 6187 0.032 0.858
## Residuals 1998 385977444 193182
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_batt_mem
## BP = 0.86427, df = 1, p-value = 0.3525
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.3525, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto a la ram y el poder de la batería
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## battery_power 1 1.003e+03 1003 0.001 0.977
## Residuals 1998 2.352e+09 1177232
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_ram_batt
## BP = 1.0843, df = 1, p-value = 0.2977
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.2977, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## Tabla ANOVA respecto al tiempo de la batería y la velocidad del microprocesador
##
##
## Df Sum Sq Mean Sq F value Pr(>F)
## clock_speed 1 8 7.799 0.261 0.609
## Residuals 1998 59672 29.866
##
##
## Prueba de Breusch-Pagan
##
## studentized Breusch-Pagan test
##
## data: modelo_talk_speed
## BP = 1.4034, df = 1, p-value = 0.2362
Al realizar la prueba de Breusch-Pagan el p valore fue de 0.2362, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.
## [1] 21
## [,1] [,2]
## [1,] 1 2
## [2,] 1 3
## [3,] 1 4
## [4,] 1 5
## [5,] 1 6
## [6,] 1 7
## [7,] 1 8
## [8,] 1 9
## [9,] 1 10
## [10,] 1 11
## [,1] [,2]
## [1,] 1 2
## [2,] 1 2
## [3,] 1 2
## [4,] 1 1
## [5,] 1 1
## [6,] 1 3
## [7,] 1 0
## [8,] 1 0
## [9,] 1 0
## [10,] 1 3
En el ejercicio de la asignación de la probabilidad de selección de muestra se propone el siguiente vector de probabilidades.
## [1] 0.003785198 0.006485978 0.002200217 0.004563165 0.006449202 0.005468733
## La suma de p es:
## [1] 1
## [1] FALSE FALSE FALSE FALSE FALSE FALSE
Lo anterior, con el fin de establecer la inclusión a partir de la función indicadora en la selección de la muestra. Se utiliza la función I_k
## [,1] [,2]
## [1,] 1 2
## [2,] 1 2
## [3,] 1 2
## [4,] 1 1
## [5,] 1 1
## [6,] 1 3
## [7,] 1 0
## [8,] 1 0
## [9,] 1 0
## [10,] 1 3
## [11,] 1 3
## [12,] 1 1
## [13,] 1 2
## [14,] 1 0
## [15,] 1 0
## [16,] 1 3
## [17,] 1 3
## [18,] 1 1
## [19,] 1 1
## [20,] 1 3
## [21,] 2 2
## [22,] 2 2
## [23,] 2 1
## [24,] 2 1
## [25,] 2 3
## [26,] 2 0
## [27,] 2 0
## [28,] 2 0
## [29,] 2 3
## [30,] 2 3
## [31,] 2 1
## [32,] 2 2
## [33,] 2 0
## [34,] 2 0
## [35,] 2 3
## [36,] 2 3
## [37,] 2 1
## [38,] 2 1
## [39,] 2 3
## [40,] 2 2
## [41,] 2 1
## [42,] 2 1
## [43,] 2 3
## [44,] 2 0
## [45,] 2 0
## [46,] 2 0
## [47,] 2 3
## [48,] 2 3
## [49,] 2 1
## [50,] 2 2
## [51,] 2 0
## [52,] 2 0
## [53,] 2 3
## [54,] 2 3
## [55,] 2 1
## [56,] 2 1
## [57,] 2 3
## [58,] 2 1
## [59,] 2 1
## [60,] 2 3
## [61,] 2 0
## [62,] 2 0
## [63,] 2 0
## [64,] 2 3
## [65,] 2 3
## [66,] 2 1
## [67,] 2 2
## [68,] 2 0
## [69,] 2 0
## [70,] 2 3
## [71,] 2 3
## [72,] 2 1
## [73,] 2 1
## [74,] 2 3
## [75,] 1 1
## [76,] 1 3
## [77,] 1 0
## [78,] 1 0
## [79,] 1 0
## [80,] 1 3
## [81,] 1 3
## [82,] 1 1
## [83,] 1 2
## [84,] 1 0
## [85,] 1 0
## [86,] 1 3
## [87,] 1 3
## [88,] 1 1
## [89,] 1 1
## [90,] 1 3
## [91,] 1 3
## [92,] 1 0
## [93,] 1 0
## [94,] 1 0
## [95,] 1 3
## [96,] 1 3
## [97,] 1 1
## [98,] 1 2
## [99,] 1 0
## [100,] 1 0
## [101,] 1 3
## [102,] 1 3
## [103,] 1 1
## [104,] 1 1
## [105,] 1 3
## [106,] 3 0
## [107,] 3 0
## [108,] 3 0
## [109,] 3 3
## [110,] 3 3
## [111,] 3 1
## [112,] 3 2
## [113,] 3 0
## [114,] 3 0
## [115,] 3 3
## [116,] 3 3
## [117,] 3 1
## [118,] 3 1
## [119,] 3 3
## [120,] 0 0
## [121,] 0 0
## [122,] 0 3
## [123,] 0 3
## [124,] 0 1
## [125,] 0 2
## [126,] 0 0
## [127,] 0 0
## [128,] 0 3
## [129,] 0 3
## [130,] 0 1
## [131,] 0 1
## [132,] 0 3
## [133,] 0 0
## [134,] 0 3
## [135,] 0 3
## [136,] 0 1
## [137,] 0 2
## [138,] 0 0
## [139,] 0 0
## [140,] 0 3
## [141,] 0 3
## [142,] 0 1
## [143,] 0 1
## [144,] 0 3
## [145,] 0 3
## [146,] 0 3
## [147,] 0 1
## [148,] 0 2
## [149,] 0 0
## [150,] 0 0
## [151,] 0 3
## [152,] 0 3
## [153,] 0 1
## [154,] 0 1
## [155,] 0 3
## [156,] 3 3
## [157,] 3 1
## [158,] 3 2
## [159,] 3 0
## [160,] 3 0
## [161,] 3 3
## [162,] 3 3
## [163,] 3 1
## [164,] 3 1
## [165,] 3 3
## [166,] 3 1
## [167,] 3 2
## [168,] 3 0
## [169,] 3 0
## [170,] 3 3
## [171,] 3 3
## [172,] 3 1
## [173,] 3 1
## [174,] 3 3
## [175,] 1 2
## [176,] 1 0
## [177,] 1 0
## [178,] 1 3
## [179,] 1 3
## [180,] 1 1
## [181,] 1 1
## [182,] 1 3
## [183,] 2 0
## [184,] 2 0
## [185,] 2 3
## [186,] 2 3
## [187,] 2 1
## [188,] 2 1
## [189,] 2 3
## [190,] 0 0
## [191,] 0 3
## [192,] 0 3
## [193,] 0 1
## [194,] 0 1
## [195,] 0 3
## [196,] 0 3
## [197,] 0 3
## [198,] 0 1
## [199,] 0 1
## [200,] 0 3
## [201,] 3 3
## [202,] 3 1
## [203,] 3 1
## [204,] 3 3
## [205,] 3 1
## [206,] 3 1
## [207,] 3 3
## [208,] 1 1
## [209,] 1 3
## [210,] 1 3
## X1 X2 p X1.1 X2.1 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
## 1 1 2 3.785198e-03 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0
## 2 1 2 6.485978e-03 1 0 1 0 0 0 0 0 0 0 0 0 0 0 0
## 3 1 2 2.200217e-03 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## 4 1 1 4.563165e-03 1 0 0 0 1 0 0 0 0 0 0 0 0 0 0
## 5 1 1 6.449202e-03 1 0 0 0 0 1 0 0 0 0 0 0 0 0 0
## 6 1 3 5.468733e-03 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0
## 7 1 0 1.563639e-03 1 0 0 0 0 0 0 1 0 0 0 0 0 0 0
## 8 1 0 8.461492e-03 1 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## 9 1 0 8.108550e-03 1 0 0 0 0 0 0 0 0 1 0 0 0 0 0
## 10 1 3 9.576060e-03 1 0 0 0 0 0 0 0 0 0 1 0 0 0 0
## 11 1 3 5.604606e-03 1 0 0 0 0 0 0 0 0 0 0 1 0 0 0
## 12 1 1 8.131057e-03 1 0 0 0 0 0 0 0 0 0 0 0 1 0 0
## 13 1 2 8.571198e-03 1 0 0 0 0 0 0 0 0 0 0 0 0 1 0
## 14 1 0 2.957294e-03 1 0 0 0 0 0 0 0 0 0 0 0 0 0 1
## 15 1 0 1.576249e-03 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 16 1 3 9.179693e-03 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 17 1 3 4.840673e-03 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 18 1 1 1.909036e-04 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 19 1 1 7.559560e-03 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 20 1 3 3.316060e-04 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 21 2 2 4.011467e-03 0 1 1 0 0 0 0 0 0 0 0 0 0 0 0
## 22 2 2 5.897901e-03 0 1 0 1 0 0 0 0 0 0 0 0 0 0 0
## 23 2 1 4.204774e-03 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0
## 24 2 1 2.105421e-03 0 1 0 0 0 1 0 0 0 0 0 0 0 0 0
## 25 2 3 1.568036e-03 0 1 0 0 0 0 1 0 0 0 0 0 0 0 0
## 26 2 0 6.315877e-03 0 1 0 0 0 0 0 1 0 0 0 0 0 0 0
## 27 2 0 6.777245e-03 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0
## 28 2 0 7.748512e-03 0 1 0 0 0 0 0 0 0 1 0 0 0 0 0
## 29 2 3 4.947712e-04 0 1 0 0 0 0 0 0 0 0 1 0 0 0 0
## 30 2 3 9.930176e-05 0 1 0 0 0 0 0 0 0 0 0 1 0 0 0
## 31 2 1 2.798037e-03 0 1 0 0 0 0 0 0 0 0 0 0 1 0 0
## 32 2 2 1.767266e-03 0 1 0 0 0 0 0 0 0 0 0 0 0 1 0
## 33 2 0 7.058583e-03 0 1 0 0 0 0 0 0 0 0 0 0 0 0 1
## 34 2 0 3.968089e-03 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
## 35 2 3 1.430084e-03 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
## 36 2 3 3.811326e-03 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
## 37 2 1 5.764080e-03 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
## 38 2 1 6.413796e-03 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
## 39 2 3 7.663549e-03 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0
## 40 2 2 8.811078e-03 0 0 1 1 0 0 0 0 0 0 0 0 0 0 0
## 41 2 1 3.992526e-03 0 0 1 0 1 0 0 0 0 0 0 0 0 0 0
## 42 2 1 7.574715e-04 0 0 1 0 0 1 0 0 0 0 0 0 0 0 0
## 43 2 3 5.260050e-03 0 0 1 0 0 0 1 0 0 0 0 0 0 0 0
## 44 2 0 1.573687e-03 0 0 1 0 0 0 0 1 0 0 0 0 0 0 0
## 45 2 0 6.836583e-03 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0
## 46 2 0 8.162085e-03 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0
## 47 2 3 2.451164e-03 0 0 1 0 0 0 0 0 0 0 1 0 0 0 0
## 48 2 3 7.049975e-03 0 0 1 0 0 0 0 0 0 0 0 1 0 0 0
## 49 2 1 8.374299e-03 0 0 1 0 0 0 0 0 0 0 0 0 1 0 0
## 50 2 2 7.591067e-03 0 0 1 0 0 0 0 0 0 0 0 0 0 1 0
## 51 2 0 4.572165e-03 0 0 1 0 0 0 0 0 0 0 0 0 0 0 1
## 52 2 0 6.161395e-03 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
## 53 2 3 5.848518e-03 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
## 54 2 3 3.126913e-03 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
## 55 2 1 4.649775e-03 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
## 56 2 1 1.550279e-03 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
## 57 2 3 5.747022e-03 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0
## 58 2 1 8.182635e-03 0 0 0 1 1 0 0 0 0 0 0 0 0 0 0
## 59 2 1 6.306798e-03 0 0 0 1 0 1 0 0 0 0 0 0 0 0 0
## 60 2 3 8.638546e-03 0 0 0 1 0 0 1 0 0 0 0 0 0 0 0
## 61 2 0 8.615334e-03 0 0 0 1 0 0 0 1 0 0 0 0 0 0 0
## 62 2 0 2.737465e-03 0 0 0 1 0 0 0 0 1 0 0 0 0 0 0
## 63 2 0 7.738018e-03 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0
## 64 2 3 8.932248e-03 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0
## 65 2 3 4.238021e-03 0 0 0 1 0 0 0 0 0 0 0 1 0 0 0
## 66 2 1 2.764486e-03 0 0 0 1 0 0 0 0 0 0 0 0 1 0 0
## 67 2 2 2.686600e-03 0 0 0 1 0 0 0 0 0 0 0 0 0 1 0
## 68 2 0 3.919156e-04 0 0 0 1 0 0 0 0 0 0 0 0 0 0 1
## 69 2 0 3.444762e-03 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## 70 2 3 2.572652e-03 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## 71 2 3 8.403993e-03 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## 72 2 1 9.678033e-03 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## 73 2 1 7.146743e-03 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## 74 2 3 6.295606e-04 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0
## 75 1 1 1.488266e-03 0 0 0 0 1 1 0 0 0 0 0 0 0 0 0
## 76 1 3 1.892513e-04 0 0 0 0 1 0 1 0 0 0 0 0 0 0 0
## 77 1 0 2.618013e-03 0 0 0 0 1 0 0 1 0 0 0 0 0 0 0
## 78 1 0 4.548471e-04 0 0 0 0 1 0 0 0 1 0 0 0 0 0 0
## 79 1 0 5.325966e-04 0 0 0 0 1 0 0 0 0 1 0 0 0 0 0
## 80 1 3 1.129493e-03 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0
## 81 1 3 6.857279e-03 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0
## 82 1 1 1.084975e-03 0 0 0 0 1 0 0 0 0 0 0 0 1 0 0
## 83 1 2 6.561277e-03 0 0 0 0 1 0 0 0 0 0 0 0 0 1 0
## 84 1 0 8.922124e-03 0 0 0 0 1 0 0 0 0 0 0 0 0 0 1
## 85 1 0 2.766864e-03 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
## 86 1 3 1.508741e-03 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
## 87 1 3 6.561912e-03 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
## 88 1 1 4.687753e-03 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
## 89 1 1 1.025233e-03 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
## 90 1 3 3.899042e-03 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0
## 91 1 3 2.148068e-04 0 0 0 0 0 1 1 0 0 0 0 0 0 0 0
## 92 1 0 6.771330e-03 0 0 0 0 0 1 0 1 0 0 0 0 0 0 0
## 93 1 0 9.310955e-03 0 0 0 0 0 1 0 0 1 0 0 0 0 0 0
## 94 1 0 3.025980e-03 0 0 0 0 0 1 0 0 0 1 0 0 0 0 0
## 95 1 3 1.293879e-03 0 0 0 0 0 1 0 0 0 0 1 0 0 0 0
## 96 1 3 9.356025e-03 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0
## 97 1 1 5.016836e-03 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0
## 98 1 2 6.548749e-03 0 0 0 0 0 1 0 0 0 0 0 0 0 1 0
## 99 1 0 3.754073e-03 0 0 0 0 0 1 0 0 0 0 0 0 0 0 1
## 100 1 0 7.112924e-05 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
## 101 1 3 7.438396e-03 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
## 102 1 3 8.103833e-03 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
## 103 1 1 1.200616e-04 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
## 104 1 1 8.069200e-03 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
## 105 1 3 5.341441e-03 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
## 106 3 0 5.683697e-03 0 0 0 0 0 0 1 1 0 0 0 0 0 0 0
## 107 3 0 4.425441e-03 0 0 0 0 0 0 1 0 1 0 0 0 0 0 0
## 108 3 0 6.467885e-03 0 0 0 0 0 0 1 0 0 1 0 0 0 0 0
## 109 3 3 7.576232e-03 0 0 0 0 0 0 1 0 0 0 1 0 0 0 0
## 110 3 3 6.937853e-03 0 0 0 0 0 0 1 0 0 0 0 1 0 0 0
## 111 3 1 1.873689e-03 0 0 0 0 0 0 1 0 0 0 0 0 1 0 0
## 112 3 2 3.831760e-03 0 0 0 0 0 0 1 0 0 0 0 0 0 1 0
## 113 3 0 9.282205e-03 0 0 0 0 0 0 1 0 0 0 0 0 0 0 1
## 114 3 0 3.256324e-03 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
## 115 3 3 1.979895e-03 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
## 116 3 3 5.671657e-03 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
## 117 3 1 3.050348e-04 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
## 118 3 1 7.987553e-03 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
## 119 3 3 2.257670e-03 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0
## 120 0 0 4.841249e-03 0 0 0 0 0 0 0 1 1 0 0 0 0 0 0
## 121 0 0 3.768506e-03 0 0 0 0 0 0 0 1 0 1 0 0 0 0 0
## 122 0 3 6.680156e-03 0 0 0 0 0 0 0 1 0 0 1 0 0 0 0
## 123 0 3 5.642713e-03 0 0 0 0 0 0 0 1 0 0 0 1 0 0 0
## 124 0 1 8.427546e-03 0 0 0 0 0 0 0 1 0 0 0 0 1 0 0
## 125 0 2 5.142788e-05 0 0 0 0 0 0 0 1 0 0 0 0 0 1 0
## 126 0 0 4.223932e-03 0 0 0 0 0 0 0 1 0 0 0 0 0 0 1
## 127 0 0 1.032015e-03 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
## 128 0 3 4.464993e-03 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
## 129 0 3 4.057832e-03 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
## 130 0 1 6.726407e-03 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
## 131 0 1 7.753782e-03 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
## 132 0 3 5.879756e-03 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
## 133 0 0 3.018211e-03 0 0 0 0 0 0 0 0 1 1 0 0 0 0 0
## 134 0 3 6.155534e-03 0 0 0 0 0 0 0 0 1 0 1 0 0 0 0
## 135 0 3 4.492693e-03 0 0 0 0 0 0 0 0 1 0 0 1 0 0 0
## 136 0 1 1.502868e-04 0 0 0 0 0 0 0 0 1 0 0 0 1 0 0
## 137 0 2 7.392795e-04 0 0 0 0 0 0 0 0 1 0 0 0 0 1 0
## 138 0 0 7.289864e-03 0 0 0 0 0 0 0 0 1 0 0 0 0 0 1
## 139 0 0 2.399933e-03 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## 140 0 3 3.624943e-03 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## 141 0 3 5.584377e-03 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## 142 0 1 6.101291e-03 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## 143 0 1 1.184174e-03 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## 144 0 3 6.343722e-03 0 0 0 0 0 0 0 0 1 0 0 0 0 0 0
## 145 0 3 4.614189e-04 0 0 0 0 0 0 0 0 0 1 1 0 0 0 0
## 146 0 3 5.479712e-03 0 0 0 0 0 0 0 0 0 1 0 1 0 0 0
## 147 0 1 9.293646e-03 0 0 0 0 0 0 0 0 0 1 0 0 1 0 0
## 148 0 2 2.635037e-03 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0
## 149 0 0 9.645663e-03 0 0 0 0 0 0 0 0 0 1 0 0 0 0 1
## 150 0 0 3.949846e-03 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
## 151 0 3 4.094379e-03 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
## 152 0 3 8.216080e-03 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
## 153 0 1 4.202408e-03 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
## 154 0 1 5.328139e-03 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
## 155 0 3 6.122213e-03 0 0 0 0 0 0 0 0 0 1 0 0 0 0 0
## 156 3 3 8.702686e-03 0 0 0 0 0 0 0 0 0 0 1 1 0 0 0
## 157 3 1 9.072682e-03 0 0 0 0 0 0 0 0 0 0 1 0 1 0 0
## 158 3 2 1.134928e-03 0 0 0 0 0 0 0 0 0 0 1 0 0 1 0
## 159 3 0 8.203916e-04 0 0 0 0 0 0 0 0 0 0 1 0 0 0 1
## 160 3 0 3.847730e-03 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
## 161 3 3 1.283455e-03 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
## 162 3 3 1.458371e-03 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
## 163 3 1 6.611957e-03 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
## 164 3 1 3.552204e-03 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
## 165 3 3 6.598512e-05 0 0 0 0 0 0 0 0 0 0 1 0 0 0 0
## 166 3 1 9.397960e-03 0 0 0 0 0 0 0 0 0 0 0 1 1 0 0
## 167 3 2 7.996584e-03 0 0 0 0 0 0 0 0 0 0 0 1 0 1 0
## 168 3 0 3.002585e-03 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1
## 169 3 0 7.737542e-03 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
## 170 3 3 6.895721e-03 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
## 171 3 3 9.150447e-03 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
## 172 3 1 4.248872e-04 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
## 173 3 1 1.694629e-03 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
## 174 3 3 8.612203e-03 0 0 0 0 0 0 0 0 0 0 0 1 0 0 0
## 175 1 2 3.563337e-03 0 0 0 0 0 0 0 0 0 0 0 0 1 1 0
## 176 1 0 7.205782e-03 0 0 0 0 0 0 0 0 0 0 0 0 1 0 1
## 177 1 0 3.028388e-03 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
## 178 1 3 8.763058e-03 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
## 179 1 3 1.599403e-04 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
## 180 1 1 4.299360e-03 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
## 181 1 1 3.315853e-03 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
## 182 1 3 2.598500e-03 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0
## 183 2 0 7.018091e-05 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1
## 184 2 0 7.399229e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
## 185 2 3 2.536849e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
## 186 2 3 9.184262e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
## 187 2 1 7.600533e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
## 188 2 1 8.138411e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
## 189 2 3 6.571356e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0
## 190 0 0 4.998703e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
## 191 0 3 8.537730e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
## 192 0 3 7.744691e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
## 193 0 1 5.861641e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
## 194 0 1 9.039417e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
## 195 0 3 3.226798e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1
## 196 0 3 8.754515e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 197 0 3 3.931067e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 198 0 1 5.489599e-04 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 199 0 1 1.286410e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 200 0 3 6.788565e-04 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 201 3 3 5.196894e-04 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 202 3 1 7.156044e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 203 3 1 6.201356e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 204 3 3 7.402762e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 205 3 1 1.992044e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 206 3 1 9.059592e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 207 3 3 2.927555e-04 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 208 1 1 5.736212e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 209 1 3 6.096904e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## 210 1 3 1.584394e-03 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
## X16 X17 X18 X19 X20 X21
## 1 0 0 0 0 0 0
## 2 0 0 0 0 0 0
## 3 0 0 0 0 0 0
## 4 0 0 0 0 0 0
## 5 0 0 0 0 0 0
## 6 0 0 0 0 0 0
## 7 0 0 0 0 0 0
## 8 0 0 0 0 0 0
## 9 0 0 0 0 0 0
## 10 0 0 0 0 0 0
## 11 0 0 0 0 0 0
## 12 0 0 0 0 0 0
## 13 0 0 0 0 0 0
## 14 0 0 0 0 0 0
## 15 1 0 0 0 0 0
## 16 0 1 0 0 0 0
## 17 0 0 1 0 0 0
## 18 0 0 0 1 0 0
## 19 0 0 0 0 1 0
## 20 0 0 0 0 0 1
## 21 0 0 0 0 0 0
## 22 0 0 0 0 0 0
## 23 0 0 0 0 0 0
## 24 0 0 0 0 0 0
## 25 0 0 0 0 0 0
## 26 0 0 0 0 0 0
## 27 0 0 0 0 0 0
## 28 0 0 0 0 0 0
## 29 0 0 0 0 0 0
## 30 0 0 0 0 0 0
## 31 0 0 0 0 0 0
## 32 0 0 0 0 0 0
## 33 0 0 0 0 0 0
## 34 1 0 0 0 0 0
## 35 0 1 0 0 0 0
## 36 0 0 1 0 0 0
## 37 0 0 0 1 0 0
## 38 0 0 0 0 1 0
## 39 0 0 0 0 0 1
## 40 0 0 0 0 0 0
## 41 0 0 0 0 0 0
## 42 0 0 0 0 0 0
## 43 0 0 0 0 0 0
## 44 0 0 0 0 0 0
## 45 0 0 0 0 0 0
## 46 0 0 0 0 0 0
## 47 0 0 0 0 0 0
## 48 0 0 0 0 0 0
## 49 0 0 0 0 0 0
## 50 0 0 0 0 0 0
## 51 0 0 0 0 0 0
## 52 1 0 0 0 0 0
## 53 0 1 0 0 0 0
## 54 0 0 1 0 0 0
## 55 0 0 0 1 0 0
## 56 0 0 0 0 1 0
## 57 0 0 0 0 0 1
## 58 0 0 0 0 0 0
## 59 0 0 0 0 0 0
## 60 0 0 0 0 0 0
## 61 0 0 0 0 0 0
## 62 0 0 0 0 0 0
## 63 0 0 0 0 0 0
## 64 0 0 0 0 0 0
## 65 0 0 0 0 0 0
## 66 0 0 0 0 0 0
## 67 0 0 0 0 0 0
## 68 0 0 0 0 0 0
## 69 1 0 0 0 0 0
## 70 0 1 0 0 0 0
## 71 0 0 1 0 0 0
## 72 0 0 0 1 0 0
## 73 0 0 0 0 1 0
## 74 0 0 0 0 0 1
## 75 0 0 0 0 0 0
## 76 0 0 0 0 0 0
## 77 0 0 0 0 0 0
## 78 0 0 0 0 0 0
## 79 0 0 0 0 0 0
## 80 0 0 0 0 0 0
## 81 0 0 0 0 0 0
## 82 0 0 0 0 0 0
## 83 0 0 0 0 0 0
## 84 0 0 0 0 0 0
## 85 1 0 0 0 0 0
## 86 0 1 0 0 0 0
## 87 0 0 1 0 0 0
## 88 0 0 0 1 0 0
## 89 0 0 0 0 1 0
## 90 0 0 0 0 0 1
## 91 0 0 0 0 0 0
## 92 0 0 0 0 0 0
## 93 0 0 0 0 0 0
## 94 0 0 0 0 0 0
## 95 0 0 0 0 0 0
## 96 0 0 0 0 0 0
## 97 0 0 0 0 0 0
## 98 0 0 0 0 0 0
## 99 0 0 0 0 0 0
## 100 1 0 0 0 0 0
## 101 0 1 0 0 0 0
## 102 0 0 1 0 0 0
## 103 0 0 0 1 0 0
## 104 0 0 0 0 1 0
## 105 0 0 0 0 0 1
## 106 0 0 0 0 0 0
## 107 0 0 0 0 0 0
## 108 0 0 0 0 0 0
## 109 0 0 0 0 0 0
## 110 0 0 0 0 0 0
## 111 0 0 0 0 0 0
## 112 0 0 0 0 0 0
## 113 0 0 0 0 0 0
## 114 1 0 0 0 0 0
## 115 0 1 0 0 0 0
## 116 0 0 1 0 0 0
## 117 0 0 0 1 0 0
## 118 0 0 0 0 1 0
## 119 0 0 0 0 0 1
## 120 0 0 0 0 0 0
## 121 0 0 0 0 0 0
## 122 0 0 0 0 0 0
## 123 0 0 0 0 0 0
## 124 0 0 0 0 0 0
## 125 0 0 0 0 0 0
## 126 0 0 0 0 0 0
## 127 1 0 0 0 0 0
## 128 0 1 0 0 0 0
## 129 0 0 1 0 0 0
## 130 0 0 0 1 0 0
## 131 0 0 0 0 1 0
## 132 0 0 0 0 0 1
## 133 0 0 0 0 0 0
## 134 0 0 0 0 0 0
## 135 0 0 0 0 0 0
## 136 0 0 0 0 0 0
## 137 0 0 0 0 0 0
## 138 0 0 0 0 0 0
## 139 1 0 0 0 0 0
## 140 0 1 0 0 0 0
## 141 0 0 1 0 0 0
## 142 0 0 0 1 0 0
## 143 0 0 0 0 1 0
## 144 0 0 0 0 0 1
## 145 0 0 0 0 0 0
## 146 0 0 0 0 0 0
## 147 0 0 0 0 0 0
## 148 0 0 0 0 0 0
## 149 0 0 0 0 0 0
## 150 1 0 0 0 0 0
## 151 0 1 0 0 0 0
## 152 0 0 1 0 0 0
## 153 0 0 0 1 0 0
## 154 0 0 0 0 1 0
## 155 0 0 0 0 0 1
## 156 0 0 0 0 0 0
## 157 0 0 0 0 0 0
## 158 0 0 0 0 0 0
## 159 0 0 0 0 0 0
## 160 1 0 0 0 0 0
## 161 0 1 0 0 0 0
## 162 0 0 1 0 0 0
## 163 0 0 0 1 0 0
## 164 0 0 0 0 1 0
## 165 0 0 0 0 0 1
## 166 0 0 0 0 0 0
## 167 0 0 0 0 0 0
## 168 0 0 0 0 0 0
## 169 1 0 0 0 0 0
## 170 0 1 0 0 0 0
## 171 0 0 1 0 0 0
## 172 0 0 0 1 0 0
## 173 0 0 0 0 1 0
## 174 0 0 0 0 0 1
## 175 0 0 0 0 0 0
## 176 0 0 0 0 0 0
## 177 1 0 0 0 0 0
## 178 0 1 0 0 0 0
## 179 0 0 1 0 0 0
## 180 0 0 0 1 0 0
## 181 0 0 0 0 1 0
## 182 0 0 0 0 0 1
## 183 0 0 0 0 0 0
## 184 1 0 0 0 0 0
## 185 0 1 0 0 0 0
## 186 0 0 1 0 0 0
## 187 0 0 0 1 0 0
## 188 0 0 0 0 1 0
## 189 0 0 0 0 0 1
## 190 1 0 0 0 0 0
## 191 0 1 0 0 0 0
## 192 0 0 1 0 0 0
## 193 0 0 0 1 0 0
## 194 0 0 0 0 1 0
## 195 0 0 0 0 0 1
## 196 1 1 0 0 0 0
## 197 1 0 1 0 0 0
## 198 1 0 0 1 0 0
## 199 1 0 0 0 1 0
## 200 1 0 0 0 0 1
## 201 0 1 1 0 0 0
## 202 0 1 0 1 0 0
## 203 0 1 0 0 1 0
## 204 0 1 0 0 0 1
## 205 0 0 1 1 0 0
## 206 0 0 1 0 1 0
## 207 0 0 1 0 0 1
## 208 0 0 0 1 1 0
## 209 0 0 0 1 0 1
## 210 0 0 0 0 1 1
## [1] 0.10560507 0.08368331 0.10301350 0.11001701 0.07123077 0.09154385
## [7] 0.08887632 0.09669189 0.09092959 0.10799889 0.08130134 0.11937342
## [13] 0.09931972 0.09517933 0.10860574 0.07083801 0.10019347 0.10187145
## [19] 0.08875429 0.10362694 0.08134610
Existe la función Pk para encontrar dicha probabilidad
## [,1] [,2] [,3] [,4] [,5] [,6] [,7]
## [1,] 0.1056051 0.08368331 0.1030135 0.110017 0.07123077 0.09154385 0.08887632
## [,8] [,9] [,10] [,11] [,12] [,13] [,14]
## [1,] 0.09669189 0.09092959 0.1079989 0.08130134 0.1193734 0.09931972 0.09517933
## [,15] [,16] [,17] [,18] [,19] [,20] [,21]
## [1,] 0.1086057 0.07083801 0.1001935 0.1018715 0.08875429 0.1036269 0.0813461
Para la probabilidad de inclusión de grado II, se utiliza la función Pikl
## [,1] [,2] [,3] [,4] [,5] [,6]
## [1,] 0.105605072 0.003785198 0.0064859782 0.002200217 0.004563165 0.0064492024
## [2,] 0.003785198 0.083683313 0.0040114666 0.005897901 0.004204774 0.0021054207
## [3,] 0.006485978 0.004011467 0.1030134976 0.008811078 0.003992526 0.0007574715
## [4,] 0.002200217 0.005897901 0.0088110776 0.110017006 0.008182635 0.0063067984
## [5,] 0.004563165 0.004204774 0.0039925264 0.008182635 0.071230768 0.0014882660
## [6,] 0.006449202 0.002105421 0.0007574715 0.006306798 0.001488266 0.0915438547
## [,7] [,8] [,9] [,10] [,11]
## [1,] 0.0054687329 0.001563639 0.0084614921 0.0081085502 0.0095760598
## [2,] 0.0015680355 0.006315877 0.0067772449 0.0077485122 0.0004947712
## [3,] 0.0052600504 0.001573687 0.0068365833 0.0081620854 0.0024511638
## [4,] 0.0086385461 0.008615334 0.0027374647 0.0077380182 0.0089322477
## [5,] 0.0001892513 0.002618013 0.0004548471 0.0005325966 0.0011294930
## [6,] 0.0002148068 0.006771330 0.0093109554 0.0030259804 0.0012938790
## [,12] [,13] [,14] [,15] [,16] [,17]
## [1,] 5.604606e-03 0.008131057 0.008571198 0.0029572942 1.576249e-03 0.009179693
## [2,] 9.930176e-05 0.002798037 0.001767266 0.0070585828 3.968089e-03 0.001430084
## [3,] 7.049975e-03 0.008374299 0.007591067 0.0045721646 6.161395e-03 0.005848518
## [4,] 4.238021e-03 0.002764486 0.002686600 0.0003919156 3.444762e-03 0.002572652
## [5,] 6.857279e-03 0.001084975 0.006561277 0.0089221235 2.766864e-03 0.001508741
## [6,] 9.356025e-03 0.005016836 0.006548749 0.0037540728 7.112924e-05 0.007438396
## [,18] [,19] [,20] [,21]
## [1,] 0.004840673 0.0001909036 0.007559560 0.0003316060
## [2,] 0.003811326 0.0057640805 0.006413796 0.0076635492
## [3,] 0.003126913 0.0046497750 0.001550279 0.0057470220
## [4,] 0.008403993 0.0096780333 0.007146743 0.0006295606
## [5,] 0.006561912 0.0046877532 0.001025233 0.0038990424
## [6,] 0.008103833 0.0001200616 0.008069200 0.0053414412
## [,1]
## [1,] 0
## [2,] 0
## [3,] 3
## [4,] 0
## [5,] 5
## [6,] 6
## [7,] 0
## [8,] 0
## [9,] 0
## [10,] 0
## [11,] 0
## [12,] 0
## [13,] 13
## [14,] 0
## [15,] 0
## [16,] 0
## [17,] 0
## [18,] 0
## [19,] 19
## [20,] 0
## [21,] 0
## # A tibble: 5 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 563 1 0.5 41 5 2603 1 1
## 2 1821 1 1.2 44 2 1411 0 1
## 3 1859 0 0.5 22 1 1067 1 1
## 4 1815 0 2.8 33 4 1482 0 1
## 5 1131 1 0.5 49 5 1835 1 1
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
## [1] 0.28757752 0.78830514 0.40897692 0.88301740 0.94046728 0.04555650
## [7] 0.52810549 0.89241904 0.55143501 0.45661474 0.95683335 0.45333416
## [13] 0.67757064 0.57263340 0.10292468 0.89982497 0.24608773 0.04205953
## [19] 0.32792072 0.95450365 0.88953932
## $Ksel
## [1] 14
##
## $ns
## [1] 1
## # A tibble: 1 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 803 1 2.1 17 4 2680 0 1
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
Para realizar el proceso de estimación a partir de la muestra, es necesario, nombrar las columnas de las muestras
## # A tibble: 1 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 803 1 2.1 17 4 2680 0 1
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
Para las estimaciones se utiliza la funcion E.BE
1.1 Estimacion del total del poder de la batería
## N y
## Estimation 9.149131 7346.7521
## Standard Error 8.634666 6933.6371
## CVE 94.376904 94.3769
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 7346.752 48075324 6933.637 94.3769 NaN NaN NA
Tenemos un valor total de 7346.752, con una varianza del estimador de 48075324, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y nos da un error estándar de 6933.637 y un coeficiente de variación del estimador de 94.3769.
1.2 Estimacion del total de la memoria interna
## N y
## Estimation 9.149131 155.5352
## Standard Error 8.634666 146.7893
## CVE 94.376904 94.3769
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 155.5352 21547.11 146.7893 94.3769 NaN NaN NA
Tenemos un valor total de 155.5352 , con una varianza del estimador de 21547.11, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y nos da un error estándar de 146.7893 y un coeficiente de variación del estimador de 94.3769.
1.3 Estimacion del total de la ram
## N y
## Estimation 9.149131 24519.6706
## Standard Error 8.634666 23140.9060
## CVE 94.376904 94.3769
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 24519.67 535501531 23140.91 94.3769 NaN NaN NA
Tenemos un valor total de 24519.67, con una varianza del estimador de 535501531, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y nos da un error estándar de 23140.91 y un coeficiente de variación del estimador de 94.3769.
1.4 Estimacion del total de la altura de la resolución de los megapixeles
## N y
## Estimation 9.149131 3147.3010
## Standard Error 8.634666 2970.3252
## CVE 94.376904 94.3769
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 3147.301 8822832 2970.325 94.3769 NaN NaN NA
Tenemos un valor total de 3147.301, con una varianza del estimador de 8822832, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y nos da un error estándar de 2970.325 y un coeficiente de variación del estimador de 94.3769.
1.5 Estimacion del total de la altura de la altura de la pantalla
## N y
## Estimation 9.149131 64.04392
## Standard Error 8.634666 60.44266
## CVE 94.376904 94.37690
## DEFF NA NA
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 1 64.04392 3653.316 60.44266 94.3769 NaN NaN NA
Tenemos un valor total de 64.04392, con una varianza del estimador de 3653.316, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y nos da un error estándar de 60.44266 y un coeficiente de variación del estimador de 94.3769.
2.1 Estimación de la batería promedio
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 803 0 0 0 NaN NaN
Solo se interesa en la media del poder de la batería, es 803 , estimado, coeficiente de variación
2.2 Estimación de la memoria interna
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 17 0 0 0 NaN NaN
Solo se interesa en la media de la memoria interna, la cual es de 17
2.3 Estimación de la ram
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 2680 0 0 0 NaN NaN
Solo se interesa en la media de la ram, la cual es de 2680
2.4 Estimación de la altura de la resolución de los megapixeles
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 344 0 0 0 NaN NaN
Solo se interesa en la media de la altura de la resolución de los megapixeles, la cual es de 344
2.5 Estimación de la altura de la pantalla
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 7 0 0 0 NaN NaN
Solo se interesa en la media de la memoria interna, la cual es de 7
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 200.75 0 0 0 NaN NaN
Se tiene un ratio de 200.75
3.2 Estimación de la razón entre la altura de la resolución de los megapixeles Vs el ancho de la resolución de los megapixeles
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 0.2388889 0 0 0 NaN NaN
Obtenemos un valor de 0.2388889
3.3 Estimación de la razón entre la altura de la pantalla y el ancho de la pantalla
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 7 0 0 0 NaN NaN
Se tiene un ratio de 7
## $Estimation
## Uz prop Vest e.e Cve IC.inf IC.sup
## 1 0 0.493 0.0001113157 0.01055062 2.140086 0.4723212 0.5136788
## 2 1 0.507 0.0001113157 0.01055062 2.080991 0.4863212 0.5276788
Nos indica la proporción para los que no tienen wifi de 0.493, en cambio los que si tienen de 0.507, con una varianza del estimador de 0.0001113157 para los que no tiene wifi y para los que si, en el caso de los errores estándar el valor también es igual para ambos casos 0.01055062, con un coeficiente de variación del estimador de 2.140086 para quienes no tiene wifi y de 2.080991 para los que si, en unos intervalos de confianza, superior de 0.4723212 e inferior de 0.5136788 para los dispositivos sin wifi y de los intervalos son: superior de 0.4863212 e inferior de 0.5276788.
## $Estimation
## total Vest e.e Cve IC.inf IC.sup deff
## 0 0.000 0 0.000 NaN NaN NaN NA
## 1 7346.752 48075324 6933.637 94.3769 NaN NaN NA
## [1] 2000
## $n
## [1] 242
##
## $no
## [1] 275
Se utiliza la función S.SI de TeachingSampling para obtener una muestra MAS.
## [,1]
## [1,] 0
## [2,] 0
## [3,] 0
## [4,] 0
## [5,] 0
## [6,] 0
## [7,] 0
## [8,] 0
## [9,] 9
## [10,] 0
## $Ksel
## [1] 7 10 19 24 38 42 51 52 58 76 84 102 104 125 134
## [16] 137 141 144 162 165 172 174 175 182 184 197 201 217 224 232
## [31] 238 246 270 275 286 289 294 295 304 314 315 337 340 350 372
## [46] 374 385 391 393 397 402 403 406 425 426 428 429 486 494 525
## [61] 527 533 534 535 536 540 552 571 588 593 594 601 608 612 617
## [76] 629 633 634 647 661 673 680 687 688 701 702 705 706 710 711
## [91] 729 736 737 746 749 762 775 812 821 827 830 831 846 849 851
## [106] 853 858 884 892 901 902 907 909 915 918 926 932 938 956 972
## [121] 974 981 996 1000 1002 1012 1013 1022 1040 1048 1055 1056 1069 1107 1116
## [136] 1123 1130 1134 1136 1139 1155 1167 1170 1178 1180 1189 1210 1219 1223 1239
## [151] 1246 1251 1252 1256 1259 1269 1276 1277 1285 1290 1310 1333 1335 1341 1343
## [166] 1363 1398 1404 1409 1411 1421 1450 1451 1458 1466 1470 1481 1489 1498 1507
## [181] 1516 1536 1548 1559 1577 1599 1600 1611 1623 1625 1631 1637 1644 1654 1657
## [196] 1658 1659 1677 1683 1691 1692 1698 1700 1706 1712 1713 1716 1718 1721 1733
## [211] 1736 1739 1740 1742 1769 1772 1796 1799 1803 1812 1814 1816 1825 1829 1835
## [226] 1837 1852 1872 1876 1879 1887 1892 1896 1900 1912 1924 1925 1928 1966 1971
## [241] 1991 2000
La muestra seleccionada finalmente es la muestra 2, se procede a visualizar la muestra y hacer estimaciones.
## # A tibble: 242 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 1821 0 1.7 10 8 3220 0 1
## 2 509 1 0.6 9 5 513 1 1
## 3 1131 1 0.5 49 5 1835 1 1
## 4 1602 1 2.8 38 3 1037 1 1
## 5 1725 1 1.6 6 2 3429 1 1
## 6 1646 1 2.3 41 2 3339 0 1
## 7 1547 1 3 14 3 2059 1 1
## 8 1760 0 1.4 63 8 2053 1 0
## 9 987 0 1.3 61 3 3963 1 1
## 10 819 0 0.6 42 6 1814 1 1
## # ℹ 232 more rows
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
Para la estimación de los parámetros poblacionales renombramos las columnas del dataframe de la muestra.
## # A tibble: 6 × 21
## battery_power bluetooth clock_speed int_memory n_cores ram dual_sim three_g
## <dbl> <fct> <dbl> <dbl> <dbl> <dbl> <fct> <fct>
## 1 1821 0 1.7 10 8 3220 0 1
## 2 509 1 0.6 9 5 513 1 1
## 3 1131 1 0.5 49 5 1835 1 1
## 4 1602 1 2.8 38 3 1037 1 1
## 5 1725 1 1.6 6 2 3429 1 1
## 6 1646 1 2.3 41 2 3339 0 1
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## # px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## # talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
## $Estimation
## Uz prop Vest e.e Cve IC.inf IC.sup
## 1 o 0.2520661 0.0006876216 0.02622254 10.40304 0.2006709 0.3034613
## 2 1 0.2520661 0.0006876216 0.02622254 10.40304 0.2006709 0.3034613
## 3 2 0.2520661 0.0006876216 0.02622254 10.40304 0.2006709 0.3034613
## 4 3 0.2438017 0.0006724255 0.02593117 10.63617 0.1929775 0.2946258
En este caso, obtenemos la proporción de los rangos de precios, con su varianza del estimador, el error estándar, el coeficiente de variación del estimador, la confiabilidad del estimador inferior y superior.
Tenemos que la mínima de las proporciones es 0.2024793, la cual corresponde a 0, los dispositivos de gama baja, y la proporción más alta es 0.2892562, correspondientes a los dispositivos de gama alta.
Con unas varianzas del estimador de 0.0005889718 para el caso 0, 0.0007434235 para el caso 1, 0.0007498382 para el caso 2 y 0.0006322556 para el caso 3, en el que destaca el caso 2 quien tuvo una mayor varianza del estimador.
Al revisar el error estándar tenemos para el caso 0 un valor de 0.02426874, para el caso 1 es 0.02726579, para el caso 2 de 0.02738317, finalmente, para el caso 3 el valor es 0.02514469, donde destaca el caso 0 que nos indica quienes tuvieron menor error estándar y quines más fue el caso 2.
Vemos para el coeficiente de variación del estimador que los valores se encuentran entre 9 y 12, para el caso 0 tenemos un valor de 11.985786, para el caso 1 de 9.562786, para el caso 2 de 9.466755 y para el último caso 3, es 11.268548, en el caso 2 el valor es mínimo, y en el caso 0 el valor es el más alto.
Los intervalos de confianzas se representan así: caso 0 (0.1549135 - 0.2500452) caso 1 (0.2316840 - 0.3385639) caso 2 (0.2355862 - 0.3429262) caso 3 (0.1738578 - 0.2724232)
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 1215.095 751.9073 27.42093 2.25669 1161.351 1268.839
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## 1 2430190 3007629204 54841.86 2.25669 2322702 2537678
Obtenemos una media de 1261.033
Tenemos un total de 2522066, con una varianza del estimador de 2719153523, con un error estándar de 52145.5, un coeficiente de variación del estimador de 2.067571 y un intervalo de confianza inferior de 2419863 y un intervalo de confianza superior de 2624269.
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 31.76033 1.10221 1.049862 3.305577 29.70264 33.81802
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## 1 63520.66 4408842 2099.724 3.305577 59405.28 67636.04
Obtenemos una media de 31.95455, con una varianza del estimador de 1.277046, un eror estándar de 1.130065, un coefieciente de variación del estimador de 3.536475 y un intervalo de confianza inferior de 29.73966 y un coeficiente de variación superior de 34.16943.
Tenemos un total de 63909.09 memoria interna, con una varianza del estimador de 5108183, con un error estándar de 2260.129, un coeficiente de variación del estimador de 3.536475 y un intervalo de confianza inferior de 59479.32 y un intervalo de confianza superior de 68338.86.
## $Estimation
## mean Vest e.e Cve IC.inf IC.sup
## 1 9.966942 0.1391964 0.3730903 3.743278 9.235699 10.69819
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## 1 19933.88 556785.5 746.1806 3.743278 18471.4 21396.37
Obtenemos una media de 9.863636, con una varianza del estimador de 0.1323353, un eror estándar de 0.3637792, un coefieciente de variación del estimador de 3.688084 y un intervalo de confianza inferior de 9.150642 y un coeficiente de variación superior de 10.57663.
Tenemos un total de 19727.27 memoria interna, con una varianza del estimador de 529341.2, con un error estándar de 727.5584, un coeficiente de variación del estimador de 3.688084 y un intervalo de confianza inferior de 18301.28 y un intervalo de confianza superior de 21153.26.
## [1] "Estimación del dominio universal =estm.Ud"
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## o 559322.3 4108930290 64100.94 11.46047 433686.8 684957.8
## 1 592264.5 4545383650 67419.46 11.38334 460124.7 724404.2
## 2 610900.8 4810034610 69354.41 11.35281 474968.7 746833.0
## 3 667702.5 5675953437 75338.92 11.28331 520040.9 815364.1
En este caso, obtenemos el total del poder de la batería respecto a los rangos de precios, con su varianza del estimador, el error estándar, el coeficiente de variación del estimador, la confiabilidad del estimador inferior y superior.
Tenemos que el total de cada grupo se comporta así, para el caso 0 422958.7, para el caso 1 739504.1, caso 2 de 697884.3 y caso 3 es 6135799032, en el que vemos que el caso 0 el valor del total es menor a los otros grupos, el 2 y el 3 tienen un valor similar y el caso 1 tiene un valor más alto.
Con unas varianzas del estimador de 2873596404 para el caso 0, 5744361917 para el caso 1, 5144712769 para el caso 2 y 6135799032 para el caso 3, en el que destaca el caso 0 la varianza del estimador es menor, en el caso 2 y 3 el valor es cercano y el caso 1 es mayor al de los demás.
Al revisar el error estándar tenemos para el caso 0 un valor de 53605.94, para el caso 1 es 75791.57, para el caso 2 de 71726.65, finalmente, para el caso 3 el valor es 78331.34, donde destaca el caso 0 que nos indica quienes tuvieron menor error estándar y quines más fue el caso 3.
Vemos para el coeficiente de variación del estimador que los valores se encuentran entre 10 y 13, para el caso 0 tenemos un valor de 12.67404, para el caso 1 de 10.24897, para el caso 2 de 10.27773 y para el último caso 3, es 11.83755, en el caso 1 y 2 el valor es similar, siendo el 1 el valor menor y en el caso 0 el valor es el más alto.
Los intervalos de confianzas se representan así: caso 0 (317893.0 - 528024.4) caso 1 (590955.4 - 888052.9) caso 2 (557302.6 - 838466.0) caso 3 (508192.4 - 815245.6)
## [1] "Estimación del dominio universal =estm.Ud"
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## o 2049.587 110676.1 332.6802 16.23157 1397.546 2701.628
## 1 2066.116 110669.1 332.6697 16.10121 1414.095 2718.136
## 2 2239.669 122110.8 349.4435 15.60246 1554.773 2924.566
## 3 2355.372 143200.9 378.4190 16.06621 1613.684 3097.059
En este caso, obtenemos el total de los megapixeles de la cámara frontal respecto a los rangos de precios, con su varianza del estimador, el error estándar, el coeficiente de variación del estimador, la confiabilidad del estimador inferior y superior.
Tenemos que el caso 0 el valor del total es menor a los otros grupos, le sigue el grupo 2 y el 3, quienes tienen un valor similar y el caso 1 tiene un valor más alto.
Las varianzas del estimador para el caso 0 son menores respecto a los demás grupos, le sigue el grupo 2 y 1 en el que la mayor es 157495.9.
El error estándar que destaca en nuestra muestra es el caso 0 el cual indica que tuvieron menor error estándar y quien más fue el caso 3.
Vemos para el coeficiente de variación del estimador que los valores son cercanos, el menor es el caso 2, le continua el 1 y el 3, finalmente tenemos al caso 0 con mayor coeficiente de variación del estimador.
Los intervalos de confianzas se representan así: caso 0 (1048.226 - 2108.799) caso 1 (1708.603 - 3167.430) caso 2 (1607.508 - 2904.888) caso 3 (1618.868 - 3174.521)
## [1] "Estimación del dominio universal =estm.Ud"
## $Estimation
## total Vest e.e Cve IC.inf IC.sup
## o 809.0909 9511.021 97.52446 12.05359 617.9465 1000.2353
## 1 780.1653 9231.969 96.08313 12.31574 591.8458 968.4848
## 2 736.3636 8377.644 91.52947 12.42993 556.9692 915.7581
## 3 722.3140 8202.204 90.56602 12.53832 544.8079 899.8202
En este caso, obtenemos el total de la velocidad del microprocesador respecto a los rangos de precios, con su varianza del estimador, el error estándar, el coeficiente de variación del estimador, la confiabilidad del estimador inferior y superior.
Tenemos que el caso 0 el valor del total es menor a los otros grupos, le sigue el grupo 3 y el 1, finalmente, el caso 2 tiene un valor más alto.
Las varianzas del estimador para el caso 0 son menores respecto a los demás grupos, le sigue el grupo 3 y 1 en el que la mayor es el grupo 2 con un valor de 10032.975.
El error estándar en la muestra, indica que el caso 0 tuvo menor error estándar, seguido del grupo 3, el 1 y quien más fue el caso 2 con un valor de 100.16474.
Vemos para el coeficiente de variación del estimador que los valores son cercanos, el caso 2 tiene menor coeficiente de variación del estimador, le continua el 1 y el 3, finalmente tenemos al caso 0 con mayor coeficiente de variación del estimador.
Los intervalos de confianzas se representan así: caso 0 (477.4169 - 830.0211) caso 1 (650.6083 - 1028.7306) caso 2 (709.4658 - 1102.1044) caso 3 (540.6364 - 899.0330)
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 0.008675307 1.09465e-07 0.0003308549 3.813754 0.008026843 0.00932377
El valor del ratio es 0.008837697, con una varianza del estimador de 9.926242e-08, un error estándar 0.0003150594, un coeficiente de variación del estimador de 3.564949 e intervalos de confianza inferior de 0.008220192 y superior de 0.009455202.
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 0.00384536 1.637805e-08 0.0001279767 3.328082 0.00359453 0.00409619
El valor del ratio es 0.003458247, con una varianza del estimador de 1.846063e-08, un error estándar 0.0001358699, un coeficiente de variación del estimador de 3.928867 e intervalos de confianza inferior de 0.003191946 y superior de 0.003724547.
## $Estimation
## ratio Vest e.e Cve IC.inf IC.sup
## 1 20.84056 0.9824306 0.9911764 4.755996 18.89789 22.78323
El valor del ratio es 20.4902, con una varianza del estimador de 0.9526166, un error estándar 0.9760208, un coeficiente de variación del estimador de 4.763355 e intervalos de confianza inferior de 18.57723 y superior de 22.40316.