Introducción

En la actualiad, encontramos varias empresas de ceulares como lo puede ser Apple, Samsung, Oppo, y muchas más, las cuales tienen a la venta diversas gamas de celulares, como gama baja, media, alta y muy alta, las cuales se clasifican dependiendo de la velocidad del microprocesador, los megapixeles de las cámaras tanto frontal como de la trasera, el número de nucleos del procesador, la ram, el tiempo de carga y demás variables. Por lo que en el presente análisis buscamos caracterizar el rango de precios y lograr estimar muestras significativas de la misma,de una base de datos de Kaggle, la cual recopiló datos de ventas de teléfonos móviles de varias empresas.

Exploración de Datos

Variables Numéricas (Continuas y Discretas)

  • battery_power:
    • Descripción: Energía total que una batería puede almacenar en un período de tiempo.
    • Unidad: mAh (miliamperios-hora)
    • Tipo de Dato: Numérico (Continuo)
  • clock_speed:
    • Descripción: Velocidad a la que el microprocesador del teléfono ejecuta las instrucciones.
    • Unidad: GHz (gigahertzios)
    • Tipo de Dato: Numérico (Continuo)
  • int_memory:
    • Descripción: Cantidad de memoria interna disponible en el teléfono.
    • Unidad: GB (gigabytes)
    • Tipo de Dato: Numérico (Continuo)
  • ram:
    • Descripción: Cantidad de memoria de acceso aleatorio disponible en el teléfono.
    • Unidad: MB (megabytes)
    • Tipo de Dato: Numérico (Continuo)
  • fc:
    • Descripción: Resolución de la cámara frontal del teléfono.
    • Unidad: Megapíxeles
    • Tipo de Dato: Numérico (Continuo)
  • pc:
    • Descripción: Resolución de la cámara principal (trasera) del teléfono.
    • Unidad: Megapíxeles
    • Tipo de Dato: Numérico (Continuo)
  • px_height:
    • Descripción: Altura de la resolución de la pantalla del teléfono.
    • Unidad: Píxeles
    • Tipo de Dato: Numérico (Discreto - entero)
  • px_width:
    • Descripción: Ancho de la resolución de la pantalla del teléfono.
    • Unidad: Píxeles
    • Tipo de Dato: Numérico (Discreto - entero)
  • m_dep:
    • Descripción: Profundidad del teléfono móvil.
    • Unidad: cm (centímetros)
    • Tipo de Dato: Numérico (Continuo)
  • mobile_wt:
    • Descripción: Peso del teléfono móvil.
    • Unidad: Gramos (se asume)
    • Tipo de Dato: Numérico (Continuo)
  • sc_h:
    • Descripción: Altura de la pantalla del teléfono móvil.
    • Unidad: cm (centímetros)
    • Tipo de Dato: Numérico (Continuo)
  • sc_w:
    • Descripción: Ancho de la pantalla del teléfono móvil.
    • Unidad: cm (centímetros)
    • Tipo de Dato: Numérico (Continuo)
  • talk_time:
    • Descripción: Tiempo máximo que la batería durará con una sola carga durante una llamada.
    • Unidad: Horas (se asume)
    • Tipo de Dato: Numérico (Continuo)

Variables Categóricas (Binarias)

  • bluetooth:
    • Descripción: Indica si el teléfono tiene capacidad Bluetooth.
    • Valores Posibles: 0 (No), 1 (Sí)
    • Tipo de Dato: Categórico (Binario)
  • dual_sim:
    • Descripción: Indica si el teléfono tiene soporte para dos tarjetas SIM.
    • Valores Posibles: 0 (No), 1 (Sí)
    • Tipo de Dato: Categórico (Binario)
  • three_g:
    • Descripción: Indica si el teléfono tiene capacidad de red 3G.
    • Valores Posibles: 0 (No), 1 (Sí)
    • Tipo de Dato: Categórico (Binario)
  • four_g:
    • Descripción: Indica si el teléfono tiene capacidad de red 4G.
    • Valores Posibles: 0 (No), 1 (Sí)
    • Tipo de Dato: Categórico (Binario)
  • touch_screen:
    • Descripción: Indica si el teléfono tiene pantalla táctil.
    • Valores Posibles: 0 (No), 1 (Sí)
    • Tipo de Dato: Categórico (Binario)
  • wifi:
    • Descripción: Indica si el teléfono tiene capacidad Wi-Fi.
    • Valores Posibles: 0 (No), 1 (Sí)
    • Tipo de Dato: Categórico (Binario)
  • n_cores:
    • Descripción: Número de núcleos (procesadores independientes) que tiene el microprocesador del teléfono.
    • Valores Posibles: 1 (núcleo), 2 (núcleos), 3 (núcleos), 4 (núcleos), 5 (núcleos), 6 (núcleos), 7 (núcleos), 8 (núcleos)
    • Tipo de Dato: Categórico (Ordinal)
  • price_range:
    • Descripción: Rango de precios del teléfono móvil.
    • Valores Posibles: 0 (Costo bajo), 1 (Costo medio), 2 (Costo alto), 3 (Costo muy alto)
    • Tipo de Dato: Categórico (Ordinal)

Importamos la base de datos y renombramos para trabajar en un análisis descriptivo

  • Conocemos los datos de nuestra base
## # A tibble: 6 × 21
##   battery_power bluetooth clock_speed int_memory n_cores   ram dual_sim three_g
##           <dbl>     <dbl>       <dbl>      <dbl>   <dbl> <dbl>    <dbl>   <dbl>
## 1           842         0         2.2          7       2  2549        0       0
## 2          1021         1         0.5         53       3  2631        1       1
## 3           563         1         0.5         41       5  2603        1       1
## 4           615         1         2.5         10       6  2769        0       1
## 5          1821         1         1.2         44       2  1411        0       1
## 6          1859         0         0.5         22       1  1067        1       1
## # ℹ 13 more variables: four_g <dbl>, fc <dbl>, pc <dbl>, px_height <dbl>,
## #   px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## #   talk_time <dbl>, touch_screen <dbl>, wifi <dbl>, price_range <dbl>
## # A tibble: 6 × 21
##   battery_power bluetooth clock_speed int_memory n_cores   ram dual_sim three_g
##           <dbl>     <dbl>       <dbl>      <dbl>   <dbl> <dbl>    <dbl>   <dbl>
## 1           858         0         2.2         50       1  3978        0       1
## 2           794         1         0.5          2       6   668        1       1
## 3          1965         1         2.6         39       4  2032        1       1
## 4          1911         0         0.9         36       8  3057        1       1
## 5          1512         0         0.9         46       5   869        0       1
## 6           510         1         2           45       6  3919        1       1
## # ℹ 13 more variables: four_g <dbl>, fc <dbl>, pc <dbl>, px_height <dbl>,
## #   px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## #   talk_time <dbl>, touch_screen <dbl>, wifi <dbl>, price_range <dbl>
## [1] 2000   21
## battery_power     bluetooth   clock_speed    int_memory       n_cores 
##             0             0             0             0             0 
##           ram      dual_sim       three_g        four_g            fc 
##             0             0             0             0             0 
##            pc     px_height      px_width         m_dep     mobile_wt 
##             0             0             0             0             0 
##          sc_h          sc_w     talk_time  touch_screen          wifi 
##             0             0             0             0             0 
##   price_range 
##             0
##  battery_power      bluetooth      clock_speed      int_memory   
##  Min.   : 501.0   Min.   :0.000   Min.   :0.500   Min.   : 2.00  
##  1st Qu.: 851.8   1st Qu.:0.000   1st Qu.:0.700   1st Qu.:16.00  
##  Median :1226.0   Median :0.000   Median :1.500   Median :32.00  
##  Mean   :1238.5   Mean   :0.495   Mean   :1.522   Mean   :32.05  
##  3rd Qu.:1615.2   3rd Qu.:1.000   3rd Qu.:2.200   3rd Qu.:48.00  
##  Max.   :1998.0   Max.   :1.000   Max.   :3.000   Max.   :64.00  
##     n_cores           ram          dual_sim         three_g      
##  Min.   :1.000   Min.   : 256   Min.   :0.0000   Min.   :0.0000  
##  1st Qu.:3.000   1st Qu.:1208   1st Qu.:0.0000   1st Qu.:1.0000  
##  Median :4.000   Median :2146   Median :1.0000   Median :1.0000  
##  Mean   :4.521   Mean   :2124   Mean   :0.5095   Mean   :0.7615  
##  3rd Qu.:7.000   3rd Qu.:3064   3rd Qu.:1.0000   3rd Qu.:1.0000  
##  Max.   :8.000   Max.   :3998   Max.   :1.0000   Max.   :1.0000  
##      four_g             fc               pc           px_height     
##  Min.   :0.0000   Min.   : 0.000   Min.   : 0.000   Min.   :   0.0  
##  1st Qu.:0.0000   1st Qu.: 1.000   1st Qu.: 5.000   1st Qu.: 282.8  
##  Median :1.0000   Median : 3.000   Median :10.000   Median : 564.0  
##  Mean   :0.5215   Mean   : 4.309   Mean   : 9.916   Mean   : 645.1  
##  3rd Qu.:1.0000   3rd Qu.: 7.000   3rd Qu.:15.000   3rd Qu.: 947.2  
##  Max.   :1.0000   Max.   :19.000   Max.   :20.000   Max.   :1960.0  
##     px_width          m_dep          mobile_wt          sc_h      
##  Min.   : 500.0   Min.   :0.1000   Min.   : 80.0   Min.   : 5.00  
##  1st Qu.: 874.8   1st Qu.:0.2000   1st Qu.:109.0   1st Qu.: 9.00  
##  Median :1247.0   Median :0.5000   Median :141.0   Median :12.00  
##  Mean   :1251.5   Mean   :0.5018   Mean   :140.2   Mean   :12.31  
##  3rd Qu.:1633.0   3rd Qu.:0.8000   3rd Qu.:170.0   3rd Qu.:16.00  
##  Max.   :1998.0   Max.   :1.0000   Max.   :200.0   Max.   :19.00  
##       sc_w          talk_time      touch_screen        wifi      
##  Min.   : 0.000   Min.   : 2.00   Min.   :0.000   Min.   :0.000  
##  1st Qu.: 2.000   1st Qu.: 6.00   1st Qu.:0.000   1st Qu.:0.000  
##  Median : 5.000   Median :11.00   Median :1.000   Median :1.000  
##  Mean   : 5.767   Mean   :11.01   Mean   :0.503   Mean   :0.507  
##  3rd Qu.: 9.000   3rd Qu.:16.00   3rd Qu.:1.000   3rd Qu.:1.000  
##  Max.   :18.000   Max.   :20.00   Max.   :1.000   Max.   :1.000  
##   price_range  
##  Min.   :0.00  
##  1st Qu.:0.75  
##  Median :1.50  
##  Mean   :1.50  
##  3rd Qu.:2.25  
##  Max.   :3.00

De acuerdo al análisis descriptivo encontramos que 6 variables son cualitativas nominales y cuantitativas continuas son 2 y las 13 variables restantes son cuantitativas discretas.

Análisis exploratorio - descriptivo univariado

selected_vars <- names(data)[c(1,3,4,6,18,10)]
data_selected <- data[, selected_vars]

# Convertir a formato largo
data_long <- pivot_longer(data_selected, cols = everything(), names_to = "Variable", values_to = "Dispersion")

# Graficar con facet_wrap para mostrar 4 boxplots en una cuadrícula
ggplot(data_long, aes(x = Variable, y = Dispersion, fill = Variable)) +
  geom_boxplot() +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  labs(title = "Boxplots")+
  scale_fill_brewer(palette = "Set2") +
  facet_wrap(~ Variable, scales = "free")

Variables cualitativas: Nominal - Ordinal

Inicialmente vamos a convertir variables númericas a factores

Se realiza un análisis descriptivo de las variables bluetooth, doble sim, wifi, touch_screen (pantalla táctil), en las que se observa si el dispositivo tiene o no estás funciones (0 dispositivos que no tienen está función y 1 cuando si), se muestra la cantidad de cada uno de ellos con su respectivo porcentaje.

Para obtener la matriz de varianzas y covarianzas de las variables objetivo para ello se utiliza la función cov(datos de interes)

##               battery_power  clock_speed   int_memory           ram
## battery_power 193088.359838  4.116921836 -31.92357204 -3.112180e+02
## clock_speed        4.116922  0.665862869   0.09691383  3.047585e+00
## int_memory       -31.923572  0.096913832 329.26697124  6.458695e+02
## ram             -311.218050  3.047584542 645.86953027  1.176644e+06
## fc                63.592320 -0.001537144  -2.29503927  7.110563e+01
## pc                83.782186 -0.025955103  -3.66144797  1.906581e+02
## px_height       2905.736870 -5.259132566  84.08051826 -9.797075e+03
## px_width       -1595.644609 -3.341840795 -65.36665408  1.924610e+03
## m_dep              4.319702 -0.003380628   0.03603664 -2.951498e+00
## mobile_wt         28.689738  0.356738119 -21.97756728 -9.909058e+01
## sc_h             -55.464653 -0.099969610   2.88769160  7.310627e+01
## sc_w             -41.005692 -0.026228864   0.92729815  1.681137e+02
## talk_time        126.075334 -0.050970235  -0.27664982  6.412922e+01
##                          fc           pc     px_height      px_width
## battery_power  63.592320410  83.78218584   2905.736870  -1595.644609
## clock_speed    -0.001537144  -0.02595510     -5.259133     -3.341841
## int_memory     -2.295039270  -3.66144797     84.080518    -65.366654
## ram            71.105629315 190.65811456  -9797.075042   1924.610004
## fc             18.848133817  16.97082866    -19.247050     -9.711403
## pc             16.970828664  36.77591571    -49.694829     10.997543
## px_height     -19.247049525 -49.69482941 196941.408040  97946.365509
## px_width       -9.711402951  10.99754302  97946.365509 186796.361941
## m_dep          -0.002242746   0.04596911      3.233478      2.937617
## mobile_wt       3.629749375   4.04531416     14.756486      1.373327
## sc_h           -0.201462481   0.12615583    111.466131     39.330164
## sc_w           -0.234003502  -0.62927014     83.205267     65.332778
## talk_time      -0.161985493   0.48566133    -25.812594     15.869264
##                      m_dep    mobile_wt         sc_h         sc_w    talk_time
## battery_power  4.319702476   28.6897384 -55.46465258 -41.00569235 126.07533417
## clock_speed   -0.003380628    0.3567381  -0.09996961  -0.02622886  -0.05097024
## int_memory     0.036036643  -21.9775673   2.88769160   0.92729815  -0.27664982
## ram           -2.951498499  -99.0905823  73.10626863 168.11368584  64.12922161
## fc            -0.002242746    3.6297494  -0.20146248  -0.23400350  -0.16198549
## pc             0.045969110    4.0453142   0.12615583  -0.62927014   0.48566133
## px_height      3.233477739   14.7564862 111.46613107  83.20526663 -25.81259430
## px_width       2.937616683    1.3733272  39.33016433  65.33277789  15.86926413
## m_dep          0.083183529    0.2221253  -0.03080178  -0.02310380   0.02679415
## mobile_wt      0.222125313 1253.1355668  -5.04934317  -3.20158379   1.20086143
## sc_h          -0.030801776   -5.0493432  17.75143347   9.29005953  -0.39907104
## sc_w          -0.023103802   -3.2015838   9.29005953  18.97820010  -0.54320860
## talk_time      0.026794147    1.2008614  -0.39907104  -0.54320860  29.85480640

Después de estudiar la asociación de las variables, se delimita la información a través de la matriz de correlación.

Para visualizar mejor la anterior información se sugiere ver la matriz de correlación en un mapa de calor a través de la función corplot

Tablas de distribución para cada una de las variables:

cat(
  " \"Tabla de distribución de frecuencias : Doble sim\"\n"
  )
##  "Tabla de distribución de frecuencias : Doble sim"
tabla_dft= fdt_cat(data$dual_sim)
tabla_dft
##  Category    f   rf rf(%)   cf  cf(%)
##         1 1019 0.51 50.95 1019  50.95
##         0  981 0.49 49.05 2000 100.00

La primera tabla es de la variable Doble sim, en la que se evidencia que los dispositivos que tienen doble sim (1), son 1019, valor el cual representa el 51% de los datos, por otro lado, están los dispositivos que no tienen (0), son 981 con un valor porcentual del 49% respecto al total.

cat(
  "\"Tabla de distribución de frecuencias : bluetooth\"\n"
  )
## "Tabla de distribución de frecuencias : bluetooth"
tabla_bluetooth= fdt_cat(data$bluetooth)
tabla_bluetooth
##  Category    f  rf rf(%)   cf cf(%)
##         0 1010 0.5  50.5 1010  50.5
##         1  990 0.5  49.5 2000 100.0

La tabla de la variable bluetooth, indica los dispositivos que tienen bluetooth representado con el número (1), con un total de 1010, representando el 50.5% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 990 y un valor porcentual del 49.5% respecto al total.

cat(
  "\"Tabla de distribución de frecuencias : touch_screen\"\n"
  )
## "Tabla de distribución de frecuencias : touch_screen"
tabla_touch_screen= fdt_cat(data$touch_screen)
tabla_touch_screen
##  Category    f  rf rf(%)   cf cf(%)
##         1 1006 0.5  50.3 1006  50.3
##         0  994 0.5  49.7 2000 100.0

La tabla de la variable touch_screen, indica los dispositivos que tienen pantalla táctil representado con el número (1), con un total de 1006, representando el 50.3% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 994 y un valor porcentual del 49.7% respecto al total.

cat(
  "\"Tabla de distribución de frecuencias : wifi\"\n"
  )
## "Tabla de distribución de frecuencias : wifi"
tabla_wifi = fdt_cat(data$wifi)
tabla_wifi
##  Category    f   rf rf(%)   cf cf(%)
##         1 1014 0.51  50.7 1014  50.7
##         0  986 0.49  49.3 2000 100.0

La tabla de la variable wifi, indica los dispositivos que tienen wifi representado con el número (1), con un total de 1014, representando el 50.7% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 986 y un valor porcentual del 49.3% respecto al total.

cat(
  "\"Tabla de distribución de frecuencias : three_g\"\n"
  )
## "Tabla de distribución de frecuencias : three_g"
tabla_three_g = fdt_cat(data$three_g)
tabla_three_g
##  Category    f   rf rf(%)   cf  cf(%)
##         1 1523 0.76 76.15 1523  76.15
##         0  477 0.24 23.85 2000 100.00
Tabla_three_g <- data %>% group_by(three_g ) %>% summarise(Total=n()) %>%   
    dplyr::mutate(Porcentaje = round(Total/sum(Total)*100, 1))             #16
  
ggplot(Tabla_three_g, aes(x = three_g, y=Total,fill=three_g) ) +          
  geom_bar(width = 0.9, stat="identity", position = position_dodge())+                    
  
  ylim(c(0,1600))+
  labs(x="three_g", y= "Frecuencia \n (Porcentajes)") +  #17 
  labs(fill = "")+                                          
  
  geom_text(aes(label=paste0(Total," ", "", "(", Porcentaje, "%",")")),    #18
            vjust=-0.9, 
            color="black", 
            hjust=0.5,
            position = position_dodge(0.9),  
            angle=0, 
            size=4.0
            ) +  
  scale_fill_discrete(name = "El dispositivo tiene 3G", labels = c("No", "Si")) +   #19
  
  theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1)) +     #20
  #theme_bw(base_size = 14) +
  
  facet_wrap(~"Variable 3G")

#plot_grid(Barra1, Barra2, nrow= 1, align = "h")   

La tabla de la variable three_g, indica los dispositivos que tienen 3G representado con el número (1), con un total de 1523, representando el 76.1% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 477 y un valor porcentual del 23.8% respecto al total. Adicionalmente, se evidencia la gráfica con esta información.

cat(
  "\"Tabla de distribución de frecuencias : four_g\"\n"
  )
## "Tabla de distribución de frecuencias : four_g"
tabla_four_g = fdt_cat(data$four_g)
tabla_four_g
##  Category    f   rf rf(%)   cf  cf(%)
##         1 1043 0.52 52.15 1043  52.15
##         0  957 0.48 47.85 2000 100.00
Tabla_four_g <- data %>% group_by(four_g ) %>% summarise(Total=n()) %>%   
    dplyr::mutate(Porcentaje = round(Total/sum(Total)*100, 1))             #16
  
ggplot(Tabla_four_g, aes(x = four_g, y=Total,fill=four_g) ) +          
  geom_bar(width = 0.9, stat="identity", position = position_dodge())+                    
  
  ylim(c(0,1100))+
  labs(x="four_g", y= "Frecuencia \n (Porcentajes)") +  #17 
  labs(fill = "")+                                          
  
  geom_text(aes(label=paste0(Total," ", "", "(", Porcentaje, "%",")")),    #18
            vjust=-0.9, 
            color="black", 
            hjust=0.5,
            position = position_dodge(0.9),  
            angle=0, 
            size=4.0
            ) +  
  scale_fill_discrete(name = "El dispositivo tiene 4G", labels = c("No", "Si")) +   #19
  
  theme(axis.text.x = element_text(angle = 45, vjust = 1, hjust=1)) +     #20
  #theme_bw(base_size = 14) +
  
  facet_wrap(~"Variable 4G")

#plot_grid(Barra1, Barra2, nrow= 1, align = "h")   

La tabla de la variable four_g, indica los dispositivos que tienen 4G representado con el número (1), con un total de 1043, representando el 52.1% de los datos, por otro lado, están los dispositivos que no tienen (0), con un total de 957 y un valor porcentual del 47.9% respecto al total. Adicionalmente, se evidencia la gráfica con esta información.

Variables Cuantitativas - Razón, intervalo

## "Medidas descriptivas: ram "
## Descriptive Statistics  
## data$ram  
## N: 2000  
## 
##                         ram
## ----------------- ---------
##              Mean   2124.21
##           Std.Dev   1084.73
##               Min    256.00
##                Q1   1207.00
##            Median   2146.50
##                Q3   3065.00
##               Max   3998.00
##               MAD   1382.52
##               IQR   1857.00
##                CV      0.51
##          Skewness      0.01
##       SE.Skewness      0.05
##          Kurtosis     -1.19
##           N.Valid   2000.00
##                 N   2000.00
##         Pct.Valid    100.00
## "Tabla de frecuencia: ram "
##         Class limits   f   rf rf(%)   cf  cf(%)
##    [253.44,568.8183) 168 0.08  8.40  168   8.40
##  [568.8183,884.1967) 176 0.09  8.80  344  17.20
##  [884.1967,1199.575) 149 0.07  7.45  493  24.65
##  [1199.575,1514.953) 195 0.10  9.75  688  34.40
##  [1514.953,1830.332) 150 0.07  7.50  838  41.90
##   [1830.332,2145.71) 161 0.08  8.05  999  49.95
##   [2145.71,2461.088) 188 0.09  9.40 1187  59.35
##  [2461.088,2776.467) 179 0.09  8.95 1366  68.30
##  [2776.467,3091.845) 145 0.07  7.25 1511  75.55
##  [3091.845,3407.223) 164 0.08  8.20 1675  83.75
##  [3407.223,3722.602) 176 0.09  8.80 1851  92.55
##   [3722.602,4037.98) 149 0.07  7.45 2000 100.00
## "Test de normalidad de Shapiro-Wilk: ram "
## 
##  Shapiro-Wilk normality test
## 
## data:  ram
## W = 0.95462, p-value < 2.2e-16
## "Test de Wilcoxon Signed-Rank Test: ram "
## 
##  Wilcoxon signed rank test with continuity correction
## 
## data:  data$ram
## V = 2001000, p-value < 2.2e-16
## alternative hypothesis: true location is not equal to 0

##    Size (n)     Missing     Minimum      1st Qu        Mean      Median 
##    2000.000       0.000     256.000    1207.500    2124.213    2146.500 
##      TrMean      3rd Qu         Max       Stdev         Var     SE Mean 
##    2123.541    3064.500    3998.000    1084.732 1176643.606      24.255 
##      I.Q.R.       Range    Kurtosis    Skewness    SW p-val 
##    1857.000    3742.000      -1.194       0.007       0.000

Según las gráficas podemos observar que la distribución de los datos es bastante uniforme, o rectangular dado el histograma que se realizó, también observamos que podría existir multimodalidad, es decir que podrían haber subgrupos, tenemos posiblemente simetría, no hay outliers, y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.

Observamos que los datos tienen una media de 2124.21 con una desviación estandar de 1084.73, lo que significa que los datos son muy dispersos, con una mediana de 2146.50, valor el cual es cercano a la media y el valor mínimo del conjunto de datos es 256 y el máximo de 3998, con un coeficiente de variación del 0.51, adicionalmente se observa que el valor del sesgo es de 0.01, el cual es un valor cerca a 0 lo que indica que posiblemente es simétrico y curtosis de -1.19 es decir que tiene una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.

En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95462, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas

## "Medidas descriptivas: battery_power "
## Descriptive Statistics  
## data$battery_power  
## N: 2000  
## 
##                     battery_power
## ----------------- ---------------
##              Mean         1238.52
##           Std.Dev          439.42
##               Min          501.00
##                Q1          851.50
##            Median         1226.00
##                Q3         1615.50
##               Max         1998.00
##               MAD          566.35
##               IQR          763.50
##                CV            0.35
##          Skewness            0.03
##       SE.Skewness            0.05
##          Kurtosis           -1.23
##           N.Valid         2000.00
##                 N         2000.00
##         Pct.Valid          100.00
## "Tabla de frecuencia: battery_power "
##         Class limits   f   rf rf(%)   cf  cf(%)
##    [495.99,622.8225) 184 0.09  9.20  184   9.20
##   [622.8225,749.655) 175 0.09  8.75  359  17.95
##   [749.655,876.4875) 178 0.09  8.90  537  26.85
##   [876.4875,1003.32) 166 0.08  8.30  703  35.15
##   [1003.32,1130.153) 165 0.08  8.25  868  43.40
##  [1130.153,1256.985) 162 0.08  8.10 1030  51.50
##  [1256.985,1383.818) 163 0.08  8.15 1193  59.65
##   [1383.818,1510.65) 156 0.08  7.80 1349  67.45
##   [1510.65,1637.483) 174 0.09  8.70 1523  76.15
##  [1637.483,1764.315) 166 0.08  8.30 1689  84.45
##  [1764.315,1891.148) 167 0.08  8.35 1856  92.80
##   [1891.148,2017.98) 144 0.07  7.20 2000 100.00
## "Test de normalidad de Shapiro-Wilk: battery_power "
## 
##  Shapiro-Wilk normality test
## 
## data:  battery_power
## W = 0.95188, p-value < 2.2e-16

##   Size (n)    Missing    Minimum     1st Qu       Mean     Median     TrMean 
##   2000.000      0.000    501.000    851.750   1238.518   1226.000   1237.268 
##     3rd Qu        Max      Stdev        Var    SE Mean     I.Q.R.      Range 
##   1615.250   1998.000    439.418 193088.360      9.826    763.500   1497.000 
##   Kurtosis   Skewness   SW p-val 
##     -1.226      0.032      0.000

Según las gráficas podemos observar que la distribución de los datos es uniforme, tenemos posiblemente simetría, no hay outliers, y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.

Observamos que los datos tienen una media de 1238.52 con una desviación estandar de 439.42, lo que significa que los datos son moderadamente dispersos, con una mediana de 1226, valor el cual está cerca a la media y nos sugiere que la distribución es bastante simétrica, adicionalmente, el valor mínimo del conjunto de datos es 501 y el máximo de 1998, con un coeficiente de variación del 0.35 lo que sugiere una variabilidad relativamente baja en comparación con la media, además, se observa que el valor del sesgo es de 0.03, valor el cual es cercano a 0, lo que indica que posiblemente es simétrico y curtosis de -1.23 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.

En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95188, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas

## "Medidas descriptivas: clock_speed "
## Descriptive Statistics  
## data$clock_speed  
## N: 2000  
## 
##                     clock_speed
## ----------------- -------------
##              Mean          1.52
##           Std.Dev          0.82
##               Min          0.50
##                Q1          0.70
##            Median          1.50
##                Q3          2.20
##               Max          3.00
##               MAD          1.19
##               IQR          1.50
##                CV          0.54
##          Skewness          0.18
##       SE.Skewness          0.05
##          Kurtosis         -1.32
##           N.Valid       2000.00
##                 N       2000.00
##         Pct.Valid        100.00
## "Tabla de frecuencia: clock_speed "
##     Class limits   f   rf rf(%)   cf  cf(%)
##   [0.495,0.7062) 551 0.28 27.55  551  27.55
##  [0.7062,0.9175) 116 0.06  5.80  667  33.35
##   [0.9175,1.129) 112 0.06  5.60  779  38.95
##     [1.129,1.34) 124 0.06  6.20  903  45.15
##     [1.34,1.551) 137 0.07  6.85 1040  52.00
##    [1.551,1.762) 136 0.07  6.80 1176  58.80
##    [1.762,1.974) 127 0.06  6.35 1303  65.15
##    [1.974,2.185) 143 0.07  7.15 1446  72.30
##    [2.185,2.396) 137 0.07  6.85 1583  79.15
##    [2.396,2.607) 187 0.09  9.35 1770  88.50
##    [2.607,2.819) 140 0.07  7.00 1910  95.50
##     [2.819,3.03)  90 0.04  4.50 2000 100.00
## "Test de normalidad de Shapiro-Wilk: clock_speed "
## 
##  Shapiro-Wilk normality test
## 
## data:  clock_speed
## W = 0.91123, p-value < 2.2e-16

## Size (n)  Missing  Minimum   1st Qu     Mean   Median   TrMean   3rd Qu 
## 2000.000    0.000    0.500    0.700    1.522    1.500    1.502    2.200 
##      Max    Stdev      Var  SE Mean   I.Q.R.    Range Kurtosis Skewness 
##    3.000    0.816    0.666    0.018    1.500    2.500   -1.325    0.178 
## SW p-val 
##    0.000

Según las gráficas podemos observar que la distribución de los datos es bimodal ya que hay una cola más larga hacia la derecha, lo que indica asimetría positiva o sesgo a la derecha, en el boxplot, los bigotes se extienden hasta los valores máximos y mínimos dentro de un rango definido y se evidencia que el bigote derecho es más largo que el izquierdo, lo que confirma la asimetría positiva y se tiene un posible outlier en los valores más altos, adicionalmente, el Q-Q Plot indica que posiblemente los datos no siguen una distribución normal.

Observamos que los datos tienen una media de 1.52 con una desviación estandar de 0.82, lo que significa que los datos son moderadamente dispersos, con una mediana de 1.50, valor el cual está cerca a la media y nos sugiere que la distribución es bastante simétrica, adicionalmente, el valor mínimo del conjunto de datos es 0.50 y el máximo de 3, con un coeficiente de variación del 0.54 lo que sugiere una variabilidad relativamente baja en comparación con la media, además, el valor del sesgo es de 0.18, lo que indica que posiblemente tiene asimetría positiva y curtosis de -1.32 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.

En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.91123, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.

## "Medidas descriptivas: int_memory "
## Descriptive Statistics  
## data$int_memory  
## N: 2000  
## 
##                     int_memory
## ----------------- ------------
##              Mean        32.05
##           Std.Dev        18.15
##               Min         2.00
##                Q1        16.00
##            Median        32.00
##                Q3        48.00
##               Max        64.00
##               MAD        23.72
##               IQR        32.00
##                CV         0.57
##          Skewness         0.06
##       SE.Skewness         0.05
##          Kurtosis        -1.22
##           N.Valid      2000.00
##                 N      2000.00
##         Pct.Valid       100.00
## "Tabla de frecuencia: int_memory "
##     Class limits   f   rf rf(%)   cf  cf(%)
##    [1.98,7.2017) 200 0.10 10.00  200  10.00
##  [7.2017,12.423) 178 0.09  8.90  378  18.90
##  [12.423,17.645) 177 0.09  8.85  555  27.75
##  [17.645,22.867) 156 0.08  7.80  711  35.55
##  [22.867,28.088) 192 0.10  9.60  903  45.15
##   [28.088,33.31) 159 0.08  7.95 1062  53.10
##   [33.31,38.532) 139 0.07  6.95 1201  60.05
##  [38.532,43.753) 161 0.08  8.05 1362  68.10
##  [43.753,48.975) 157 0.08  7.85 1519  75.95
##  [48.975,54.197) 193 0.10  9.65 1712  85.60
##  [54.197,59.418) 152 0.08  7.60 1864  93.20
##   [59.418,64.64) 136 0.07  6.80 2000 100.00
## "Test de normalidad de Shapiro-Wilk: int_memory "
## 
##  Shapiro-Wilk normality test
## 
## data:  int_memory
## W = 0.95274, p-value < 2.2e-16

## Size (n)  Missing  Minimum   1st Qu     Mean   Median   TrMean   3rd Qu 
## 2000.000    0.000    2.000   16.000   32.047   32.000   31.953   48.000 
##      Max    Stdev      Var  SE Mean   I.Q.R.    Range Kurtosis Skewness 
##   64.000   18.146  329.267    0.406   32.000   62.000   -1.218    0.058 
## SW p-val 
##    0.000

Según las gráficas podemos observar que la distribución de los datos es uniforme, tenemos posiblemente simetría, no hay outliers, y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.

Observamos que los datos tienen una media de 32.05 con una desviación estandar de 18.15, lo que significa que los datos son moderadamente dispersos, con una mediana de 32, valor el cual está cerca a la media y nos sugiere que la distribución es bastante simétrica, adicionalmente, el valor mínimo del conjunto de datos es 2 y el máximo es 64, con un coeficiente de variación de 0.57 lo que sugiere una variabilidad moderada en comparación con la media, además, se observa que el valor del sesgo es de 0.06, valor el cual es cercano a 0, lo que indica que posiblemente es simétrico y curtosis de -1.22 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.

En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95274, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas

## "Medidas descriptivas: Megapíxeles de la cámara principal. "
## Descriptive Statistics  
## data$pc  
## N: 2000  
## 
##                          pc
## ----------------- ---------
##              Mean      9.92
##           Std.Dev      6.06
##               Min      0.00
##                Q1      5.00
##            Median     10.00
##                Q3     15.00
##               Max     20.00
##               MAD      7.41
##               IQR     10.00
##                CV      0.61
##          Skewness      0.02
##       SE.Skewness      0.05
##          Kurtosis     -1.17
##           N.Valid   2000.00
##                 N   2000.00
##         Pct.Valid    100.00
## "Tabla de frecuencia: pc "
##   Class limits   f   rf rf(%)   cf  cf(%)
##      [0,1.683) 205 0.10 10.25  205  10.25
##  [1.683,3.367) 192 0.10  9.60  397  19.85
##   [3.367,5.05) 154 0.08  7.70  551  27.55
##   [5.05,6.733)  95 0.05  4.75  646  32.30
##  [6.733,8.417) 208 0.10 10.40  854  42.70
##   [8.417,10.1) 234 0.12 11.70 1088  54.40
##   [10.1,11.78)  79 0.04  3.95 1167  58.35
##  [11.78,13.47) 175 0.09  8.75 1342  67.10
##  [13.47,15.15) 196 0.10  9.80 1538  76.90
##  [15.15,16.83)  88 0.04  4.40 1626  81.30
##  [16.83,18.52) 181 0.09  9.05 1807  90.35
##   [18.52,20.2) 193 0.10  9.65 2000 100.00
## "Test de normalidad de Shapiro-Wilk: pc "
## 
##  Shapiro-Wilk normality test
## 
## data:  pc
## W = 0.95126, p-value < 2.2e-16

## Size (n)  Missing  Minimum   1st Qu     Mean   Median   TrMean   3rd Qu 
## 2000.000    0.000    0.000    5.000    9.916   10.000    9.907   15.000 
##      Max    Stdev      Var  SE Mean   I.Q.R.    Range Kurtosis Skewness 
##   20.000    6.064   36.776    0.136   10.000   20.000   -1.173    0.017 
## SW p-val 
##    0.000

Según las gráficas podemos observar que la distribución de los datos es bimodal, con posible asimétria hacía la derecha, el punto en el boxplot nos sugiere que la mediana está ligeramente desplazada hacia la izquierda de la caja, y el bigote derecho es ligeramente más largo que el izquierdo, además, hay algunos puntos fuera del bigote derecho, lo que sugiere la posible presencia de outliers en los valores más altos de “pc” y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.

Observamos que los datos tienen una media de 9.92 con una desviación estandar de 6.06, lo que significa que los datos son moderadamente dispersos, con una mediana de 10, valor el cual está cerca a la media, adicionalmente, el valor mínimo del conjunto de datos es 0 y el máximo es 20, con un coeficiente de variación de 0.61 lo que sugiere una variabilidad moderada en comparación con la media, además, se observa que el valor del sesgo es de 0.02, lo que indica que posiblemente es ligeramente asimétrico hacía la derecha y curtosis de -1.17 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.

En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95126, valor cercano a 1 lo que nos indica que los datos se ajustan a una distribución normal, pero al revisar el p-value < 2.2e-16 nos damos cuenta que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas

## "Medidas descriptivas: Megapíxeles de la cámara frontal "
## Descriptive Statistics  
## data$fc  
## N: 2000  
## 
##                          fc
## ----------------- ---------
##              Mean      4.31
##           Std.Dev      4.34
##               Min      0.00
##                Q1      1.00
##            Median      3.00
##                Q3      7.00
##               Max     19.00
##               MAD      4.45
##               IQR      6.00
##                CV      1.01
##          Skewness      1.02
##       SE.Skewness      0.05
##          Kurtosis      0.27
##           N.Valid   2000.00
##                 N   2000.00
##         Pct.Valid    100.00
## "Tabla de frecuencia: fc "
##     Class limits   f   rf rf(%)   cf  cf(%)
##       [0,1.5992) 719 0.36 35.95  719  35.95
##  [1.5992,3.1983) 359 0.18 17.95 1078  53.90
##  [3.1983,4.7975) 133 0.07  6.65 1211  60.55
##  [4.7975,6.3967) 251 0.13 12.55 1462  73.10
##  [6.3967,7.9958) 100 0.05  5.00 1562  78.10
##   [7.9958,9.595) 155 0.08  7.75 1717  85.85
##   [9.595,11.194) 113 0.06  5.65 1830  91.50
##  [11.194,12.793)  45 0.02  2.25 1875  93.75
##  [12.793,14.393)  60 0.03  3.00 1935  96.75
##  [14.393,15.992)  23 0.01  1.15 1958  97.90
##  [15.992,17.591)  30 0.01  1.50 1988  99.40
##   [17.591,19.19)  12 0.01  0.60 2000 100.00
## "Test de normalidad de Shapiro-Wilk: fc "
## 
##  Shapiro-Wilk normality test
## 
## data:  fc
## W = 0.87374, p-value < 2.2e-16

## Size (n)  Missing  Minimum   1st Qu     Mean   Median   TrMean   3rd Qu 
## 2000.000    0.000    0.000    1.000    4.310    3.000    3.942    7.000 
##      Max    Stdev      Var  SE Mean   I.Q.R.    Range Kurtosis Skewness 
##   19.000    4.341   18.848    0.097    6.000   19.000    0.270    1.018 
## SW p-val 
##    0.000

Según las gráficas podemos observar que la distribución de la mayoría de los datos son demasiado bajos y tienen una cola larga, posible asimétria hacía la derecha, el punto en el boxplot nos sugiere que la mediana está desplazada hacia la izquierda de la caja, y el bigote derecho es más largo que el izquierdo, además, hay puntos fuera del bigote derecho, lo que sugiere la posible presencia de outliers en los valores más altos y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.

Observamos que los datos tienen una media de 4.31 con una desviación estandar de 4.34, lo que significa que los datos son considerablemente dispersos, con una mediana de 3, valor el cual es menor a la media y nos sugiere asimétria positiva, adicionalmente, el valor mínimo del conjunto de datos es 0 y el máximo es 19, con un coeficiente de variación de 1.01 lo que sugiere una alta variabilidad en comparación con la media, además, se observa que el valor del sesgo es de 1.02, lo que indica que posiblemente es asimétrico hacía la derecha y curtosis de 0.27 es decir que los datos tienen una distribución leptocúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.

En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.87374, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.

## "Medidas descriptivas: Resolución de píxeles Altura "
## Descriptive Statistics  
## data$px_height  
## N: 2000  
## 
##                     px_height
## ----------------- -----------
##              Mean      645.11
##           Std.Dev      443.78
##               Min        0.00
##                Q1      282.50
##            Median      564.00
##                Q3      947.50
##               Max     1960.00
##               MAD      471.47
##               IQR      664.50
##                CV        0.69
##          Skewness        0.67
##       SE.Skewness        0.05
##          Kurtosis       -0.32
##           N.Valid     2000.00
##                 N     2000.00
##         Pct.Valid      100.00
## "Tabla de frecuencia: Resolución de píxeles Altura "
##       Class limits   f   rf rf(%)   cf  cf(%)
##        [0,164.967) 269 0.13 13.45  269  13.45
##  [164.967,329.933) 320 0.16 16.00  589  29.45
##    [329.933,494.9) 300 0.15 15.00  889  44.45
##    [494.9,659.867) 262 0.13 13.10 1151  57.55
##  [659.867,824.833) 217 0.11 10.85 1368  68.40
##    [824.833,989.8) 183 0.09  9.15 1551  77.55
##    [989.8,1154.77) 143 0.07  7.15 1694  84.70
##  [1154.77,1319.73) 128 0.06  6.40 1822  91.10
##   [1319.73,1484.7)  77 0.04  3.85 1899  94.95
##   [1484.7,1649.67)  50 0.03  2.50 1949  97.45
##  [1649.67,1814.63)  35 0.02  1.75 1984  99.20
##   [1814.63,1979.6)  16 0.01  0.80 2000 100.00
## "Test de normalidad de Shapiro-Wilk: Resolución de píxeles Altura "
## 
##  Shapiro-Wilk normality test
## 
## data:  px_height
## W = 0.9469, p-value < 2.2e-16

##   Size (n)    Missing    Minimum     1st Qu       Mean     Median     TrMean 
##   2000.000      0.000      0.000    282.750    645.108    564.000    621.618 
##     3rd Qu        Max      Stdev        Var    SE Mean     I.Q.R.      Range 
##    947.250   1960.000    443.781 196941.408      9.923    664.500   1960.000 
##   Kurtosis   Skewness   SW p-val 
##     -0.321      0.665      0.000

Según las gráficas podemos observar que la distribución de la mayoría de los datos son demasiado bajos y tienen una cola larga, posible asimétria hacía la derecha, el punto dentro de la caja representa la mediana en el boxplot nos sugiere que la mediana está desplazada hacia la izquierda de la caja, y el bigote derecho es más largo que el izquierdo, además, hay un punto fuera del bigote derecho, lo que sugiere la posible presencia de outliers en los valores más altos y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.

Observamos que los datos tienen una media de 645.11 con una desviación estandar de 443.78, lo que significa que los datos son considerablemente dispersos, con una mediana de 564, valor el cual es menor a la media y nos sugiere asimétria positiva, adicionalmente, el valor mínimo del conjunto de datos es 0 y el máximo es 1960, con un coeficiente de variación de 0.69 lo que sugiere una alta variabilidad en comparación con la media, además, se observa que el valor del sesgo es de 0.67, lo que indica que posiblemente es asimétrico hacía la derecha y curtosis de -0.32 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.

En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.9469, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.

## "Medidas descriptivas: Ancho de resolución de píxeles "
## Descriptive Statistics  
## data$px_width  
## N: 2000  
## 
##                     px_width
## ----------------- ----------
##              Mean    1251.52
##           Std.Dev     432.20
##               Min     500.00
##                Q1     874.50
##            Median    1247.00
##                Q3    1633.00
##               Max    1998.00
##               MAD     557.46
##               IQR     758.25
##                CV       0.35
##          Skewness       0.01
##       SE.Skewness       0.05
##          Kurtosis      -1.19
##           N.Valid    2000.00
##                 N    2000.00
##         Pct.Valid     100.00
## "Tabla de frecuencia: Resolución de píxeles Altura "
##        Class limits   f   rf rf(%)   cf  cf(%)
##       [495,621.915) 147 0.07  7.35  147   7.35
##    [621.915,748.83) 178 0.09  8.90  325  16.25
##    [748.83,875.745) 176 0.09  8.80  501  25.05
##   [875.745,1002.66) 158 0.08  7.90  659  32.95
##  [1002.66,1129.575) 170 0.09  8.50  829  41.45
##  [1129.575,1256.49) 186 0.09  9.30 1015  50.75
##  [1256.49,1383.405) 171 0.09  8.55 1186  59.30
##  [1383.405,1510.32) 175 0.09  8.75 1361  68.05
##  [1510.32,1637.235) 146 0.07  7.30 1507  75.35
##  [1637.235,1764.15) 177 0.09  8.85 1684  84.20
##  [1764.15,1891.065) 156 0.08  7.80 1840  92.00
##  [1891.065,2017.98) 160 0.08  8.00 2000 100.00
## "Test de normalidad de Shapiro-Wilk: Resolución de píxeles Altura "
## 
##  Shapiro-Wilk normality test
## 
## data:  px_width
## W = 0.95604, p-value < 2.2e-16

##   Size (n)    Missing    Minimum     1st Qu       Mean     Median     TrMean 
##   2000.000      0.000    500.000    874.750   1251.515   1247.000   1251.566 
##     3rd Qu        Max      Stdev        Var    SE Mean     I.Q.R.      Range 
##   1633.000   1998.000    432.199 186796.362      9.664    758.250   1498.000 
##   Kurtosis   Skewness   SW p-val 
##     -1.188      0.015      0.000

Según las gráficas podemos observar que la distribución de los datos es uniforme y posiblemente es simétrica, el punto dentro de la caja representa la mediana en el boxplot lo que nos indica que la mediana está aproximadamente en el centro de la distribución, además, no hay outliers y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.

Observamos que los datos tienen una media de 1251.52 con una desviación estandar de 432.20, lo que significa que los datos tienen una variabilidad moderada, con una mediana de 1247, valor el cual es cercano a la media y nos sugiere simetría, adicionalmente, el valor mínimo del conjunto de datos es 500 y el máximo es 1998, con un coeficiente de variación de 0.35 lo que sugiere una baja variabilidad en comparación con la media, además, se observa que el valor del sesgo es de 0.01, lo que indica que posiblemente es simétrico y curtosis de -1.19 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.

En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95604, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.

## "Medidas descriptivas: Tiempo de la batería "
## Descriptive Statistics  
## data$talk_time  
## N: 2000  
## 
##                     talk_time
## ----------------- -----------
##              Mean       11.01
##           Std.Dev        5.46
##               Min        2.00
##                Q1        6.00
##            Median       11.00
##                Q3       16.00
##               Max       20.00
##               MAD        7.41
##               IQR       10.00
##                CV        0.50
##          Skewness        0.01
##       SE.Skewness        0.05
##          Kurtosis       -1.22
##           N.Valid     2000.00
##                 N     2000.00
##         Pct.Valid      100.00
## "Tabla de frecuencia: Resolución de píxeles Altura "
##   Class limits   f   rf rf(%)   cf  cf(%)
##   [1.98,3.498) 193 0.10  9.65  193   9.65
##  [3.498,5.017) 216 0.11 10.80  409  20.45
##  [5.017,6.535) 111 0.06  5.55  520  26.00
##  [6.535,8.053) 228 0.11 11.40  748  37.40
##  [8.053,9.572) 100 0.05  5.00  848  42.40
##  [9.572,11.09) 208 0.10 10.40 1056  52.80
##  [11.09,12.61)  99 0.05  4.95 1155  57.75
##  [12.61,14.13) 201 0.10 10.05 1356  67.80
##  [14.13,15.64) 115 0.06  5.75 1471  73.55
##  [15.64,17.16) 214 0.11 10.70 1685  84.25
##  [17.16,18.68) 100 0.05  5.00 1785  89.25
##   [18.68,20.2) 215 0.11 10.75 2000 100.00
## "Test de normalidad de Shapiro-Wilk: Resolución de píxeles Altura "
## 
##  Shapiro-Wilk normality test
## 
## data:  talk_time
## W = 0.94821, p-value < 2.2e-16

## Size (n)  Missing  Minimum   1st Qu     Mean   Median   TrMean   3rd Qu 
## 2000.000    0.000    2.000    6.000   11.011   11.000   11.012   16.000 
##      Max    Stdev      Var  SE Mean   I.Q.R.    Range Kurtosis Skewness 
##   20.000    5.464   29.855    0.122   10.000   18.000   -1.220    0.009 
## SW p-val 
##    0.000

Según las gráficas podemos observar que la distribución de los datos es uniforme y posiblemente es simétrica, el punto dentro de la caja representa la mediana en el boxplot lo que nos indica que la mediana está aproximadamente en el centro de la distribución, además, no hay outliers y según el Q-Q Plot posiblemente los datos no siguen una distribución normal.

Observamos que los datos tienen una media de 11.01 con una desviación estandar de 5.46, lo que significa que los datos tienen una variabilidad moderada, con una mediana de 11, valor el cual es cercano a la media y nos sugiere simetría, adicionalmente, el valor mínimo del conjunto de datos es 2 y el máximo es 20, con un coeficiente de variación de 0.50 lo que sugiere una variabilidad moderada en comparación con la media, además, se observa que el valor del sesgo es de 0.01, lo que indica que posiblemente es simétrico y curtosis de -1.22 es decir que los datos tienen una distribución platicúrtica, lo que nos ayuda a pensar que los datos no están normalmente distribuidos.

En el test de Shapiro-Wilk, el estadístico W representa una medida de la bondad de ajuste a la normalidad. El resultado fue 0.95604, al revisar el p-value < 2.2e-16 tenemos que es demasiado pequeño, por lo que se rechaza la hipótesis nula, se confirma que no siguen una distribución normal y requieren el uso de pruebas estadísticas no paramétricas.

Análisis Bivariado

## "Tabla cruzada entre dual_sim y wifi "
##    
##       0   1
##   0 495 486
##   1 491 528
## "Tabla cruzada entre dual_sim y wifi en proporciones "
##    
##             0         1
##   0 0.5045872 0.4954128
##   1 0.4818449 0.5181551

## 
##  Pearson's Chi-squared test with Yates' continuity correction
## 
## data:  tabla_dual_wifi
## X-squared = 0.94526, df = 1, p-value = 0.3309

Obtenemos un p-valor de 0.3309 el cual es mayor a 0.05, NO hay evidencia estadísticamente significativa para rechazar la hipótesis nula y nos indica que no hay relación significativa entre las variables en dual sim y wifi, es decir, los datos no muestran una asociación clara.

## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  battery_power by three_g
## W = 357419, p-value = 0.5972
## alternative hypothesis: true location shift is not equal to 0

El p-valor es 0.5972, el cual es mayor (p > 0.05), por lo que no se rechaza la hipótesis nula, ya que No hay suficiente evidencia para decir que los grupos son diferentes.

ram según four_g (Celulares con y sin 4G)

## 
##  Wilcoxon rank sum test with continuity correction
## 
## data:  ram by four_g
## W = 495130, p-value = 0.7598
## alternative hypothesis: true location shift is not equal to 0

El p-valor es 0.7598, el cual es mayor (p > 0.05), por lo que no se rechaza la hipótesis nula, ya que No hay suficiente evidencia para decir que los grupos son diferentes.

Boxplot para visualizar la distribución de ram por rango de precio de celular

## 
##  Kruskal-Wallis rank sum test
## 
## data:  ram by price_range
## Kruskal-Wallis chi-squared = 1681.5, df = 3, p-value < 2.2e-16

En el gráfico podemos observar que el precio de los celulares respecto a la ram, para el caso de la gama baja, tenemos que el valor de la media es inferior a 1000, pero encontramos outliers que son superiores respecto a la media de los celulares de gama media, por otro lado, los celulares de esta gama, su media se encuentran cercana a 2000 y no presenta outliers, en cambio en el caso, de la gama alta, se tiene una media entre 2000 y 3000, con 1 outlier en la parte superior el cual el valor es muy cercano a 4000, es decir es superior al valor de la media de los dispositivos de gama muy alta, adicionalmente, encontramos otros outliers, en la parte inferior entre 1000 y 2000, en los cuales está cercano a los dispositivos de gama media, por último, los dispositivios de gama muy alta, tienen una media entre 3000 y 4000, con outliers cercanos a la media de los dispositivos de gama alta.

Tenemos un p-value de 2.2e-16, el cual es menor a 0.05, por lo que se rechaza la hipótesis nula e indica que al menos un grupo es significativamente diferente de los demás en términos de ram.

ANOVA y Análisis de Residuos

## Tabla ANOVA respecto a la velocidad del microprocesador y la ram
##     
## 
##               Df Sum Sq Mean Sq F value Pr(>F)
## ram            1      0  0.0158   0.024  0.878
## Residuals   1998   1331  0.6662
## 
## 
## Prueba de Breusch-Pagan
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_anova_speed_ram
## BP = 5.4721, df = 1, p-value = 0.01932

Al realizar la prueba de Breusch-Pagan el p valor fue de 0.9794, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.

## Tabla ANOVA respecto a la velocidad del microprocesador y los núcleos
##     
## 
##               Df Sum Sq Mean Sq F value Pr(>F)
## n_cores        1      0  0.0436   0.065  0.798
## Residuals   1998   1331  0.6662
## 
## 
## Prueba de Breusch-Pagan
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_anova_speed_ram
## BP = 0.4413, df = 1, p-value = 0.5065

Al realizar la prueba de Breusch-Pagan el p valor fue de 0.6879, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.

## Tabla ANOVA respecto a la altura y si es táctil
##     
## 
##                Df Sum Sq Mean Sq F value Pr(>F)
## touch_screen    1     14   14.23   0.801  0.371
## Residuals    1998  35471   17.75
## 
## 
## Prueba de Breusch-Pagan
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_sc_h_touch
## BP = 0.12482, df = 1, p-value = 0.7239

Al realizar la prueba de Breusch-Pagan el p valor fue de 0.7239, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.

## Tabla ANOVA respecto al poder de la batería y el tiempo de batería
##     
## 
##               Df    Sum Sq Mean Sq F value Pr(>F)  
## talk_time      1   1064287 1064287   5.524 0.0188 *
## Residuals   1998 384919344  192652                 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## 
## Prueba de Breusch-Pagan
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_battery
## BP = 0.55791, df = 1, p-value = 0.4551

Al realizar la prueba de Breusch-Pagan el p valor fue de 0.4551, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.

## Tabla ANOVA respecto al poder de la batería y la memoria interna
##     
## 
##               Df    Sum Sq Mean Sq F value Pr(>F)
## int_memory     1      6187    6187   0.032  0.858
## Residuals   1998 385977444  193182
## 
## 
## Prueba de Breusch-Pagan
## 
##  studentized Breusch-Pagan test
## 
## data:  modelo_batt_mem
## BP = 0.86427, df = 1, p-value = 0.3525

Al realizar la prueba de Breusch-Pagan el p valor fue de 0.3525, el cual es mayor al nivel de significancia por lo que se rechaza la hipótesis nula, y decimos que se presenta heterocedasticidad y la varianza de los errores (residuos) no es constante.

Diseño de Muestreo Bernoulli

## [1] 21
##      [,1] [,2]
## [1,]    1    2
## [2,]    1    3
## [3,]    1    4
## [4,]    1    5
## [5,]    1    6
## [6,]    1    7
##      [,1] [,2]
## [1,]    1    2
## [2,]    1    2
## [3,]    1    2
## [4,]    1    1
## [5,]    1    1
## [6,]    1    3

En el ejercicio de la asignación de la probabilidad de selección de muestra se propone el siguiente vector de probabilidades.

## [1] 0.0012394713 0.0019010936 0.0051323664 0.0089478196 0.0070264419
## [6] 0.0003545061
## La suma de p es:
## [1] 1
## [1] FALSE FALSE FALSE FALSE FALSE FALSE

Lo anterior, con el fin de establecer la inclusión a partir de la función indicadora en la selección de la muestra. Se utiliza la función I_k

##      [,1] [,2]
## [1,]    1    2
## [2,]    1    2
## [3,]    1    2
## [4,]    1    1
## [5,]    1    1
## [6,]    1    3
##   X1 X2            p X1.1 X2.1 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15 X16
## 1  1  2 0.0012394713    1    1  0  0  0  0  0  0  0   0   0   0   0   0   0   0
## 2  1  2 0.0019010936    1    0  1  0  0  0  0  0  0   0   0   0   0   0   0   0
## 3  1  2 0.0051323664    1    0  0  1  0  0  0  0  0   0   0   0   0   0   0   0
## 4  1  1 0.0089478196    1    0  0  0  1  0  0  0  0   0   0   0   0   0   0   0
## 5  1  1 0.0070264419    1    0  0  0  0  1  0  0  0   0   0   0   0   0   0   0
## 6  1  3 0.0003545061    1    0  0  0  0  0  1  0  0   0   0   0   0   0   0   0
##   X17 X18 X19 X20 X21
## 1   0   0   0   0   0
## 2   0   0   0   0   0
## 3   0   0   0   0   0
## 4   0   0   0   0   0
## 5   0   0   0   0   0
## 6   0   0   0   0   0

Probabilidad de inclusión grado I

Para la probabilidad de inclusión de cada uno de los elementos, es suficiente realizar el producto entre la probabilidad de selección de muestra p y la función indicadora

##  [1] 0.10275612 0.08842468 0.07516065 0.10121523 0.10921212 0.10561863
##  [7] 0.07954948 0.10383372 0.09293335 0.08471959 0.09806052 0.10092156
## [13] 0.08468334 0.10184632 0.08969803 0.09838451 0.08539328 0.09872885
## [19] 0.10114455 0.10443491 0.09328058

Existe la función Pk para encontrar dicha probabilidad

##           [,1]       [,2]       [,3]      [,4]      [,5]      [,6]       [,7]
## [1,] 0.1027561 0.08842468 0.07516065 0.1012152 0.1092121 0.1056186 0.07954948
##           [,8]       [,9]      [,10]      [,11]     [,12]      [,13]     [,14]
## [1,] 0.1038337 0.09293335 0.08471959 0.09806052 0.1009216 0.08468334 0.1018463
##           [,15]      [,16]      [,17]      [,18]     [,19]     [,20]      [,21]
## [1,] 0.08969803 0.09838451 0.08539328 0.09872885 0.1011445 0.1044349 0.09328058

Para la probabilidad de inclusión de grado II, se utiliza la función Pikl

##             [,1]        [,2]        [,3]        [,4]        [,5]        [,6]
## [1,] 0.102756122 0.001239471 0.001901094 0.005132366 0.008947820 0.007026442
## [2,] 0.001239471 0.088424675 0.003908250 0.005462263 0.002653068 0.007494029
## [3,] 0.001901094 0.003908250 0.075160653 0.002734287 0.003578312 0.008485092
## [4,] 0.005132366 0.005462263 0.002734287 0.101215227 0.004133281 0.009624871
## [5,] 0.008947820 0.002653068 0.003578312 0.004133281 0.109212116 0.006377044
## [6,] 0.007026442 0.007494029 0.008485092 0.009624871 0.006377044 0.105618634
##              [,7]        [,8]        [,9]       [,10]       [,11]       [,12]
## [1,] 0.0003545061 0.008763163 0.001057142 0.006529139 0.005500772 0.008070604
## [2,] 0.0002854413 0.003574899 0.007189396 0.002472201 0.005099304 0.003111731
## [3,] 0.0012712882 0.007806515 0.005089391 0.001521902 0.001394619 0.003096005
## [4,] 0.0033378282 0.003463257 0.006208089 0.003058163 0.008693583 0.003702447
## [5,] 0.0002295064 0.007681072 0.006547460 0.007036437 0.008246084 0.004555561
## [6,] 0.0078481353 0.001459609 0.008053919 0.003267473 0.003486949 0.001684241
##            [,13]       [,14]       [,15]        [,16]        [,17]       [,18]
## [1,] 0.003911809 0.006701174 0.004695970 0.0079847911 0.0044177173 0.006612322
## [2,] 0.001426053 0.008524180 0.005019247 0.0061648199 0.0084400769 0.001946033
## [3,] 0.003236337 0.001943881 0.003035796 0.0005254251 0.0005997091 0.005131140
## [4,] 0.006609794 0.007757918 0.001043382 0.0062600768 0.0018234199 0.003781729
## [5,] 0.003397889 0.008670752 0.005678851 0.0048252189 0.0081846445 0.008095912
## [6,] 0.008834684 0.007058217 0.003486632 0.0041664590 0.0026877124 0.004886981
##            [,19]       [,20]        [,21]
## [1,] 0.005323561 0.001761355 0.0068249041
## [2,] 0.001566921 0.004852064 0.0079952272
## [3,] 0.001052628 0.009661975 0.0091870089
## [4,] 0.002703014 0.008995378 0.0066900795
## [5,] 0.003391984 0.005253534 0.0017276867
## [6,] 0.001747672 0.007377980 0.0005644932

DISEÑO DE BERNOULLI

##      [,1]
## [1,]    0
## [2,]    0
## [3,]    0
## [4,]    0
## [5,]    0
## [6,]    0
## # A tibble: 2 × 21
##   battery_power bluetooth clock_speed int_memory n_cores   ram dual_sim three_g
##           <dbl> <fct>           <dbl>      <dbl>   <dbl> <dbl> <fct>    <fct>  
## 1          1954 0                 0.5         24       4   700 1        1      
## 2           769 1                 2.9          9       5  3946 1        0      
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## #   px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## #   talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>

Fijando una semilla para la obtencion de resultados

##  [1] 0.28757752 0.78830514 0.40897692 0.88301740 0.94046728 0.04555650
##  [7] 0.52810549 0.89241904 0.55143501 0.45661474 0.95683335 0.45333416
## [13] 0.67757064 0.57263340 0.10292468 0.89982497 0.24608773 0.04205953
## [19] 0.32792072 0.95450365 0.88953932
## $Ksel
## [1] 14
## 
## $ns
## [1] 1
## # A tibble: 1 × 21
##   battery_power bluetooth clock_speed int_memory n_cores   ram dual_sim three_g
##           <dbl> <fct>           <dbl>      <dbl>   <dbl> <dbl> <fct>    <fct>  
## 1           803 1                 2.1         17       4  2680 0        1      
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## #   px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## #   talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>

Para realizar el proceso de estimación a partir de la muestra, es necesario, nombrar las columnas de las muestras

## # A tibble: 1 × 21
##   battery_power bluetooth clock_speed int_memory n_cores   ram dual_sim three_g
##           <dbl> <fct>           <dbl>      <dbl>   <dbl> <dbl> <fct>    <fct>  
## 1           803 1                 2.1         17       4  2680 0        1      
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## #   px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## #   talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>

Para las estimaciones se utiliza la funcion E.BE

1.1 Estimacion del total del poder de la batería

##                        N        y
## Estimation      8.285004 6652.858
## Standard Error  7.768931 6238.452
## CVE            93.770998   93.771
## DEFF                  NA       NA
## $Estimation
##      total     Vest      e.e    Cve IC.inf IC.sup deff
## 1 6652.858 38918279 6238.452 93.771    NaN    NaN   NA

Tenemos un valor total de 6652.858, con una varianza del estimador de 38918279, valor el cual es demasiado alto y nos indica dispersión en los datos, el cual nos ayuda a evaluar que tal funciona estimar la proporción, con un error estándar de 6238.45% el cual nos indica que no hay precisión y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.

1.2 Estimacion del total de la memoria interna

##                        N        y
## Estimation      8.285004 140.8451
## Standard Error  7.768931 132.0718
## CVE            93.770998  93.7710
## DEFF                  NA       NA
## $Estimation
##      total     Vest      e.e    Cve IC.inf IC.sup deff
## 1 140.8451 17442.97 132.0718 93.771    NaN    NaN   NA

Tenemos un valor total de 140.8451 , con una varianza del estimador de 17442.97, el cual nos ayuda a evaluar que tal funciona estimar la proporción y tenemos que es un valor muy alto por lo que podemos decir que los datos son muy dispersos,un error estándar de 132.07% el cual nos indica que no tenemos precisión y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.

1.3 Estimacion del total de la ram

##                        N         y
## Estimation      8.285004 22203.811
## Standard Error  7.768931 20820.735
## CVE            93.770998    93.771
## DEFF                  NA        NA
## $Estimation
##      total      Vest      e.e    Cve IC.inf IC.sup deff
## 1 22203.81 433503014 20820.74 93.771    NaN    NaN   NA

Tenemos un valor total de 22203.81, con una varianza del estimador de 433503014, el cual nos ayuda a evaluar que tal funciona estimar la proporción y este valor tan grande nos indica que no tenemos buena dispersió, un error estándar de 20820.74, valor que nos indica que no hay buena precisión y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.

1.4 Estimacion del total de la altura de la resolución de los megapixeles

##                        N        y
## Estimation      8.285004 2850.041
## Standard Error  7.768931 2672.512
## CVE            93.770998   93.771
## DEFF                  NA       NA
## $Estimation
##      total    Vest      e.e    Cve IC.inf IC.sup deff
## 1 2850.041 7142322 2672.512 93.771    NaN    NaN   NA

Tenemos un valor total de 2850.041, con una varianza del estimador de 7142322, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y un error estándar de 2672.512 nos indica que hay baja precisión y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.

1.5 Estimacion del total de la altura de la altura de la pantalla

##                        N        y
## Estimation      8.285004 57.99503
## Standard Error  7.768931 54.38252
## CVE            93.770998 93.77100
## DEFF                  NA       NA
## $Estimation
##      total     Vest      e.e    Cve IC.inf IC.sup deff
## 1 57.99503 2957.458 54.38252 93.771    NaN    NaN   NA

Tenemos un valor total de 57.99503, con una varianza del estimador de 2957.458, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y nos da un error estándar de 54.38% el cual nos indica que no es preciso y un coeficiente de variación del estimador de 93.77% que nos indica que no es precisa.

2.1 Estimación de la batería promedio

## $Estimation
##   mean Vest e.e Cve IC.inf IC.sup
## 1  803    0   0   0    NaN    NaN

Tenemos un valor promedio de 1215.095, con una varianza del estimador de 749.0558, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso el número es muy grande, y nos da un error estándar de 27.368% el cual nos indica que no es preciso y un coeficiente de variación del estimador de 2.252407% que nos indica que no es precisa, con intervalos de confianza inferior de 1161.45 e intervalos de confianza superior de 1268.74.

2.2 Estimación de la memoria interna

## $Estimation
##   mean Vest e.e Cve IC.inf IC.sup
## 1   17    0   0   0    NaN    NaN

Tenemos un valor promedio de 31.76%, con una varianza del estimador de 1.098%, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso nos indica que no son tan dispersos, y nos da un error estándar de 1.04% el cual nos indica que es preciso y un coeficiente de variación del estimador de 3.3% que nos indica que hay buena precisión, con intervalos de confianza inferior de 29.70% e intervalos de confianza superior de 33.81%, la distancia que hay en los intervalos de confianza no varía mucho, por lo que podemos decir que no hay demasiada dispersión.

2.3 Estimación de la ram

## $Estimation
##   mean Vest e.e Cve IC.inf IC.sup
## 1 2680    0   0   0    NaN    NaN

Tenemos un valor promedio de 2156.28%, con una varianza del estimador de 4243.67%, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso nos indica que son demasiado dispersos, y nos da un error estándar de 65.14% el cual nos indica que no es preciso y un coeficiente de variación del estimador de 3.02% que nos indica que hay buena precisión, con intervalos de confianza inferior de 2028.598% e intervalos de confianza superior de 2283.956%, la distancia que hay en los intervalos de confianza varían mucho, por lo que podemos decir que hay demasiada dispersión.

2.4 Estimación de la altura de la resolución de los megapixeles

## $Estimation
##   mean Vest e.e Cve IC.inf IC.sup
## 1  344    0   0   0    NaN    NaN

Tenemos un valor promedio de 607.7975%, con una varianza del estimador de 622.9393%, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso nos indica que son demasiado dispersos, y nos da un error estándar de 24.95875% el cual nos indica que no es preciso y un coeficiente de variación del estimador de 4.1% que nos indica que hay buena precisión, con intervalos de confianza inferior de 558.88% e intervalos de confianza superior de 656.72%, la distancia que hay en los intervalos de confianza varían mucho, por lo que podemos decir que hay demasiada dispersión.

2.5 Estimación de la altura de la pantalla

## $Estimation
##   mean Vest e.e Cve IC.inf IC.sup
## 1    7    0   0   0    NaN    NaN

Tenemos un valor promedio de 12.55%, con una varianza del estimador de 0.067%, el cual nos ayuda a evaluar que tal funciona estimar la proporción, en este caso nos indica que no son dispersos, y nos da un error estándar de 0.26% el cual nos indica que es preciso y un coeficiente de variación del estimador de 2.05% que nos indica que hay buena precisión, con intervalos de confianza inferior de 12.04% e intervalos de confianza superior de 13.06%, la distancia que hay en los intervalos de confianza varían mucho, por lo que podemos decir que no hay gran dispersión.

  1. Estimación de la razón entre el poder de la batería y la time_battery

La razón comparación de magnitudes entre el poder de la batería Vs el tiempo de la batería

## $Estimation
##    ratio Vest e.e Cve IC.inf IC.sup
## 1 200.75    0   0   0    NaN    NaN

El ratio nos indica que en promedio, el poder de la batería es 115.27 mayor que el tiempo de la batería, con una varianza estimada del total de 19.25, valor el cual es alto y nos indica que hay dispersión, un error estándar de 4.39 indica que es precisa y un coeficiente de variación de 3.80%, es confiable, en los límites de confianza de 106.67% como el inferior y de 123.87% como el superior, vemos que la distancia entre los intervalos es muy grande entonces podemos decir que hay gran dispersión.

3.2 Estimación de la razón entre la altura de la resolución de los megapixeles Vs el ancho de la resolución de los megapixeles

La razón comparación de magnitudes entre la altura de la resolución de los megapixeles Vs el ancho de la resolución de los megapixeles

## $Estimation
##       ratio Vest e.e Cve IC.inf IC.sup
## 1 0.2388889    0   0   0    NaN    NaN

El ratio nos indica que en promedio, la altura de la resolución de los megapixeles es 0.503 mayor que el ancho de la resolución de los megapixeles, con una varianza estimada del total de 0.00034, valor el cual es bajo y nos indica que no hay dispersión, un error estándar de 0.018 indica que es precisa y un coeficiente de variación de 3.69%, es confiable, en los límites de confianza de 0.47% como el inferior y de 0.54% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que no hay demasiada dispersión.

3.3 Estimación de la razón entre la altura de la pantalla y el ancho de la pantalla

La razón comparación de magnitudes entre la altura de la pantalla Vs el ancho de la pantalla

## $Estimation
##   ratio Vest e.e Cve IC.inf IC.sup
## 1     7    0   0   0    NaN    NaN

El ratio nos indica que en promedio, la altura de la pantalla es 2.19 mayor que el ancho de la pantalla, con una varianza estimada del total de 0.007, valor el cual es bajo y nos indica que no hay dispersión, un error estándar de 0.086 indica que es precisa y un coeficiente de variación de 3.92%, es confiable, en los límites de confianza de 2.03% como el inferior y de 2.36% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que no hay demasiada dispersión.

4. Proporción wifi

## $Estimation
##   Uz  prop        Vest        e.e      Cve    IC.inf    IC.sup
## 1  0 0.493 0.000109891 0.01048289 2.126347 0.4724539 0.5135461
## 2  1 0.507 0.000109891 0.01048289 2.067631 0.4864539 0.5275461

Nos indica la proporción para los que no tienen wifi de 0.493, en cambio los que si tienen de 0.507, con una varianza del estimador de 0.000109891 para los que no tiene wifi y para los que si, en el caso de los errores estándar el valor también es igual para ambos casos 0.01048289, con un coeficiente de variación del estimador de 2.126347 para quienes no tiene wifi y de 2.067631 para los que si, en unos intervalos de confianza, inferior de 0.4723212 y superior de 0.5135461 para los dispositivos sin wifi y de los intervalos son: inferior de 0.4863212 y superior de 0.5276788.

Protocolo de muestreo prueba 2

## [1] 2000
## $n
## [1] 327
## 
## $no
## [1] 391

Se utiliza la función S.SI de TeachingSampling para obtener una muestra MAS.

##      [,1]
## [1,]    0
## [2,]    0
## [3,]    3
## [4,]    4
## [5,]    0
## [6,]    0
## $Ksel
##   [1]    7   10   12   14   19   24   29   38   39   42   49   51   52   58   76
##  [16]   84   91   92  102  103  104  112  120  125  129  134  137  141  144  158
##  [31]  162  165  172  174  175  182  184  197  201  217  222  224  227  232  238
##  [46]  246  270  275  286  289  294  295  300  304  314  315  337  340  344  350
##  [61]  371  372  374  385  391  393  395  397  401  402  403  406  411  425  426
##  [76]  428  429  444  458  469  471  486  494  500  510  525  527  533  534  535
##  [91]  536  540  542  552  563  564  571  580  588  593  594  601  608  612  617
## [106]  628  629  632  633  634  647  651  661  673  680  687  688  701  702  705
## [121]  706  710  711  715  729  736  737  741  746  749  759  762  774  775  783
## [136]  812  821  827  830  831  832  846  849  851  853  858  884  890  892  901
## [151]  902  907  909  915  918  926  932  936  938  941  947  954  956  972  974
## [166]  978  981  996 1000 1002 1012 1013 1020 1022 1040 1048 1055 1056 1063 1066
## [181] 1069 1073 1075 1089 1104 1107 1114 1116 1123 1130 1134 1136 1139 1145 1155
## [196] 1167 1170 1178 1180 1189 1210 1214 1219 1223 1239 1240 1246 1251 1252 1253
## [211] 1256 1259 1269 1276 1277 1285 1290 1294 1310 1333 1335 1341 1342 1343 1363
## [226] 1369 1378 1379 1383 1393 1398 1404 1405 1409 1411 1413 1415 1421 1450 1451
## [241] 1458 1465 1466 1470 1474 1479 1481 1489 1498 1507 1516 1535 1536 1541 1545
## [256] 1548 1557 1559 1577 1599 1600 1610 1611 1623 1625 1631 1637 1638 1641 1644
## [271] 1654 1657 1658 1659 1660 1677 1683 1686 1691 1692 1698 1700 1706 1712 1713
## [286] 1716 1718 1721 1732 1733 1736 1739 1740 1742 1744 1769 1772 1796 1799 1803
## [301] 1812 1814 1816 1825 1829 1835 1837 1852 1872 1876 1879 1882 1887 1892 1893
## [316] 1896 1900 1912 1924 1925 1928 1947 1966 1971 1991 1995 2000

La muestra seleccionada finalmente es la muestra 2, se procede a visualizar la muestra y hacer estimaciones, la cual es de dimensión 327 observaciones y 21 variables.

## # A tibble: 327 × 21
##    battery_power bluetooth clock_speed int_memory n_cores   ram dual_sim three_g
##            <dbl> <fct>           <dbl>      <dbl>   <dbl> <dbl> <fct>    <fct>  
##  1          1821 0                 1.7         10       8  3220 0        1      
##  2           509 1                 0.6          9       5   513 1        1      
##  3          1520 1                 2.2         33       8  3826 0        1      
##  4           803 1                 2.1         17       4  2680 0        1      
##  5          1131 1                 0.5         49       5  1835 1        1      
##  6          1602 1                 2.8         38       3  1037 1        1      
##  7          1453 0                 1.6         52       2  2373 1        1      
##  8          1725 1                 1.6          6       2  3429 1        1      
##  9           790 0                 2           11       6  3169 1        1      
## 10          1646 1                 2.3         41       2  3339 0        1      
## # ℹ 317 more rows
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## #   px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## #   talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
## [1] 327  21

Para la estimación de los parámetros poblacionales renombramos las columnas del dataframe de la muestra.

## # A tibble: 6 × 21
##   battery_power bluetooth clock_speed int_memory n_cores   ram dual_sim three_g
##           <dbl> <fct>           <dbl>      <dbl>   <dbl> <dbl> <fct>    <fct>  
## 1          1821 0                 1.7         10       8  3220 0        1      
## 2           509 1                 0.6          9       5   513 1        1      
## 3          1520 1                 2.2         33       8  3826 0        1      
## 4           803 1                 2.1         17       4  2680 0        1      
## 5          1131 1                 0.5         49       5  1835 1        1      
## 6          1602 1                 2.8         38       3  1037 1        1      
## # ℹ 13 more variables: four_g <fct>, fc <dbl>, pc <dbl>, px_height <dbl>,
## #   px_width <dbl>, m_dep <dbl>, mobile_wt <dbl>, sc_h <dbl>, sc_w <dbl>,
## #   talk_time <dbl>, touch_screen <fct>, wifi <fct>, price_range <dbl>
## $Estimation
##   Uz      prop         Vest        e.e      Cve    IC.inf    IC.sup
## 1  o 0.2507645 0.0004820952 0.02195667 8.755890 0.2077303 0.2937988
## 2  1 0.2415902 0.0004701448 0.02168282 8.975042 0.1990927 0.2840878
## 3  2 0.2477064 0.0004781597 0.02186686 8.827734 0.2048482 0.2905647
## 4  3 0.2599388 0.0004936136 0.02221742 8.547171 0.2163935 0.3034842

La proporción de los rangos de precio bajo es de 0.23%, con un varianza estimada del total de la población de 0.00047%, el cual nos sugiere buena precisión, con un error estándar de 0.021% el cual nos dice que hay buena precisión y un coeficiente de variación de 9.05% nos indica que son poco precisas, los límites de confianza se encuentra en 0.196% el límite inferior y el superior es de 0.28%, el cual no es tan amplio y nos sugiere mejor confianza en la estimación.

La proporción del rango de precio 2 (medio) es de 0.25%, con una varianza estimada del total de 0.00048%, lo que nos indica buena precisión, un eror estándar de 0.022% diciendonos que tiene buena precisión y un coeficiente de variación de 8.76%, el cual es alto y nos indica precisión estable, los límites de confianza se encuentra en 0.21% el límite inferior y el superior es de 0.29%, no son tan lejanos por lo que podemos decir que no hay gran dispersión.

La proporción de los rangos de precio bajo es de 0.26%, con un varianza estimada del total de la población de 0.00049%, el cual nos sugiere buena precisión, con un error estándar de 0.022% el cual nos dice que hay buena precisión y un coeficiente de variación de 8.61% nos indica que son poco precisas, los límites de confianza se encuentra en 0.21% el límite inferior y el superior es de 0.30%, el cual no es tan amplio y nos sugiere mejor confianza en la estimación.

La proporción de los rangos de precio bajo es de 0.25%, con un varianza estimada del total de la población de 0.00049%, el cual nos sugiere buena precisión, con un error estándar de 0.022% el cual nos dice que hay buena precisión y un coeficiente de variación de 8.685% nos indica que son poco precisas, los límites de confianza se encuentra en 0.21% el límite inferior y el superior es de 0.30%, el cual no es tan amplio y nos sugiere mejor confianza en la estimación.

## $Estimation
##       mean     Vest      e.e      Cve   IC.inf   IC.sup
## 1 1224.284 508.4189 22.54815 1.841741 1180.091 1268.478
## $Estimation
##     total       Vest      e.e      Cve  IC.inf  IC.sup
## 1 2448569 2033675666 45096.29 1.841741 2360182 2536956

La media del poder de la batería es de 1209.737 con una varianza del estimador de 493.71%, el cual evalúa como funciona estimar la proporción, nos dice que es un valor alto y nos indica que son muy dispersos, un error estándar de 22.22% nos dice que la estimación no es precisa y un coeficiente de variación del estimador de 1.83%, el cual nos indica que es confiable en los intervalos de confianza 1166.19 para el límite inferior y 1253.287 para el límite superior indicando que las distancias son lejanas entonces tendríamos gran dispersión.

La sumatoria total de la caracteristica de poder de la batería es de 2419474 con una varianza del estimador de 1974835659, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 44439.12 y nos dice que no es precisa, ya que esta demasiado alto y un coeficiente de variación del estimador de 1.83%, el cual nos indica que es confiable en los intervalos de confianza 2332375 para el límite inferior y 2506573 para el límite superior.

## $Estimation
##      mean      Vest       e.e      Cve   IC.inf   IC.sup
## 1 32.8318 0.7809574 0.8837179 2.691652 31.09975 34.56386
## $Estimation
##      total    Vest      e.e      Cve  IC.inf   IC.sup
## 1 65663.61 3123829 1767.436 2.691652 62199.5 69127.72

La media de la memoria interna es de 32.70% con una varianza del estimador de 0.91%, el cual evalúa como funciona estimar la proporción, nos dice que es un valor bajo y nos indica que no son muy dispersos, un error estándar de 0.95% nos dice que la estimación es precisa y un coeficiente de variación del estimador de 2.9%, el cual nos indica que es confiable en los intervalos de confianza 30.83% para el límite inferior y 34.57% para el límite superior indicando que las distancias son lejanas entonces tendríamos gran dispersión.

La sumatoria total de la caracteristica de la memoria interna es de 65400.61% con una varianza del estimador de 3630707%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 1905.441, nos dice que no es precisa, ya que esta demasiado alto y un coeficiente de variación del estimador de 2.9%, el cual nos indica que es confiable en los intervalos de confianza 61666.02% para el límite inferior y 69135.21% para el límite superior.

## $Estimation
##       mean       Vest       e.e      Cve   IC.inf   IC.sup
## 1 9.874618 0.09814848 0.3132866 3.172645 9.260587 10.48865
## $Estimation
##      total     Vest      e.e      Cve   IC.inf  IC.sup
## 1 19749.24 392593.9 626.5732 3.172645 18521.17 20977.3

La media de los megapixeles de la cámara principal es de 10.07% con una varianza del estimador de 0.096%, el cual evalúa como funciona estimar la proporción, nos dice que es un valor bajo y nos indica que no son muy dispersos, un error estándar de 0.31% nos dice que la estimación es precisa y un coeficiente de variación del estimador de 3.08%, el cual nos indica que es confiable en los intervalos de confianza 9.46% para el límite inferior y 10.68% para el límite superior indicando que las distancias son lejanas entonces tendríamos gran dispersión.

La sumatoria total de los megapixeles de la cámara principal es de 20140.67% con una varianza del estimador de 385108.7%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 620.5712, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 3.08%, el cual nos indica que es confiable en los intervalos de confianza 18924.38% para el límite inferior y 21356.97% para el límite superior.

## [1] "Estimación del dominio universal =estm.Ud"
## $Estimation
##      total       Vest      e.e      Cve   IC.inf   IC.sup
## o 550367.0 2781289068 52737.93 9.582321 447002.5 653731.4
## 1 584434.3 3278215819 57255.71 9.796774 472215.1 696653.4
## 2 622899.1 3555671396 59629.45 9.572891 506027.5 739770.7
## 3 690868.5 3928635341 62678.83 9.072468 568020.3 813716.7

La sumatoria total de los megapixeles de la cámara principal es de 559322.3% respecto al rango de precio 0 (bajo), con una varianza del estimador de 4108930290%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 64100.94%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.4%, el cual nos indica que no es confiable en los intervalos de confianza 433686.8% para el límite inferior y 684957.8% para el límite superior.

La sumatoria total de los megapixeles de la cámara principal es de 592264.5% respecto al rango de precio 1 (medio), con una varianza del estimador de 4545383650%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 67419.46%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.38%, el cual nos indica que no es confiable en los intervalos de confianza 460124.7% para el límite inferior y 724404.2% para el límite superior.

La sumatoria total de los megapixeles de la cámara principal es de 610900.8% respecto al rango de precio 2 (alto), con una varianza del estimador de 4810034610%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 69354.41%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.35%, el cual nos indica que no es confiable en los intervalos de confianza 474968.7% para el límite inferior y 746833% para el límite superior.

La sumatoria total de los megapixeles de la cámara principal es de 667702.5% respecto al rango de precio 3 (muy alto), con una varianza del estimador de 5675953437%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 75338.92%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.28%, el cual nos indica que no es confiable en los intervalos de confianza 520040.9% para el límite inferior y 815364.1% para el límite superior.

## [1] "Estimación del dominio universal =estm.Ud"
## $Estimation
##      total      Vest      e.e      Cve   IC.inf   IC.sup
## o 2042.813  74290.17 272.5622 13.34249 1508.601 2577.026
## 1 1810.398  70749.97 265.9887 14.69228 1289.069 2331.726
## 2 2489.297 104534.74 323.3183 12.98834 1855.604 3122.989
## 3 2348.624  99909.32 316.0843 13.45828 1729.110 2968.138

La sumatoria total de los megapixeles de la cámara frontal es de 2049.587% respecto al rango de precio 0 (bajo), con una varianza del estimador de 110676.1%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 332.6802%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 16.23%, el cual nos indica que no es confiable en los intervalos de confianza 1397.55% para el límite inferior y 2701.63% para el límite superior.

La sumatoria total de los megapixeles de la cámara frontal es de 2066.116% respecto al rango de precio 1 (medio), con una varianza del estimador de 110669.1%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 332.6697%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 16.10%, el cual nos indica que no es confiable en los intervalos de confianza 1414.095% para el límite inferior y 2718.136% para el límite superior.

La sumatoria total de los megapixeles de la cámara frontal es de 2239.669% respecto al rango de precio 2 (alto), con una varianza del estimador de 122110.8%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 349.4435%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 15.60%, el cual nos indica que no es confiable en los intervalos de confianza 1554.77% para el límite inferior y 2924.56% para el límite superior.

La sumatoria total de los megapixeles de la cámara frontal es de 667702.5% respecto al rango de precio 3 (muy alto), con una varianza del estimador de 5675953437%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 75338.92%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 11.28%, el cual nos indica que no es confiable en los intervalos de confianza 520040.9% para el límite inferior y 815364.1% para el límite superior.

## [1] "Estimación del dominio universal =estm.Ud"
## $Estimation
##      total     Vest      e.e       Cve   IC.inf   IC.sup
## o 784.7095 6653.923 81.57158 10.395132 624.8321 944.5868
## 1 729.0520 6009.771 77.52271 10.633359 577.1103 880.9937
## 2 775.5352 6321.218 79.50609 10.251771 619.7061 931.3642
## 3 781.6514 6085.226 78.00786  9.979879 628.7588 934.5440

La sumatoria total de la velocidad del procesador es de 809.09% respecto al rango de precio 0 (bajo), con una varianza del estimador de 9511.02%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 97.52%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 12.05%, el cual nos indica que no es confiable en los intervalos de confianza 617.94% para el límite inferior y 1000.23% para el límite superior.

La sumatoria total de la velocidad del procesador es de 780.16% respecto al rango de precio 1 (medio), con una varianza del estimador de 9231.97%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 96.08%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 12.31%, el cual nos indica que no es confiable en los intervalos de confianza 591.85% para el límite inferior y 968.48% para el límite superior.

La sumatoria total de la velocidad del procesador es de 736.36% respecto al rango de precio 2 (alto), con una varianza del estimador de 8377.64%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 91.52%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 12.42%, el cual nos indica que no es confiable en los intervalos de confianza 556.97% para el límite inferior y 915.76% para el límite superior.

La sumatoria total de la velocidad del procesador es de 722.31% respecto al rango de precio 3 (muy alto), con una varianza del estimador de 8202.20%, el cual es un valor muy alto y nos dice que es muy disperso, un error estándar de 90.56%, nos dice que no es precisa, ya que es demasiado alto y un coeficiente de variación del estimador de 12.53%, el cual nos indica que no es confiable en los intervalos de confianza 544.81% para el límite inferior y 899.82% para el límite superior.

## $Estimation
##         ratio         Vest          e.e      Cve      IC.inf      IC.sup
## 1 0.008804994 6.908386e-08 0.0002628381 2.985102 0.008289841 0.009320147

El ratio nos indica que en promedio, el tiempo de la batería es 0.0087 mayor que el poder de la batería, con una varianza estimada del total de la población de 1.09465e-07, valor el cual es bajo y nos indica que es estable, un error estándar de 0.00033 indica que es precisa y un coeficiente de variación de 3.81%, es confiable, en los límites de confianza de 0.008% como el inferior y de 0.0093% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que es precisa y confiable.

## $Estimation
##         ratio      Vest          e.e      Cve      IC.inf      IC.sup
## 1 0.003663147 1.143e-08 0.0001069112 2.918562 0.003453605 0.003872689

El ratio nos indica que en promedio, la profundidad del dispositivo es 0.0038 mayor que el ancho del dispositivo, con una varianza estimada del total de la población de 1.637805e-08 , valor el cual es bajo y nos indica que es estable, un error estándar de 0.00012 indica que es precisa y un coeficiente de variación de 3.33%, es confiable, en los límites de confianza de 0.0036% como el inferior y de 0.0041% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que es precisa y confiable.

## $Estimation
##      ratio      Vest       e.e      Cve   IC.inf   IC.sup
## 1 21.38219 0.6360173 0.7975069 3.729771 19.81911 22.94528

El ratio nos indica que en promedio, la memoria interna es 20.84056 mayor que la velocidad del microprocesador, con una varianza estimada del total de la población de 0.9824306, valor el cual es bajo y nos indica que es estable, un error estándar de 0.9912 indica que es precisa y un coeficiente de variación de 4.76%, es confiable, en los límites de confianza de 0.0036% como el inferior y de 22.78% como el superior, vemos que la distancia entre los intervalos no es muy grande entonces podemos decir que es precisa y confiable.