Ciclo de Ciencia de Datos

CPU’s lanzados en el periodo 2010 - 2020

Author

Jose Suarez

CPU’s lanzados en el periodo 2010 - 2020

Una Unidad Central de Procesamiento (CPU por sus siglas en inglés), es el cerebro de cualquier computadora. Se encarga de procesar instrucciones y realizar calculos que permiten el funcionamiento de programas y aplicaciones.

Algunos de los fabricantes más recomocidos de CPU’s son Intel y AMD, los cuales veremos en nuestro ciclo de ciencia de datos.

Conjunto de datos utilizado: https://www.openintro.org/data/index.php?data=cpu

Carga de datos

Primero llamaremos a la libreria tidyverse, que se compone de ggplot y dplyr , y aparte DT para una correcta gestion de datos.

Resumen Estadistico

Iniciamos con un resumen estadístico de todo nuestro conjunto de datos. Nos damos cuenta que mantiene una amplitud de 875 observaciones en el periodo de 2010 - 2020

   company              name             codename             cores       
 Length:875         Length:875         Length:875         Min.   : 1.000  
 Class :character   Class :character   Class :character   1st Qu.: 2.000  
 Mode  :character   Mode  :character   Mode  :character   Median : 4.000  
                                                          Mean   : 7.807  
                                                          3rd Qu.: 6.000  
                                                          Max.   :72.000  
                                                                          
    threads        base_clock     boost_clock       socket         
 Min.   :  1.0   Min.   :0.600   Min.   :1.300   Length:875        
 1st Qu.:  4.0   1st Qu.:2.050   1st Qu.:3.300   Class :character  
 Median :  4.0   Median :2.700   Median :3.700   Mode  :character  
 Mean   : 17.3   Mean   :2.631   Mean   :3.651                     
 3rd Qu.: 12.0   3rd Qu.:3.300   3rd Qu.:4.100                     
 Max.   :288.0   Max.   :4.700   Max.   :5.300                     
                                 NA's   :318                       
    process         l3_cache           tdp           released        
 Min.   : 7.00   Min.   :  1.00   Min.   :  1.00   Length:875        
 1st Qu.:14.00   1st Qu.:  4.00   1st Qu.: 35.00   Class :character  
 Median :22.00   Median :  8.00   Median : 65.00   Mode  :character  
 Mean   :22.58   Mean   : 16.35   Mean   : 75.86                     
 3rd Qu.:32.00   3rd Qu.: 15.00   3rd Qu.: 95.00                     
 Max.   :45.00   Max.   :256.00   Max.   :400.00                     
                 NA's   :185                                         

  AMD Intel 
  304   571 

Inicialmente, queremos ver las primeras filas de nuestro csv para ver que nos encontramos, por lo que:

  company       name   codename cores threads base_clock boost_clock socket
1   Intel Xeon E5507 Gainestown     4       4      2.266          NA   1366
  process l3_cache tdp   released
1      45        4  80 2010-03-16

Renombramiento de Variables

Capaz para una mejor visualización necesitemos modificar los nombres de nuestras variables, evitando complicaciones en la lectura para aquellos que se les dificulte el inglés.

Para que nuestro conjunto de datos tenga sentido, lo mejor seria ordenar por fecha, desde la mas antigua a la mas reciente con la funcion arrange

Ademas, se presenta un DataTable, extrayendo la funcion desde el LLM Copilot

Cantidad de Procesadores de las Marcas a Evaluar

Mediante un gráfico de barras podemos visualizar cuantos procesadores ha lanzado cada marca.


  AMD Intel 
  304   571 

Intel por poco duplica la cantidad de AMD, lo que puede significar que:

  • Se adaptan rápidamente a nuevas tecnologías y demandas;

  • Aplican una estrategia para ofrecer opciones a diferentes segmentos (gamers, servidores, computacion en general…);

  • Desean mantenerse relevantes frente a su competencia directa.

Cantidad de Procesadores Lanzados por Año

Nos parece un poco extraño el hecho de que en 6 años se tengan las mismas cantidades de procesadores lanzados (101). Esto puede suceder porque es posible que en ciertos años se tengan cantidades similares de CPUs.

Distribución de Frecuencias Base de los Procesadores

Los rectángulos representan la distribución de frecuencia base de los procesadores.

El centro de la caja muestra la mediana: el valor medio de la frecuencia base de cada marca. Los bigotes son relativamente grandes, lo que significa que hay mucha variabilidad en las frecuencias base.

Por otro lado, los datos de Intel son mucho más dispersos que los de AMD.

Distribución de Frecuencias Máximas de los Procesadores

En este gráfico, vemos que tenemos puntos fuera de los bigotes (valores atípicos), los cuales identifican frecuencias máximas más bajas que el resto.

Nuevamente, AMD tiene datos menos dispersos que Intel, por lo que las frecuencias están más cerca unas de otras.

¿El Procesador más Potente de Intel? ¿En que se Diferencia a su Primer lanzamiento?

Procesadores Intel Core i7: Potencia Desde su Primer Lanzamiento

Es una línea de procesadores de alto rendimiento diseñada para usuarios que buscan potencia en gaming, productividad y multitarea avanzada. Desde su lanzamiento, ha evolucionado significativamente en eficiencia, velocidad y arquitectura.

  • El procesador i7-10700F tiene más núcleos e hilos, lo que mejora el rendimiento en multitarea.

  • Tine una mejor frecuencia turbo (4,7GHz vs. 3.6GHz).

  • Mantiene un proceso de fabricación más antiguo, por lo que es menos eficiente.

Con proceso de fabricación nos referimos a la tecnología utilizada para construir transistores dentro del chip. 14nm>45nm: implica mas eficiencia y menor consumo de energía.

Me disculpo por la tardanza, la verdad es un trabajo que no se desarrolló como esperaba.