TEMA I: Generalidades del entorno y lenguaje R.
Características generales del lenguaje
Funcionamiento de R
Creación, listado y remoción de objetos en memoria
Objetos y tipos de datos
Obtener ayuda
R es un lenguaje de programación y un entorno de software para el análisis estadístico y la visualización de datos.
Desarrollado por Robert Gentleman y Ross Ihaka en 1993.
Es un software de código abierto y gratuito.
Interactividad: Permite realizar análisis en tiempo real.
Extensibilidad: Gran cantidad de paquetes disponibles para diversas aplicaciones.
Visualización: Herramientas potentes para crear gráficos y visualizaciones.
Comunidad: Amplia comunidad de usuarios y desarrolladores.
Google efectividad publicitaria y pronósticos económicos
Facebook análisis imágenes de perfil
Twitter visualización de datos y agrupación semántica
Idioma artificial (formal)
Diseñado para expresar computaciones
Llevadas a cabo por computadoras
Los objetos son como sustantivos y las funciones son como verbos
Definición: Los sustantivos representan cosas o conceptos. En R, los objetos son los “sustantivos” que contienen datos.
Ejemplo: Un vector de números o texto en R se considera un objeto.
Los verbos expresan acciones en las lenguas humanas. De manera similar, las funciones en R son los “verbos” que realizan acciones sobre los objetos.
Ejemplo: La función sum() en R actúa como el verbo “sumar”, realizando cálculos sobre los datos.
Si consideramos las funciones como verbos, los argumentos de las funciones pueden verse como adverbios que modifican la acción.
Ejemplo: En ‘mean(numeros)’, el argumento números especifica sobre qué datos se realiza la acción de calcular la media.
Construcción de Sentencias: Al igual que en una oración donde los sustantivos y verbos se combinan para expresar un pensamiento completo, en R se combinan objetos (sustantivos) y funciones (verbos) para realizar operaciones.
Ejemplo: La expresión mean(numeros) es equivalente a “calcular la media de numeros”, donde “calcular” es el verbo y “la media de numeros” es el objeto.
Estructura y Sintaxis: Al igual que el español combina sustantivos y verbos según reglas gramaticales, R combina objetos y funciones para realizar cálculos.
Características del Lenguaje: R tiene su propio vocabulario y sintaxis, permitiendo dar comandos y estructurar soluciones a problemas.
Tipos de sistemas de POO(Hadley Wickham 2016).
Los objetos se crean:
Leyendo datos de un archivo
Como resultado de un cálculo
“Asignándoles un valor”
etc.
familia más importante de tipos de datos en la base R
las funciones que escribirá funcionarán con vectores como argumentos
vectores atómicos: elementos del mismo tipo (homogéneos)
listas o vectores recursivos: pueden tener elementos de varios tipos (heterogéneos)
NULL: vector genérico de longitud cero
Lógicos: - (TRUE o FALSE), o ( T o F)
Dobles: - forma decimal ( 0.1234), científica ( 1.23e4)
Enteros: - seguidas de L ( 1234L, 1e4L)
Cadenas: - encerrados por comillas ( “hi”)
la funcion “c()” abreviatura de concatenar hace vectores más largos
Se agregar atributos a vectores atómicos para creas otras estructuras de datos:
factores - se construyen sobre los vectores enteros
vectores de fecha
Fecha-hora (POSIXct)
Duraciones de tiempo (difftime)
Es un vector que solo puede contener valores predefinidos
Se utiliza para almacenar datos categóricos
Son útiles cuando conoce el conjunto de valores posibles, pero no todos están presentes en un conjunto de datos dados.
cada elemento puede ser de cualquier tipo
contruir una lista
vectores S3 más importantes
lista con nombre de vectores (columna)
la longitud de cada uno de sus vectores debe ser la misma a diferencia de las listas
difiere de las listas en que todos los elementos deben ser vectores con la misma longitud
convertir un dataframe a tibbles as_tibble(iris)
crear un nuevo tibble a partir de vectores individuales tibble()
Extraer por nombre
Extraer por posición