R es un lenguaje de programación y entorno de software libre orientado al análisis estadístico y la visualización de datos. Es ampliamente utilizado en ciencia de datos, análisis estadístico, modelado y gráficos. Cuenta con una gran comunidad y miles de paquetes que amplían sus funcionalidades.
RStudio es un Entorno de Desarrollo Integrado (IDE) para R. Facilita la escritura, ejecución y depuración de código R, al ofrecer una interfaz amigable con consola, editor, visor de variables, salida de gráficos y más.
Una variable almacena un valor. Se asigna con el operador
<-
:
a <- 10
b <- 5
También es posible usar =
, aunque en R se prefiere
<-
:
c = 3
Una vez definidas, las variables pueden usarse en operaciones:
# Suma
total <- a + b
print(total)
## [1] 15
# Multiplicación
producto <- a * c
print(producto)
## [1] 30
valor <- 100
Valor <- 200
print(valor) # imprime 100
## [1] 100
print(Valor) # imprime 200
## [1] 200
R maneja distintos tipos de datos:
# Numérico
x <- 42
is.numeric(x) # TRUE
## [1] TRUE
# Texto
nombre <- "Ana"
is.character(nombre) # TRUE
## [1] TRUE
# Lógico
bandera <- TRUE
is.logical(bandera) # TRUE
## [1] TRUE
edad
y
muestra su contenido.Una de las características principales de R es su versatilidad, tanto para crear conjuntos de datos como para trabajar con ellos.
secuencia <- 1:10
print(secuencia)
## [1] 1 2 3 4 5 6 7 8 9 10
notas <- c(3.5, 4.0, 2.8, 5.0, 4.5)
print(notas)
## [1] 3.5 4.0 2.8 5.0 4.5
mean(notas) # Promedio
## [1] 3.96
sd(notas) # Desviación estándar
## [1] 0.8561542
summary(notas) # Resumen estadístico
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2.80 3.50 4.00 3.96 4.50 5.00
nombres <- c("Ana", "Luis", "Carlos")
print(nombres)
## [1] "Ana" "Luis" "Carlos"
edades <- c(23, 25, 30)
personas <- data.frame(Nombre = nombres, Edad = edades)
print(personas)
## Nombre Edad
## 1 Ana 23
## 2 Luis 25
## 3 Carlos 30
personas$Nombre
## [1] "Ana" "Luis" "Carlos"
personas$Edad
## [1] 23 25 30
data.frame
con dos columnas: una de
nombres y otra de edades.data.frame
usando
$
.Una de las capacidades más potentes de R es su capacidad para generar gráficos de forma sencilla.
x <- 1:10
y <- x^2
plot(x, y, type = "b", col = "blue", main = "Gráfico de x vs x^2", xlab = "x", ylab = "x^2")
notas <- c(3.5, 4.0, 2.8, 5.0, 4.5, 3.7, 4.1)
hist(notas, col = "lightblue", main = "Histograma de notas", xlab = "Nota")
boxplot(notas, main = "Diagrama de cajas de notas", ylab = "Nota")
x
contra
x^2
usando la función plot()
.boxplot()
para visualizar la distribución de
ese vector de notas.