un objeto es simplemente una estructura de datos que contiene valores. Estos objetos pueden ser de diversos tipos, numerico, logico o de caracteres
vector_numerico <- c(2, 9, 1, 13, 7)
print(vector_numerico)
## [1] 2 9 1 13 7
vector_caracteres <- c("Lunes", "Martes", "Miercoles", "Jueves", "Viernes", "Sabado", "Domingo")
print(vector_caracteres)
## [1] "Lunes" "Martes" "Miercoles" "Jueves" "Viernes" "Sabado"
## [7] "Domingo"
vector_logico <- c(FALSE, TRUE, FALSE, TRUE, FALSE)
print(vector_logico)
## [1] FALSE TRUE FALSE TRUE FALSE
Acceso a elementos:Puedes acceder a elementos específicos de un vector utilizando su índice.
vector_numerico[3]
## [1] 1
print(vector_numerico)
## [1] 2 9 1 13 7
Modificar elementos:Puedes modificar elementos del vector asignándoles nuevos valores:
vector_logico[2] <- "Gente"
print(vector_logico)
## [1] "FALSE" "Gente" "FALSE" "TRUE" "FALSE"
Agregar elementos:Para agregar elementos a un vector utlizando “c”
vector_caracteres <- c(vector_caracteres, "rosa")
print(vector_caracteres)
## [1] "Lunes" "Martes" "Miercoles" "Jueves" "Viernes" "Sabado"
## [7] "Domingo" "rosa"
Eliminar elementos:Puedes eliminar elementos de un vector utilizando índices
vector_numerico <- vector_numerico[-2]
print(vector_numerico)
## [1] 2 1 13 7
Longitud del vector:Para conocer la longitud de un vector, puedes usar la función “length()”
longitud <- length(vector_logico)
print(longitud)
## [1] 5
una variable es un contenedor que almacena un valor específico. Este valor puede ser un único número, un carácter, un valor lógico, una cadena de texto,y un objeto es una estructura de datos que almacena una secuencia ordenada de elementos del mismo tipo. Pueden ser vectores numéricos, de caracteres, lógicos, etc. Los objetos son un tipo especial de variable que almacena datos de forma ordenada y homogénea.Entonces, la principal diferencia radica en que una variable puede contener un único valor de cualquier tipo, mientras que un objeto es una estructura de datos que puede contener una secuencia ordenada de elementos del mismo tipo.
edad <- 30
nombre <- "Juan"
es_hombre <- TRUE
numeros <- c(1, 2, 3, 4, 5)
palabras <- c("Hola", "Mundo", "R", "Studio")
logico <- c(TRUE, FALSE, TRUE, FALSE)
es un archivo de texto plano que contiene una serie de comandos escritos en el lenguaje de programación R. Estos comandos pueden incluir definiciones de variables, funciones, operaciones aritméticas, manipulación de datos, gráficos, y cualquier otra tarea que se pueda realizar utilizando R.
Para ejecutar un script en R, puedes seguir estos pasos:
1.Abre el entorno de desarrollo de R Studio en tu computadora.
2.cargar el R Studioutilizando open, file y utilizando doble cilc
3.Una vez que el script está abierto en R Studio, puedes ejecutarlo seleccionando todo o las lineas indicidualmente.
4.Una vez que el script se haya ejecutado, podrás ver los resultados de los comandos en la consola de R Studio. Esto puede incluir impresiones de texto, gráficos generados, variables definidas y cualquier otro resultado producido por el código en el script.
-La utilidad de los scripts en R :
1.Al escribir tus análisis y operaciones en un script, puedes asegurar que cualquier persona pueda reproducir exactamente los mismos resultados simplemente ejecutando el script.
2.Los scripts te permiten organizar tu código de manera lógica y estructurada. Puedes dividir tu trabajo en secciones, funciones y comentarios para facilitar la comprensión y el mantenimiento del código.
En el entorno de R, la ventana de comandos, también conocida como la consola de R, es donde puedes interactuar directamente con R ejecutando comandos uno por uno. Es una parte fundamental del entorno de R, ya que te permite ingresar y ejecutar código R de forma interactiva y ver los resultados inmediatamente. Aquí tienes algunas funciones clave de la ventana de comandos:
2.Exploración de datos: Puedes utilizar la ventana de comandos para explorar tus conjuntos de datos. Puedes cargar conjuntos de datos, ver resúmenes estadísticos, filtrar datos, realizar cálculos y manipular datos de diversas maneras.
3.Depuración de código: Cuando estás escribiendo un script o una función en R, puedes usar la ventana de comandos para probar partes de tu código antes de incluirlo en tu script completo. Esto te permite depurar tu código paso a paso y verificar que funcione como se espera.
4.Pruebas rápidas: La ventana de comandos es útil para realizar pruebas rápidas y experimentar con diferentes funciones y expresiones sin necesidad de escribir un script completo. Puedes probar nuevas ideas, métodos o algoritmos de manera interactiva antes de integrarlos en tu trabajo principal.
5.Retroalimentación inmediata: La ventana de comandos proporciona una retroalimentación inmediata sobre los comandos que ejecutas. Puedes ver los resultados directamente en la consola, lo que facilita la comprensión de cómo funciona cada comando y cómo se aplican a tus datos.
ventajas:
1.Interactividad inmediata: En la ventana de comandos, obtienes resultados inmediatos después de ingresar un comando. Esto es útil para explorar datos rápidamente, probar funciones y experimentar con diferentes enfoques sin tener que escribir un script completo.
2.Rápido prototipado: La ventana de comandos es ideal para el rápido prototipado y desarrollo iterativo. Puedes probar ideas y soluciones de manera interactiva antes de formalizarlas en un script completo. Esto te permite ajustar y perfeccionar tu enfoque más rápidamente.
3.Depuración interactiva: Cuando encuentras un problema en tu código, puedes usar la ventana de comandos para depurar de manera interactiva. Puedes probar partes de tu código, verificar variables y realizar cambios en tiempo real para identificar y corregir errores más fácilmente.
4.Exploración de datos dinámica: La ventana de comandos te permite explorar datos de manera dinámica y flexible. Puedes cargar conjuntos de datos, calcular resúmenes estadísticos, crear visualizaciones y realizar análisis ad hoc de manera interactiva.
5.Experimentación y aprendizaje: La ventana de comandos es una excelente herramienta para experimentar y aprender sobre R y sus capacidades. Puedes probar diferentes funciones, expresiones y técnicas para familiarizarte con el lenguaje y mejorar tus habilidades de programación en R.
Características: Un vector es una estructura de datos unidimensional que contiene elementos del mismo tipo, como números, caracteres o valores lógicos.
Usos: Los vectores son utilizados para almacenar datos de manera eficiente y realizar operaciones vectorizadas en ellos. Son fundamentales en el análisis de datos y la programación en R.
letras <- c("a", "b", "c", "d", "e")
Características: Un data frame es una estructura de datos bidimensional que organiza los datos en filas y columnas, similar a una tabla de base de datos o una hoja de cálculo.
Usos: Los data frames son ampliamente utilizados para trabajar con conjuntos de datos tabulares. Son útiles para cargar, manipular y analizar datos estructurados, y son la estructura de datos más comúnmente utilizada en el análisis de datos en R.
numeros <- c(1, 2, 3, 4, 5)
letras <- c("a", "l", "c", "f", "x")
logico <- c(TRUE, FALSE, TRUE, FALSE, TRUE)
datos <- data.frame(numeros, letras, logico)
print(datos)
## numeros letras logico
## 1 1 a TRUE
## 2 2 l FALSE
## 3 3 c TRUE
## 4 4 f FALSE
## 5 5 x TRUE
Características: Una lista es una estructura de datos que puede contener elementos de diferentes tipos, incluidos otros objetos de R, como vectores, data frames, matrices u otras listas.
Usos: Las listas son útiles para almacenar colecciones heterogéneas de datos. Se utilizan cuando necesitas agrupar objetos de diferentes tipos o cuando quieres estructurar datos de manera más compleja que con vectores o data frames.
mi_lista <- list(numeros, letras, logico)
print(mi_lista)
## [[1]]
## [1] 1 2 3 4 5
##
## [[2]]
## [1] "a" "l" "c" "f" "x"
##
## [[3]]
## [1] TRUE FALSE TRUE FALSE TRUE
Características: Una matriz es una estructura de datos bidimensional que contiene elementos del mismo tipo, organizados en filas y columnas.
Usos: Las matrices son utilizadas para representar datos numéricos o categóricos en forma de una tabla bidimensional. Son útiles para realizar operaciones matriciales y cálculos estadísticos.
matriz <- matrix(1:9, nrow = 3, ncol = 3)
print(matriz)
## [,1] [,2] [,3]
## [1,] 1 4 7
## [2,] 2 5 8
## [3,] 3 6 9
Características: Un factor es un tipo de dato especial utilizado para representar variables categóricas o de factor, donde cada valor representa una categoría única.
Usos: Los factores son comúnmente utilizados para representar variables categóricas en análisis estadísticos y gráficos. Son útiles para ordenar y agrupar datos categóricos de manera consistente.
genero <- factor(c("Hombre", "Mujer", "Mujer", "Hombre"))
print(genero)
## [1] Hombre Mujer Mujer Hombre
## Levels: Hombre Mujer
Los factores son particularmente útiles cuando trabajas con variables que tienen un número limitado y predefinido de niveles o categorías.
1.read.table(): Importa datos desde un archivo de texto en formato de tabla.
2.read.csv(): Importa datos desde un archivo CSV (valores separados por comas).
3.read.delim(): Importa datos desde un archivo de texto delimitado por un carácter específico
2.read_excel(): Importa datos desde un archivo Excel.
read.spss(): Importa datos desde un archivo SPSS
1.dbConnect(): Conecta a una base de datos
2.dbGetQuery(): Ejecuta una consulta SQL y devuelve los resultados como un data frame.
1.write.table(): Exporta datos a un archivo de texto en formato de tabla.
2.write.csv(): Exporta datos a un archivo CSV.
3.write.delim(): Exporta datos a un archivo de texto delimitado por un carácter específico.
write.xlsx(): Exporta datos a un archivo Exce.
:write_xlsx(): Exporta datos a un archivo Excel
1.dbWriteTable(): Escribe un data frame en una tabla de una base de datos.
2.dbSendQuery(): Ejecuta una consulta SQL y guarda los resultados en una tabla de una base de datos.
1.saveRDS(): Guarda un objeto R en formato RDS (R Data Serialization), que conserva la estructura y los atributos del objeto.
2.readRDS(): Lee un archivo RDS y carga el objeto almacenado en él.
Esta función se utiliza para extraer subconjuntos de datos basados en condiciones específicas.
data("Orange")
subset(Orange, age > 220)
## Tree age circumference
## 2 1 484 58
## 3 1 664 87
## 4 1 1004 115
## 5 1 1231 120
## 6 1 1372 142
## 7 1 1582 145
## 9 2 484 69
## 10 2 664 111
## 11 2 1004 156
## 12 2 1231 172
## 13 2 1372 203
## 14 2 1582 203
## 16 3 484 51
## 17 3 664 75
## 18 3 1004 108
## 19 3 1231 115
## 20 3 1372 139
## 21 3 1582 140
## 23 4 484 62
## 24 4 664 112
## 25 4 1004 167
## 26 4 1231 179
## 27 4 1372 209
## 28 4 1582 214
## 30 5 484 49
## 31 5 664 81
## 32 5 1004 125
## 33 5 1231 142
## 34 5 1372 174
## 35 5 1582 177
Esta función se utiliza para realizar agregaciones en datos, es decir, calcular estadísticas resumidas (como suma, media, mediana, etc.) para grupos de observaciones.
E <- data.frame(edad = c(25, 30, 35, 40, 45),
grupo = c("A", "A", "B", "B", "B"))
print(E)
## edad grupo
## 1 25 A
## 2 30 A
## 3 35 B
## 4 40 B
## 5 45 B
resultado <- aggregate(edad ~ grupo, data = E, FUN = mean)
Esta función se utiliza para combinar dos data frames basados en una o más variables comunes.
numeros <- c(2,5,9,7,6)
pais <- c("colombia", "bolivia", "canada", "panama","ecuador")
G <- data.frame(numeros, pais)
print(G)
## numeros pais
## 1 2 colombia
## 2 5 bolivia
## 3 9 canada
## 4 7 panama
## 5 6 ecuador
merge(datos, G, by = "numeros")
## numeros letras logico pais
## 1 2 l FALSE colombia
## 2 5 x TRUE bolivia
La clase de un vector en R se define utilizando la función class(), que devuelve la clase (o clases) de un objeto R. Los vectores en R pueden tener diferentes clases, dependiendo del tipo de datos que contengan.
x <- c(1, 2, 3, 4, 5)
class(x)
## [1] "numeric"
y <- c("a", "b", "c")
class(y)
## [1] "character"
z <- c(TRUE, FALSE, TRUE)
class(z)
## [1] "logical"
w <- c(1L, 2L, 3L)
class(w)
## [1] "integer"
f <- factor(c("A", "B", "A", "C"))
class(f)
## [1] "factor"
i <- c(1 + 2i, 3 + 4i)
class(i)
## [1] "complex"
Nombre <- c("paola","pedro","celeste","julieth","juan","simon")
Edad <- c(20,22,21,23,22,20)
Ciudad <- c("pitalito","pereira","cartagena","cali","medellin","bogota")
Tt <- data.frame(Nombre, Edad, Ciudad)
print(Tt)
## Nombre Edad Ciudad
## 1 paola 20 pitalito
## 2 pedro 22 pereira
## 3 celeste 21 cartagena
## 4 julieth 23 cali
## 5 juan 22 medellin
## 6 simon 20 bogota
nuevas_filas <- data.frame(Nombre = c("ramon", "leticia","sofia","manuel","gabriela"),
Edad = c(20, 22, 22, 25, 21),
Ciudad = c("santander", "bolivar", "santa fe", "villa vicencio", "cauca"))
Tt <- rbind(Tt, nuevas_filas)
# Mostrar el DataFrame con las nuevas filas añadidas
print(Tt)
## Nombre Edad Ciudad
## 1 paola 20 pitalito
## 2 pedro 22 pereira
## 3 celeste 21 cartagena
## 4 julieth 23 cali
## 5 juan 22 medellin
## 6 simon 20 bogota
## 7 ramon 20 santander
## 8 leticia 22 bolivar
## 9 sofia 22 santa fe
## 10 manuel 25 villa vicencio
## 11 gabriela 21 cauca
Tt <- Tt[order(-Tt$Edad), ]
print(Tt)
## Nombre Edad Ciudad
## 10 manuel 25 villa vicencio
## 4 julieth 23 cali
## 2 pedro 22 pereira
## 5 juan 22 medellin
## 8 leticia 22 bolivar
## 9 sofia 22 santa fe
## 3 celeste 21 cartagena
## 11 gabriela 21 cauca
## 1 paola 20 pitalito
## 6 simon 20 bogota
## 7 ramon 20 santander
Tt_filtrado <- subset(Tt, Edad > 22)
print(Tt_filtrado)
## Nombre Edad Ciudad
## 10 manuel 25 villa vicencio
## 4 julieth 23 cali
Tt=cbind(Tt,añosdeexperiencia=rep(1))
print(Tt)
## Nombre Edad Ciudad añosdeexperiencia
## 10 manuel 25 villa vicencio 1
## 4 julieth 23 cali 1
## 2 pedro 22 pereira 1
## 5 juan 22 medellin 1
## 8 leticia 22 bolivar 1
## 9 sofia 22 santa fe 1
## 3 celeste 21 cartagena 1
## 11 gabriela 21 cauca 1
## 1 paola 20 pitalito 1
## 6 simon 20 bogota 1
## 7 ramon 20 santander 1
fix(Tt)
Tt_filtrado <- Tt_filtrado[Tt_filtrado$Nombre != "julieth", ]
print(Tt_filtrado)
## Nombre Edad Ciudad
## 10 manuel 25 villa vicencio
nuevas_filas <- data.frame(Nombre = c("fernanda", "fabian", "harold"),
Edad = c(30, 25, 35),
Ciudad = c("casanare", "yopal", "sincelejo"))
Tt <- rbind(Tt_filtrado, nuevas_filas)
print(Tt)
## Nombre Edad Ciudad
## 10 manuel 25 villa vicencio
## 1 fernanda 30 casanare
## 2 fabian 25 yopal
## 3 harold 35 sincelejo
install.packages(“ggplot2”) library(ggplot2)
library(ggplot2)
library(ggplot2)
ggplot(Tt, aes(x = Ciudad)) +
geom_bar(fill = "skyblue", color = "black") +
labs(title = "Cantidad de personas por Ciudad",
x = "Ciudad",
y = "Cantidad de Personas")
en mi grafico las ciudades estan en la misma proporcion
#Realiza un análisis descriptivo de los datos cargados, incluyendo medidas de tendenciacentral, la media, la mediana y la desviación estándar de una de las variables numéricas.
data("iris")
print(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width Species
## 1 5.1 3.5 1.4 0.2 setosa
## 2 4.9 3.0 1.4 0.2 setosa
## 3 4.7 3.2 1.3 0.2 setosa
## 4 4.6 3.1 1.5 0.2 setosa
## 5 5.0 3.6 1.4 0.2 setosa
## 6 5.4 3.9 1.7 0.4 setosa
## 7 4.6 3.4 1.4 0.3 setosa
## 8 5.0 3.4 1.5 0.2 setosa
## 9 4.4 2.9 1.4 0.2 setosa
## 10 4.9 3.1 1.5 0.1 setosa
## 11 5.4 3.7 1.5 0.2 setosa
## 12 4.8 3.4 1.6 0.2 setosa
## 13 4.8 3.0 1.4 0.1 setosa
## 14 4.3 3.0 1.1 0.1 setosa
## 15 5.8 4.0 1.2 0.2 setosa
## 16 5.7 4.4 1.5 0.4 setosa
## 17 5.4 3.9 1.3 0.4 setosa
## 18 5.1 3.5 1.4 0.3 setosa
## 19 5.7 3.8 1.7 0.3 setosa
## 20 5.1 3.8 1.5 0.3 setosa
## 21 5.4 3.4 1.7 0.2 setosa
## 22 5.1 3.7 1.5 0.4 setosa
## 23 4.6 3.6 1.0 0.2 setosa
## 24 5.1 3.3 1.7 0.5 setosa
## 25 4.8 3.4 1.9 0.2 setosa
## 26 5.0 3.0 1.6 0.2 setosa
## 27 5.0 3.4 1.6 0.4 setosa
## 28 5.2 3.5 1.5 0.2 setosa
## 29 5.2 3.4 1.4 0.2 setosa
## 30 4.7 3.2 1.6 0.2 setosa
## 31 4.8 3.1 1.6 0.2 setosa
## 32 5.4 3.4 1.5 0.4 setosa
## 33 5.2 4.1 1.5 0.1 setosa
## 34 5.5 4.2 1.4 0.2 setosa
## 35 4.9 3.1 1.5 0.2 setosa
## 36 5.0 3.2 1.2 0.2 setosa
## 37 5.5 3.5 1.3 0.2 setosa
## 38 4.9 3.6 1.4 0.1 setosa
## 39 4.4 3.0 1.3 0.2 setosa
## 40 5.1 3.4 1.5 0.2 setosa
## 41 5.0 3.5 1.3 0.3 setosa
## 42 4.5 2.3 1.3 0.3 setosa
## 43 4.4 3.2 1.3 0.2 setosa
## 44 5.0 3.5 1.6 0.6 setosa
## 45 5.1 3.8 1.9 0.4 setosa
## 46 4.8 3.0 1.4 0.3 setosa
## 47 5.1 3.8 1.6 0.2 setosa
## 48 4.6 3.2 1.4 0.2 setosa
## 49 5.3 3.7 1.5 0.2 setosa
## 50 5.0 3.3 1.4 0.2 setosa
## 51 7.0 3.2 4.7 1.4 versicolor
## 52 6.4 3.2 4.5 1.5 versicolor
## 53 6.9 3.1 4.9 1.5 versicolor
## 54 5.5 2.3 4.0 1.3 versicolor
## 55 6.5 2.8 4.6 1.5 versicolor
## 56 5.7 2.8 4.5 1.3 versicolor
## 57 6.3 3.3 4.7 1.6 versicolor
## 58 4.9 2.4 3.3 1.0 versicolor
## 59 6.6 2.9 4.6 1.3 versicolor
## 60 5.2 2.7 3.9 1.4 versicolor
## 61 5.0 2.0 3.5 1.0 versicolor
## 62 5.9 3.0 4.2 1.5 versicolor
## 63 6.0 2.2 4.0 1.0 versicolor
## 64 6.1 2.9 4.7 1.4 versicolor
## 65 5.6 2.9 3.6 1.3 versicolor
## 66 6.7 3.1 4.4 1.4 versicolor
## 67 5.6 3.0 4.5 1.5 versicolor
## 68 5.8 2.7 4.1 1.0 versicolor
## 69 6.2 2.2 4.5 1.5 versicolor
## 70 5.6 2.5 3.9 1.1 versicolor
## 71 5.9 3.2 4.8 1.8 versicolor
## 72 6.1 2.8 4.0 1.3 versicolor
## 73 6.3 2.5 4.9 1.5 versicolor
## 74 6.1 2.8 4.7 1.2 versicolor
## 75 6.4 2.9 4.3 1.3 versicolor
## 76 6.6 3.0 4.4 1.4 versicolor
## 77 6.8 2.8 4.8 1.4 versicolor
## 78 6.7 3.0 5.0 1.7 versicolor
## 79 6.0 2.9 4.5 1.5 versicolor
## 80 5.7 2.6 3.5 1.0 versicolor
## 81 5.5 2.4 3.8 1.1 versicolor
## 82 5.5 2.4 3.7 1.0 versicolor
## 83 5.8 2.7 3.9 1.2 versicolor
## 84 6.0 2.7 5.1 1.6 versicolor
## 85 5.4 3.0 4.5 1.5 versicolor
## 86 6.0 3.4 4.5 1.6 versicolor
## 87 6.7 3.1 4.7 1.5 versicolor
## 88 6.3 2.3 4.4 1.3 versicolor
## 89 5.6 3.0 4.1 1.3 versicolor
## 90 5.5 2.5 4.0 1.3 versicolor
## 91 5.5 2.6 4.4 1.2 versicolor
## 92 6.1 3.0 4.6 1.4 versicolor
## 93 5.8 2.6 4.0 1.2 versicolor
## 94 5.0 2.3 3.3 1.0 versicolor
## 95 5.6 2.7 4.2 1.3 versicolor
## 96 5.7 3.0 4.2 1.2 versicolor
## 97 5.7 2.9 4.2 1.3 versicolor
## 98 6.2 2.9 4.3 1.3 versicolor
## 99 5.1 2.5 3.0 1.1 versicolor
## 100 5.7 2.8 4.1 1.3 versicolor
## 101 6.3 3.3 6.0 2.5 virginica
## 102 5.8 2.7 5.1 1.9 virginica
## 103 7.1 3.0 5.9 2.1 virginica
## 104 6.3 2.9 5.6 1.8 virginica
## 105 6.5 3.0 5.8 2.2 virginica
## 106 7.6 3.0 6.6 2.1 virginica
## 107 4.9 2.5 4.5 1.7 virginica
## 108 7.3 2.9 6.3 1.8 virginica
## 109 6.7 2.5 5.8 1.8 virginica
## 110 7.2 3.6 6.1 2.5 virginica
## 111 6.5 3.2 5.1 2.0 virginica
## 112 6.4 2.7 5.3 1.9 virginica
## 113 6.8 3.0 5.5 2.1 virginica
## 114 5.7 2.5 5.0 2.0 virginica
## 115 5.8 2.8 5.1 2.4 virginica
## 116 6.4 3.2 5.3 2.3 virginica
## 117 6.5 3.0 5.5 1.8 virginica
## 118 7.7 3.8 6.7 2.2 virginica
## 119 7.7 2.6 6.9 2.3 virginica
## 120 6.0 2.2 5.0 1.5 virginica
## 121 6.9 3.2 5.7 2.3 virginica
## 122 5.6 2.8 4.9 2.0 virginica
## 123 7.7 2.8 6.7 2.0 virginica
## 124 6.3 2.7 4.9 1.8 virginica
## 125 6.7 3.3 5.7 2.1 virginica
## 126 7.2 3.2 6.0 1.8 virginica
## 127 6.2 2.8 4.8 1.8 virginica
## 128 6.1 3.0 4.9 1.8 virginica
## 129 6.4 2.8 5.6 2.1 virginica
## 130 7.2 3.0 5.8 1.6 virginica
## 131 7.4 2.8 6.1 1.9 virginica
## 132 7.9 3.8 6.4 2.0 virginica
## 133 6.4 2.8 5.6 2.2 virginica
## 134 6.3 2.8 5.1 1.5 virginica
## 135 6.1 2.6 5.6 1.4 virginica
## 136 7.7 3.0 6.1 2.3 virginica
## 137 6.3 3.4 5.6 2.4 virginica
## 138 6.4 3.1 5.5 1.8 virginica
## 139 6.0 3.0 4.8 1.8 virginica
## 140 6.9 3.1 5.4 2.1 virginica
## 141 6.7 3.1 5.6 2.4 virginica
## 142 6.9 3.1 5.1 2.3 virginica
## 143 5.8 2.7 5.1 1.9 virginica
## 144 6.8 3.2 5.9 2.3 virginica
## 145 6.7 3.3 5.7 2.5 virginica
## 146 6.7 3.0 5.2 2.3 virginica
## 147 6.3 2.5 5.0 1.9 virginica
## 148 6.5 3.0 5.2 2.0 virginica
## 149 6.2 3.4 5.4 2.3 virginica
## 150 5.9 3.0 5.1 1.8 virginica
mean(iris$Sepal.Length, na.rm = TRUE)
## [1] 5.843333
median(iris$Sepal.Width, na.rm = TRUE)
## [1] 3
sd(iris$Petal.Width, na.rm = TRUE)
## [1] 0.7622377
summary(iris)
## Sepal.Length Sepal.Width Petal.Length Petal.Width
## Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
## 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
## Median :5.800 Median :3.000 Median :4.350 Median :1.300
## Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
## 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
## Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
## Species
## setosa :50
## versicolor:50
## virginica :50
##
##
##
hist(iris[["Sepal.Length"]])
data <- 'https://raw.githubusercontent.com/fhernanb/datos/master/babies.txt'
dt <- read.table (data,header=TRUE, sep='\t')
summary(dt)
## bwt gestation parity age
## Min. : 55.0 Min. :148.0 Length:1236 Min. :15.00
## 1st Qu.:108.8 1st Qu.:272.0 Class :character 1st Qu.:23.00
## Median :120.0 Median :280.0 Mode :character Median :26.00
## Mean :119.6 Mean :279.3 Mean :27.26
## 3rd Qu.:131.0 3rd Qu.:288.0 3rd Qu.:31.00
## Max. :176.0 Max. :353.0 Max. :45.00
## NA's :13 NA's :2
## height weight smoke
## Min. :53.00 Min. : 87.0 Length:1236
## 1st Qu.:62.00 1st Qu.:114.8 Class :character
## Median :64.00 Median :125.0 Mode :character
## Mean :64.05 Mean :128.6
## 3rd Qu.:66.00 3rd Qu.:139.0
## Max. :72.00 Max. :250.0
## NA's :22 NA's :36
mean(dt[, c("bwt")])
## [1] 119.5769
mean(dt[, c("age")], na.rm = TRUE)
## [1] 27.25527
library(DescTools)
Mode(dt$parity, na.rm = TRUE)
## [1] "First born"
## attr(,"freq")
## [1] 921
quantile(dt$bwt, probs=c(0.25,0.40,0.90))
## 25% 40% 90%
## 108.75 116.00 142.00
median(dt[, c("height")], na.rm = TRUE)
## [1] 64
sd(dt[, c("bwt")], na.rm = TRUE)
## [1] 18.23645
var(dt[, c("bwt")], na.rm = TRUE)
## [1] 332.5682
library(readxl)
basededatos <- read_excel("C:/Users/Laura/Downloads/basededatos.xlsx")
View(basededatos)
datos <- basededatos
summary(basededatos)
## nombre ocupacion edad peso
## Length:13 Length:13 Min. :20.00 Min. :50.00
## Class :character Class :character 1st Qu.:21.00 1st Qu.:54.00
## Mode :character Mode :character Median :25.00 Median :56.00
## Mean :26.77 Mean :56.46
## 3rd Qu.:30.00 3rd Qu.:60.00
## Max. :40.00 Max. :62.00
## altura # de hijos
## Min. :1.540 Min. :0.000
## 1st Qu.:1.610 1st Qu.:0.000
## Median :1.630 Median :1.000
## Mean :1.632 Mean :1.462
## 3rd Qu.:1.660 3rd Qu.:2.000
## Max. :1.720 Max. :4.000
head(basededatos)
## # A tibble: 6 × 6
## nombre ocupacion edad peso altura `# de hijos`
## <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 santiago medico 25 52 1.62 2
## 2 pedro profesor 21 55 1.54 1
## 3 julian abogado 30 56 1.65 3
## 4 laura ingeniero 35 60 1.62 2
## 5 cristian estudiante 38 62 1.63 1
## 6 mateo medico 40 60 1.56 0
para la variable edad su promedio es de 27 años maximo 40, para el peso su promedio es de 57 maximo 62 , para la altura el promedio es 1.63 maximo 1.72 esto quiere decir que las personas entrevistadas esta en un promedio de 27 años con un peso de 57 una altura de 1,63 y con un hijo.
ggplot(basededatos, aes(x = edad, fill = altura)) +
geom_bar(position = "dodge") +
labs(title = "Comparación de Edad por altura",
x = "altura",
y = "Frecuencia")
## Warning: The following aesthetics were dropped during statistical transformation: fill.
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
## the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
## variable into a factor?
varianza <- var(basededatos$peso)
print(varianza)
## [1] 13.10256
desviacion <- sd(basededatos$altura)
print(desviacion)
## [1] 0.05289079
La varianza mide cuánto se dispersan los valores de una variable alrededor de la media. Una varianza alta indica una mayor dispersión. La desviación estándar es simplemente la raíz cuadrada de la varianza y proporciona una medida de dispersión en la misma escala que los datos originales. Una desviación estándar alta indica una mayor variabilidad en los datos.