¿Qué es un objeto en R? ¿Cómo se crea y se manipula un objeto?

un objeto es simplemente una estructura de datos que contiene valores. Estos objetos pueden ser de diversos tipos, numerico, logico o de caracteres

vector_numerico <- c(2, 9, 1, 13, 7)
print(vector_numerico)

## [1]  2  9  1 13  7

vector_caracteres <- c("Lunes", "Martes", "Miercoles", "Jueves", "Viernes", "Sabado", "Domingo")
print(vector_caracteres)

## [1] "Lunes"     "Martes"    "Miercoles" "Jueves"    "Viernes"   "Sabado"   
## [7] "Domingo"

vector_logico <- c(FALSE, TRUE, FALSE, TRUE, FALSE)
print(vector_logico)

## [1] FALSE  TRUE FALSE  TRUE FALSE

Manipulacion del objeto

Acceso a elementos:Puedes acceder a elementos específicos de un vector utilizando su índice.

vector_numerico[3]

## [1] 1

print(vector_numerico)

## [1]  2  9  1 13  7

Modificar elementos:Puedes modificar elementos del vector asignándoles nuevos valores:

vector_logico[2] <- "Gente"
print(vector_logico)

## [1] "FALSE" "Gente" "FALSE" "TRUE"  "FALSE"

Agregar elementos:Para agregar elementos a un vector utlizando “c”

vector_caracteres <- c(vector_caracteres, "rosa")
print(vector_caracteres)

## [1] "Lunes"     "Martes"    "Miercoles" "Jueves"    "Viernes"   "Sabado"   
## [7] "Domingo"   "rosa"

Eliminar elementos:Puedes eliminar elementos de un vector utilizando índices

vector_numerico <- vector_numerico[-2]
print(vector_numerico)

## [1]  2  1 13  7

Longitud del vector:Para conocer la longitud de un vector, puedes usar la función “length()”

longitud <- length(vector_logico)
print(longitud)

## [1] 5

¿Cuál es la diferencia entre una variable y un objeto?

una variable es un contenedor que almacena un valor específico. Este valor puede ser un único número, un carácter, un valor lógico, una cadena de texto,y un objeto es una estructura de datos que almacena una secuencia ordenada de elementos del mismo tipo. Pueden ser vectores numéricos, de caracteres, lógicos, etc. Los objetos son un tipo especial de variable que almacena datos de forma ordenada y homogénea.Entonces, la principal diferencia radica en que una variable puede contener un único valor de cualquier tipo, mientras que un objeto es una estructura de datos que puede contener una secuencia ordenada de elementos del mismo tipo.

edad <- 30
nombre <- "Juan"
es_hombre <- TRUE
numeros <- c(1, 2, 3, 4, 5)
palabras <- c("Hola", "Mundo", "R", "Studio")
logico <- c(TRUE, FALSE, TRUE, FALSE)

¿Qué es un script en R?

es un archivo de texto plano que contiene una serie de comandos escritos en el lenguaje de programación R. Estos comandos pueden incluir definiciones de variables, funciones, operaciones aritméticas, manipulación de datos, gráficos, y cualquier otra tarea que se pueda realizar utilizando R.

Explica cómo se ejecuta un script y cuál es su utilidad.

Para ejecutar un script en R, puedes seguir estos pasos:

1.Abre el entorno de desarrollo de R Studio en tu computadora.

2.cargar el R Studioutilizando open, file y utilizando doble cilc

3.Una vez que el script está abierto en R Studio, puedes ejecutarlo seleccionando todo o las lineas indicidualmente.

4.Una vez que el script se haya ejecutado, podrás ver los resultados de los comandos en la consola de R Studio. Esto puede incluir impresiones de texto, gráficos generados, variables definidas y cualquier otro resultado producido por el código en el script.

-La utilidad de los scripts en R :

1.Al escribir tus análisis y operaciones en un script, puedes asegurar que cualquier persona pueda reproducir exactamente los mismos resultados simplemente ejecutando el script.

2.Los scripts te permiten organizar tu código de manera lógica y estructurada. Puedes dividir tu trabajo en secciones, funciones y comentarios para facilitar la comprensión y el mantenimiento del código.

también sirven como documentación viva de tu trabajo. Puedes incluir comentarios explicativos en el código para explicar tu enfoque, tus decisiones y los resultados obtenidos.

Describe la función de la ventana de comandos en el entorno de R.

En el entorno de R, la ventana de comandos, también conocida como la consola de R, es donde puedes interactuar directamente con R ejecutando comandos uno por uno. Es una parte fundamental del entorno de R, ya que te permite ingresar y ejecutar código R de forma interactiva y ver los resultados inmediatamente. Aquí tienes algunas funciones clave de la ventana de comandos:

Interactividad: La ventana de comandos te permite interactuar directamente con R escribiendo y ejecutando comandos a medida que los necesitas. Puedes ingresar comandos, expresiones y funciones directamente en la consola y obtener resultados instantáneos.

2.Exploración de datos: Puedes utilizar la ventana de comandos para explorar tus conjuntos de datos. Puedes cargar conjuntos de datos, ver resúmenes estadísticos, filtrar datos, realizar cálculos y manipular datos de diversas maneras.

3.Depuración de código: Cuando estás escribiendo un script o una función en R, puedes usar la ventana de comandos para probar partes de tu código antes de incluirlo en tu script completo. Esto te permite depurar tu código paso a paso y verificar que funcione como se espera.

4.Pruebas rápidas: La ventana de comandos es útil para realizar pruebas rápidas y experimentar con diferentes funciones y expresiones sin necesidad de escribir un script completo. Puedes probar nuevas ideas, métodos o algoritmos de manera interactiva antes de integrarlos en tu trabajo principal.

5.Retroalimentación inmediata: La ventana de comandos proporciona una retroalimentación inmediata sobre los comandos que ejecutas. Puedes ver los resultados directamente en la consola, lo que facilita la comprensión de cómo funciona cada comando y cómo se aplican a tus datos.

¿Cuáles son las ventajas de usar la ventana de comandos frente a un script?

ventajas:

1.Interactividad inmediata: En la ventana de comandos, obtienes resultados inmediatos después de ingresar un comando. Esto es útil para explorar datos rápidamente, probar funciones y experimentar con diferentes enfoques sin tener que escribir un script completo.

2.Rápido prototipado: La ventana de comandos es ideal para el rápido prototipado y desarrollo iterativo. Puedes probar ideas y soluciones de manera interactiva antes de formalizarlas en un script completo. Esto te permite ajustar y perfeccionar tu enfoque más rápidamente.

3.Depuración interactiva: Cuando encuentras un problema en tu código, puedes usar la ventana de comandos para depurar de manera interactiva. Puedes probar partes de tu código, verificar variables y realizar cambios en tiempo real para identificar y corregir errores más fácilmente.

4.Exploración de datos dinámica: La ventana de comandos te permite explorar datos de manera dinámica y flexible. Puedes cargar conjuntos de datos, calcular resúmenes estadísticos, crear visualizaciones y realizar análisis ad hoc de manera interactiva.

5.Experimentación y aprendizaje: La ventana de comandos es una excelente herramienta para experimentar y aprender sobre R y sus capacidades. Puedes probar diferentes funciones, expresiones y técnicas para familiarizarte con el lenguaje y mejorar tus habilidades de programación en R.

Nombra al menos cinco tipos de objetos que existen en R. Describe las características y usos de cada uno.

1. vectores

Características: Un vector es una estructura de datos unidimensional que contiene elementos del mismo tipo, como números, caracteres o valores lógicos.

Usos: Los vectores son utilizados para almacenar datos de manera eficiente y realizar operaciones vectorizadas en ellos. Son fundamentales en el análisis de datos y la programación en R.

letras <- c("a", "b", "c", "d", "e")

2.Data frames:

Características: Un data frame es una estructura de datos bidimensional que organiza los datos en filas y columnas, similar a una tabla de base de datos o una hoja de cálculo.

Usos: Los data frames son ampliamente utilizados para trabajar con conjuntos de datos tabulares. Son útiles para cargar, manipular y analizar datos estructurados, y son la estructura de datos más comúnmente utilizada en el análisis de datos en R.

numeros <- c(1, 2, 3, 4, 5)
letras <- c("a", "l", "c", "f", "x")
logico <- c(TRUE, FALSE, TRUE, FALSE, TRUE)
datos <- data.frame(numeros, letras, logico)
print(datos)

##   numeros letras logico
## 1       1      a   TRUE
## 2       2      l  FALSE
## 3       3      c   TRUE
## 4       4      f  FALSE
## 5       5      x   TRUE

3.Listas:

Características: Una lista es una estructura de datos que puede contener elementos de diferentes tipos, incluidos otros objetos de R, como vectores, data frames, matrices u otras listas.

Usos: Las listas son útiles para almacenar colecciones heterogéneas de datos. Se utilizan cuando necesitas agrupar objetos de diferentes tipos o cuando quieres estructurar datos de manera más compleja que con vectores o data frames.

mi_lista <- list(numeros, letras, logico)
print(mi_lista)

## [[1]]
## [1] 1 2 3 4 5
## 
## [[2]]
## [1] "a" "l" "c" "f" "x"
## 
## [[3]]
## [1]  TRUE FALSE  TRUE FALSE  TRUE

4. Matrices:

Características: Una matriz es una estructura de datos bidimensional que contiene elementos del mismo tipo, organizados en filas y columnas.

Usos: Las matrices son utilizadas para representar datos numéricos o categóricos en forma de una tabla bidimensional. Son útiles para realizar operaciones matriciales y cálculos estadísticos.

matriz <- matrix(1:9, nrow = 3, ncol = 3)
print(matriz)

##      [,1] [,2] [,3]
## [1,]    1    4    7
## [2,]    2    5    8
## [3,]    3    6    9

5.Factores:

Características: Un factor es un tipo de dato especial utilizado para representar variables categóricas o de factor, donde cada valor representa una categoría única.

Usos: Los factores son comúnmente utilizados para representar variables categóricas en análisis estadísticos y gráficos. Son útiles para ordenar y agrupar datos categóricos de manera consistente.

genero <- factor(c("Hombre", "Mujer", "Mujer", "Hombre"))
print(genero)

## [1] Hombre Mujer  Mujer  Hombre
## Levels: Hombre Mujer

¿Qué tipo de objeto se debe utilizar para almacenar datos categóricos?

Los factores son particularmente útiles cuando trabajas con variables que tienen un número limitado y predefinido de niveles o categorías.

¿Cuáles son las funciones básicas de R para importar y exportar datos?

1. importar archivos de texto:

1.read.table(): Importa datos desde un archivo de texto en formato de tabla.

2.read.csv(): Importa datos desde un archivo CSV (valores separados por comas).

3.read.delim(): Importa datos desde un archivo de texto delimitado por un carácter específico

2. Importar archivos Excel:

read.xlsx(): Importa datos desde un archivo Excel (.xlsx)

2.read_excel(): Importa datos desde un archivo Excel.

3. Importar archivos SPSS:

read.spss(): Importa datos desde un archivo SPSS

4. Importar bases de datos:

1.dbConnect(): Conecta a una base de datos

2.dbGetQuery(): Ejecuta una consulta SQL y devuelve los resultados como un data frame.

5. Exporta archivos de texto:

1.write.table(): Exporta datos a un archivo de texto en formato de tabla.

2.write.csv(): Exporta datos a un archivo CSV.

3.write.delim(): Exporta datos a un archivo de texto delimitado por un carácter específico.

6. Exporta archivos Excel:

write.xlsx(): Exporta datos a un archivo Exce.
:write_xlsx(): Exporta datos a un archivo Excel

7. Exporta bases de datos:

1.dbWriteTable(): Escribe un data frame en una tabla de una base de datos.

2.dbSendQuery(): Ejecuta una consulta SQL y guarda los resultados en una tabla de una base de datos.

8. Exporta otros formatos:

1.saveRDS(): Guarda un objeto R en formato RDS (R Data Serialization), que conserva la estructura y los atributos del objeto.

2.readRDS(): Lee un archivo RDS y carga el objeto almacenado en él.

Menciona al menos tres funciones que se utilizan comúnmente para manipular datos en R

1. subset()

Esta función se utiliza para extraer subconjuntos de datos basados en condiciones específicas.

data("Orange")
subset(Orange, age > 220)

##    Tree  age circumference
## 2     1  484            58
## 3     1  664            87
## 4     1 1004           115
## 5     1 1231           120
## 6     1 1372           142
## 7     1 1582           145
## 9     2  484            69
## 10    2  664           111
## 11    2 1004           156
## 12    2 1231           172
## 13    2 1372           203
## 14    2 1582           203
## 16    3  484            51
## 17    3  664            75
## 18    3 1004           108
## 19    3 1231           115
## 20    3 1372           139
## 21    3 1582           140
## 23    4  484            62
## 24    4  664           112
## 25    4 1004           167
## 26    4 1231           179
## 27    4 1372           209
## 28    4 1582           214
## 30    5  484            49
## 31    5  664            81
## 32    5 1004           125
## 33    5 1231           142
## 34    5 1372           174
## 35    5 1582           177

2.aggregate()

Esta función se utiliza para realizar agregaciones en datos, es decir, calcular estadísticas resumidas (como suma, media, mediana, etc.) para grupos de observaciones.

E <- data.frame(edad = c(25, 30, 35, 40, 45),
                    grupo = c("A", "A", "B", "B", "B"))
print(E)

##   edad grupo
## 1   25     A
## 2   30     A
## 3   35     B
## 4   40     B
## 5   45     B

resultado <- aggregate(edad ~ grupo, data = E, FUN = mean)

merge()

Esta función se utiliza para combinar dos data frames basados en una o más variables comunes.

numeros <- c(2,5,9,7,6)
pais <- c("colombia", "bolivia", "canada", "panama","ecuador")
G <- data.frame(numeros, pais)
print(G)

##   numeros     pais
## 1       2 colombia
## 2       5  bolivia
## 3       9   canada
## 4       7   panama
## 5       6  ecuador

merge(datos, G, by = "numeros")

##   numeros letras logico     pais
## 1       2      l  FALSE colombia
## 2       5      x   TRUE  bolivia

¿Cómo se define la clase de un objeto en R? ¿Cuáles son algunos ejemplos de las posibles clases que un objeto puede tener?

La clase de un vector en R se define utilizando la función class(), que devuelve la clase (o clases) de un objeto R. Los vectores en R pueden tener diferentes clases, dependiendo del tipo de datos que contengan.

x <- c(1, 2, 3, 4, 5)
class(x)

## [1] "numeric"

y <- c("a", "b", "c")
class(y)

## [1] "character"

z <- c(TRUE, FALSE, TRUE)
class(z)

## [1] "logical"

w <- c(1L, 2L, 3L)
class(w)

## [1] "integer"

f <- factor(c("A", "B", "A", "C"))
class(f)

## [1] "factor"

i <- c(1 + 2i, 3 + 4i)
class(i)

## [1] "complex"

MANEJO DE DATOS BASICOS

Nombre <- c("paola","pedro","celeste","julieth","juan","simon")
Edad <- c(20,22,21,23,22,20)
Ciudad <- c("pitalito","pereira","cartagena","cali","medellin","bogota")
Tt <- data.frame(Nombre, Edad, Ciudad)


print(Tt)

##    Nombre Edad    Ciudad
## 1   paola   20  pitalito
## 2   pedro   22   pereira
## 3 celeste   21 cartagena
## 4 julieth   23      cali
## 5    juan   22  medellin
## 6   simon   20    bogota

nuevas_filas <- data.frame(Nombre = c("ramon", "leticia","sofia","manuel","gabriela"),
                            Edad = c(20, 22, 22, 25, 21),
                            Ciudad = c("santander", "bolivar", "santa fe", "villa vicencio", "cauca"))


Tt <- rbind(Tt, nuevas_filas)

# Mostrar el DataFrame con las nuevas filas añadidas
print(Tt)

##      Nombre Edad         Ciudad
## 1     paola   20       pitalito
## 2     pedro   22        pereira
## 3   celeste   21      cartagena
## 4   julieth   23           cali
## 5      juan   22       medellin
## 6     simon   20         bogota
## 7     ramon   20      santander
## 8   leticia   22        bolivar
## 9     sofia   22       santa fe
## 10   manuel   25 villa vicencio
## 11 gabriela   21          cauca

Ordena el dataframe por la columna “Edad” de mayor a menor.

Tt <- Tt[order(-Tt$Edad), ]
print(Tt)

##      Nombre Edad         Ciudad
## 10   manuel   25 villa vicencio
## 4   julieth   23           cali
## 2     pedro   22        pereira
## 5      juan   22       medellin
## 8   leticia   22        bolivar
## 9     sofia   22       santa fe
## 3   celeste   21      cartagena
## 11 gabriela   21          cauca
## 1     paola   20       pitalito
## 6     simon   20         bogota
## 7     ramon   20      santander

Filtra el dataframe para mostrar solo las filas donde “Edad” es mayor de 30.

Tt_filtrado <- subset(Tt, Edad > 22)
print(Tt_filtrado)

##     Nombre Edad         Ciudad
## 10  manuel   25 villa vicencio
## 4  julieth   23           cali

MANIPULACION DE DATOS

Agrega una nueva columna llamada “Años de experiencia” con valores numéricos.

Tt=cbind(Tt,añosdeexperiencia=rep(1))
print(Tt)

##      Nombre Edad         Ciudad añosdeexperiencia
## 10   manuel   25 villa vicencio                 1
## 4   julieth   23           cali                 1
## 2     pedro   22        pereira                 1
## 5      juan   22       medellin                 1
## 8   leticia   22        bolivar                 1
## 9     sofia   22       santa fe                 1
## 3   celeste   21      cartagena                 1
## 11 gabriela   21          cauca                 1
## 1     paola   20       pitalito                 1
## 6     simon   20         bogota                 1
## 7     ramon   20      santander                 1

fix(Tt)

Elimina un dato y agrega 3 nuevos valores.

Tt_filtrado <- Tt_filtrado[Tt_filtrado$Nombre != "julieth", ]

print(Tt_filtrado)

##    Nombre Edad         Ciudad
## 10 manuel   25 villa vicencio

nuevas_filas <- data.frame(Nombre = c("fernanda", "fabian", "harold"),
                           Edad = c(30, 25, 35),
                           Ciudad = c("casanare", "yopal", "sincelejo"))


Tt <- rbind(Tt_filtrado, nuevas_filas)


print(Tt)

##      Nombre Edad         Ciudad
## 10   manuel   25 villa vicencio
## 1  fernanda   30       casanare
## 2    fabian   25          yopal
## 3    harold   35      sincelejo

VISUALIZACION DE DATOS

Utiliza la librería ggplot2 para crear un gráfico de barras que muestre la cantidad depersonas por “Ciudad”.

install.packages(“ggplot2”) library(ggplot2)

Explica brevemente qué muestra el gráfico y qué conclusiones puedes sacar de él.

library(ggplot2)

library(ggplot2)
ggplot(Tt, aes(x = Ciudad)) +
  geom_bar(fill = "skyblue", color = "black") +
  labs(title = "Cantidad de personas por Ciudad",
       x = "Ciudad",
       y = "Cantidad de Personas")

en mi grafico las ciudades estan en la misma proporcion

ANALISIS ESTADISTICO BASICO

#Realiza un análisis descriptivo de los datos cargados, incluyendo medidas de tendenciacentral, la media, la mediana y la desviación estándar de una de las variables numéricas.

data("iris")
print(iris)

##     Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
## 1            5.1         3.5          1.4         0.2     setosa
## 2            4.9         3.0          1.4         0.2     setosa
## 3            4.7         3.2          1.3         0.2     setosa
## 4            4.6         3.1          1.5         0.2     setosa
## 5            5.0         3.6          1.4         0.2     setosa
## 6            5.4         3.9          1.7         0.4     setosa
## 7            4.6         3.4          1.4         0.3     setosa
## 8            5.0         3.4          1.5         0.2     setosa
## 9            4.4         2.9          1.4         0.2     setosa
## 10           4.9         3.1          1.5         0.1     setosa
## 11           5.4         3.7          1.5         0.2     setosa
## 12           4.8         3.4          1.6         0.2     setosa
## 13           4.8         3.0          1.4         0.1     setosa
## 14           4.3         3.0          1.1         0.1     setosa
## 15           5.8         4.0          1.2         0.2     setosa
## 16           5.7         4.4          1.5         0.4     setosa
## 17           5.4         3.9          1.3         0.4     setosa
## 18           5.1         3.5          1.4         0.3     setosa
## 19           5.7         3.8          1.7         0.3     setosa
## 20           5.1         3.8          1.5         0.3     setosa
## 21           5.4         3.4          1.7         0.2     setosa
## 22           5.1         3.7          1.5         0.4     setosa
## 23           4.6         3.6          1.0         0.2     setosa
## 24           5.1         3.3          1.7         0.5     setosa
## 25           4.8         3.4          1.9         0.2     setosa
## 26           5.0         3.0          1.6         0.2     setosa
## 27           5.0         3.4          1.6         0.4     setosa
## 28           5.2         3.5          1.5         0.2     setosa
## 29           5.2         3.4          1.4         0.2     setosa
## 30           4.7         3.2          1.6         0.2     setosa
## 31           4.8         3.1          1.6         0.2     setosa
## 32           5.4         3.4          1.5         0.4     setosa
## 33           5.2         4.1          1.5         0.1     setosa
## 34           5.5         4.2          1.4         0.2     setosa
## 35           4.9         3.1          1.5         0.2     setosa
## 36           5.0         3.2          1.2         0.2     setosa
## 37           5.5         3.5          1.3         0.2     setosa
## 38           4.9         3.6          1.4         0.1     setosa
## 39           4.4         3.0          1.3         0.2     setosa
## 40           5.1         3.4          1.5         0.2     setosa
## 41           5.0         3.5          1.3         0.3     setosa
## 42           4.5         2.3          1.3         0.3     setosa
## 43           4.4         3.2          1.3         0.2     setosa
## 44           5.0         3.5          1.6         0.6     setosa
## 45           5.1         3.8          1.9         0.4     setosa
## 46           4.8         3.0          1.4         0.3     setosa
## 47           5.1         3.8          1.6         0.2     setosa
## 48           4.6         3.2          1.4         0.2     setosa
## 49           5.3         3.7          1.5         0.2     setosa
## 50           5.0         3.3          1.4         0.2     setosa
## 51           7.0         3.2          4.7         1.4 versicolor
## 52           6.4         3.2          4.5         1.5 versicolor
## 53           6.9         3.1          4.9         1.5 versicolor
## 54           5.5         2.3          4.0         1.3 versicolor
## 55           6.5         2.8          4.6         1.5 versicolor
## 56           5.7         2.8          4.5         1.3 versicolor
## 57           6.3         3.3          4.7         1.6 versicolor
## 58           4.9         2.4          3.3         1.0 versicolor
## 59           6.6         2.9          4.6         1.3 versicolor
## 60           5.2         2.7          3.9         1.4 versicolor
## 61           5.0         2.0          3.5         1.0 versicolor
## 62           5.9         3.0          4.2         1.5 versicolor
## 63           6.0         2.2          4.0         1.0 versicolor
## 64           6.1         2.9          4.7         1.4 versicolor
## 65           5.6         2.9          3.6         1.3 versicolor
## 66           6.7         3.1          4.4         1.4 versicolor
## 67           5.6         3.0          4.5         1.5 versicolor
## 68           5.8         2.7          4.1         1.0 versicolor
## 69           6.2         2.2          4.5         1.5 versicolor
## 70           5.6         2.5          3.9         1.1 versicolor
## 71           5.9         3.2          4.8         1.8 versicolor
## 72           6.1         2.8          4.0         1.3 versicolor
## 73           6.3         2.5          4.9         1.5 versicolor
## 74           6.1         2.8          4.7         1.2 versicolor
## 75           6.4         2.9          4.3         1.3 versicolor
## 76           6.6         3.0          4.4         1.4 versicolor
## 77           6.8         2.8          4.8         1.4 versicolor
## 78           6.7         3.0          5.0         1.7 versicolor
## 79           6.0         2.9          4.5         1.5 versicolor
## 80           5.7         2.6          3.5         1.0 versicolor
## 81           5.5         2.4          3.8         1.1 versicolor
## 82           5.5         2.4          3.7         1.0 versicolor
## 83           5.8         2.7          3.9         1.2 versicolor
## 84           6.0         2.7          5.1         1.6 versicolor
## 85           5.4         3.0          4.5         1.5 versicolor
## 86           6.0         3.4          4.5         1.6 versicolor
## 87           6.7         3.1          4.7         1.5 versicolor
## 88           6.3         2.3          4.4         1.3 versicolor
## 89           5.6         3.0          4.1         1.3 versicolor
## 90           5.5         2.5          4.0         1.3 versicolor
## 91           5.5         2.6          4.4         1.2 versicolor
## 92           6.1         3.0          4.6         1.4 versicolor
## 93           5.8         2.6          4.0         1.2 versicolor
## 94           5.0         2.3          3.3         1.0 versicolor
## 95           5.6         2.7          4.2         1.3 versicolor
## 96           5.7         3.0          4.2         1.2 versicolor
## 97           5.7         2.9          4.2         1.3 versicolor
## 98           6.2         2.9          4.3         1.3 versicolor
## 99           5.1         2.5          3.0         1.1 versicolor
## 100          5.7         2.8          4.1         1.3 versicolor
## 101          6.3         3.3          6.0         2.5  virginica
## 102          5.8         2.7          5.1         1.9  virginica
## 103          7.1         3.0          5.9         2.1  virginica
## 104          6.3         2.9          5.6         1.8  virginica
## 105          6.5         3.0          5.8         2.2  virginica
## 106          7.6         3.0          6.6         2.1  virginica
## 107          4.9         2.5          4.5         1.7  virginica
## 108          7.3         2.9          6.3         1.8  virginica
## 109          6.7         2.5          5.8         1.8  virginica
## 110          7.2         3.6          6.1         2.5  virginica
## 111          6.5         3.2          5.1         2.0  virginica
## 112          6.4         2.7          5.3         1.9  virginica
## 113          6.8         3.0          5.5         2.1  virginica
## 114          5.7         2.5          5.0         2.0  virginica
## 115          5.8         2.8          5.1         2.4  virginica
## 116          6.4         3.2          5.3         2.3  virginica
## 117          6.5         3.0          5.5         1.8  virginica
## 118          7.7         3.8          6.7         2.2  virginica
## 119          7.7         2.6          6.9         2.3  virginica
## 120          6.0         2.2          5.0         1.5  virginica
## 121          6.9         3.2          5.7         2.3  virginica
## 122          5.6         2.8          4.9         2.0  virginica
## 123          7.7         2.8          6.7         2.0  virginica
## 124          6.3         2.7          4.9         1.8  virginica
## 125          6.7         3.3          5.7         2.1  virginica
## 126          7.2         3.2          6.0         1.8  virginica
## 127          6.2         2.8          4.8         1.8  virginica
## 128          6.1         3.0          4.9         1.8  virginica
## 129          6.4         2.8          5.6         2.1  virginica
## 130          7.2         3.0          5.8         1.6  virginica
## 131          7.4         2.8          6.1         1.9  virginica
## 132          7.9         3.8          6.4         2.0  virginica
## 133          6.4         2.8          5.6         2.2  virginica
## 134          6.3         2.8          5.1         1.5  virginica
## 135          6.1         2.6          5.6         1.4  virginica
## 136          7.7         3.0          6.1         2.3  virginica
## 137          6.3         3.4          5.6         2.4  virginica
## 138          6.4         3.1          5.5         1.8  virginica
## 139          6.0         3.0          4.8         1.8  virginica
## 140          6.9         3.1          5.4         2.1  virginica
## 141          6.7         3.1          5.6         2.4  virginica
## 142          6.9         3.1          5.1         2.3  virginica
## 143          5.8         2.7          5.1         1.9  virginica
## 144          6.8         3.2          5.9         2.3  virginica
## 145          6.7         3.3          5.7         2.5  virginica
## 146          6.7         3.0          5.2         2.3  virginica
## 147          6.3         2.5          5.0         1.9  virginica
## 148          6.5         3.0          5.2         2.0  virginica
## 149          6.2         3.4          5.4         2.3  virginica
## 150          5.9         3.0          5.1         1.8  virginica

mean(iris$Sepal.Length, na.rm = TRUE)

## [1] 5.843333

median(iris$Sepal.Width, na.rm = TRUE)

## [1] 3

sd(iris$Petal.Width, na.rm = TRUE)

## [1] 0.7622377

summary(iris)

##   Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
##  Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
##  1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
##  Median :5.800   Median :3.000   Median :4.350   Median :1.300  
##  Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
##  3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
##  Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
##        Species  
##  setosa    :50  
##  versicolor:50  
##  virginica :50  
##                 
##                 
##

Representa visualmente una variable numérica del conjunto de datos utilizando un histograma.

hist(iris[["Sepal.Length"]])

A la anterior data, realizar estudio descriptivo: Cálculo de medidas de tendenciacentral, posición, dispersión y forma. Distribuciones de frecuencias.

data <- 'https://raw.githubusercontent.com/fhernanb/datos/master/babies.txt'
dt <- read.table (data,header=TRUE, sep='\t')
summary(dt)

##       bwt          gestation        parity               age       
##  Min.   : 55.0   Min.   :148.0   Length:1236        Min.   :15.00  
##  1st Qu.:108.8   1st Qu.:272.0   Class :character   1st Qu.:23.00  
##  Median :120.0   Median :280.0   Mode  :character   Median :26.00  
##  Mean   :119.6   Mean   :279.3                      Mean   :27.26  
##  3rd Qu.:131.0   3rd Qu.:288.0                      3rd Qu.:31.00  
##  Max.   :176.0   Max.   :353.0                      Max.   :45.00  
##                  NA's   :13                         NA's   :2      
##      height          weight         smoke          
##  Min.   :53.00   Min.   : 87.0   Length:1236       
##  1st Qu.:62.00   1st Qu.:114.8   Class :character  
##  Median :64.00   Median :125.0   Mode  :character  
##  Mean   :64.05   Mean   :128.6                     
##  3rd Qu.:66.00   3rd Qu.:139.0                     
##  Max.   :72.00   Max.   :250.0                     
##  NA's   :22      NA's   :36

mean(dt[, c("bwt")])

## [1] 119.5769

mean(dt[, c("age")], na.rm = TRUE)

## [1] 27.25527

library(DescTools)
Mode(dt$parity, na.rm = TRUE)

## [1] "First born"
## attr(,"freq")
## [1] 921

quantile(dt$bwt, probs=c(0.25,0.40,0.90))

##    25%    40%    90% 
## 108.75 116.00 142.00

median(dt[, c("height")], na.rm = TRUE)

## [1] 64

sd(dt[, c("bwt")], na.rm = TRUE)

## [1] 18.23645

var(dt[, c("bwt")], na.rm = TRUE)

## [1] 332.5682

Cargar un conjunto de datos (de tu elección en formato .xls, .csv) y llevar a cabo las siguientes acciones: visualizar las primeras 6 observaciones, imprimir un resumen descriptivo e interpretarlo, y crear un diagrama de barras que compare dos variables.¿Qué métodos utilizas para calcular medidas de dispersión, como la varianza o la desviación estándar, y qué información proporcionan estas medidas?

library(readxl)
basededatos <- read_excel("C:/Users/Laura/Downloads/basededatos.xlsx")
View(basededatos)
datos <- basededatos
summary(basededatos)

##     nombre           ocupacion              edad            peso      
##  Length:13          Length:13          Min.   :20.00   Min.   :50.00  
##  Class :character   Class :character   1st Qu.:21.00   1st Qu.:54.00  
##  Mode  :character   Mode  :character   Median :25.00   Median :56.00  
##                                        Mean   :26.77   Mean   :56.46  
##                                        3rd Qu.:30.00   3rd Qu.:60.00  
##                                        Max.   :40.00   Max.   :62.00  
##      altura        # de hijos   
##  Min.   :1.540   Min.   :0.000  
##  1st Qu.:1.610   1st Qu.:0.000  
##  Median :1.630   Median :1.000  
##  Mean   :1.632   Mean   :1.462  
##  3rd Qu.:1.660   3rd Qu.:2.000  
##  Max.   :1.720   Max.   :4.000

head(basededatos)

## # A tibble: 6 × 6
##   nombre   ocupacion   edad  peso altura `# de hijos`
##   <chr>    <chr>      <dbl> <dbl>  <dbl>        <dbl>
## 1 santiago medico        25    52   1.62            2
## 2 pedro    profesor      21    55   1.54            1
## 3 julian   abogado       30    56   1.65            3
## 4 laura    ingeniero     35    60   1.62            2
## 5 cristian estudiante    38    62   1.63            1
## 6 mateo    medico        40    60   1.56            0

para la variable edad su promedio es de 27 años maximo 40, para el peso su promedio es de 57 maximo 62 , para la altura el promedio es 1.63 maximo 1.72 esto quiere decir que las personas entrevistadas esta en un promedio de 27 años con un peso de 57 una altura de 1,63 y con un hijo.

ggplot(basededatos, aes(x = edad, fill = altura)) +
  geom_bar(position = "dodge") +
  labs(title = "Comparación de Edad por altura",
       x = "altura",
       y = "Frecuencia")

## Warning: The following aesthetics were dropped during statistical transformation: fill.
## ℹ This can happen when ggplot fails to infer the correct grouping structure in
##   the data.
## ℹ Did you forget to specify a `group` aesthetic or to convert a numerical
##   variable into a factor?

varianza <- var(basededatos$peso)
print(varianza)

## [1] 13.10256

desviacion <- sd(basededatos$altura)
print(desviacion)

## [1] 0.05289079

La varianza mide cuánto se dispersan los valores de una variable alrededor de la media. Una varianza alta indica una mayor dispersión. La desviación estándar es simplemente la raíz cuadrada de la varianza y proporciona una medida de dispersión en la misma escala que los datos originales. Una desviación estándar alta indica una mayor variabilidad en los datos.

parcialRstudio

LAURA DANIELA LOPEZ

2024-05-03