Inicio

Column

GENERALIDADES DE LA ESTADÍSTICA

Definiciones de estadística

  1. Según su acepción más común, es una colección de datos numéricos ordenados y clasificados según un determinado criterio.

  2. Es la ciencia que, utilizando como instrumento las matemáticas y el cálculo de probabilidades, estudia las leyes de comportamiento de aquellos fenómenos que no están sometidos a las leyes físicas y basándose en ellas predice e infiere resultados.

  3. Técnica o métodos científico usado para recolectar, organizar, resumir, presentar, analizar, interpretar, generalizar y contrastar los resultados de las observaciones de los fenómenos reales.

Activa los subtitulos

Alcances

Column

Por qué conocer estadística

Permite presentar y describir la información en forma adecuada

Inferir conclusiones sobre poblaciones grandes basándose solamente en la información obtenida de subconjuntos de ellas

Utilizar modelos para obtener pronósticos confiables

Gráficos que puedo hacer

En RStudio podrás realizar una gran variedad de graficos según tu necesidad.

Aquí un link para que ver más opciones de graficos https://r-graph-gallery.com/

Un poco más

Column

Términos comunes de la estadística

Población: es el conjunto total de objetos que son de interés para un problema dado. Personas, animales, producto fabricado, plantas…

Muestra: es un subconjunto de la población

Variable: cantidad que puede asumir cualquiera de un conjunto de valores

Datos u observaciones: son números o denominaciones que podemos asignara un individuo o elemento de la población

Parámetro: es cualquier característica medible de una población

Estadístico: es cualquier característica medible de una muestra

Censo: es la enumeración completa de la población

Tipos de datos

Column

Datos nominales

Se crea cuando se utilizan nombres para establecer categorías con la condición que cada dato pertenezca exclusivamente a una de ellas (no hay orden ni jerarquía). Juan, Andrés, Camila, Andrea…marcas de algún producto

Datos ordinales

Se colocan medidas en categorías, cada una de las cuales indica un nivel distinto respecto a un atributo qu se está midiendo. Profesional, especialista, magister, doctor

Datos de intervalos

Los de escala ordinal a los que se les puede clasificar las distancias son de intervalo (no siempre hay un cero que indique ausencia de la medida). Puntajes de pruebas de inteligencia, temperatura Celsius, fechas

Datos de razón

Aquellos datos de intervalo con un cero que significa “ninguno” se les llaman datos de razón. En esta escala si se puede medir cuantas veces en mayor una medida a otra…dinero, masa.

Column

Las variables

Pueden ser:

Cualitativas: Nominales y Orninales

Cuantitativas: Discretas y Continuas

R y RStudio Software

Column

Algo de historia

El R actual es el resultado de un esfuerzo de colaboración con contribuciones de todo el mundo. R fue escrito inicialmente por Robert Gentleman y Ross Ihaka, también conocido como ” R & R ” del Departamento de Estadística de la Universidad de Auckland. Desde mediados de 1997 ha habido un grupo central, el R Core Team , con acceso de escritura a la fuente R.

En el siguiente link puedes conseguir más nombres de otros colaboradores

(https://www.r-project.org/contributors.html)

Column

Descarga de R y Rstudio

Práctica

Column

Gráfico de una variable

Gráfico de una variable en varios grupos

Column

Código para elaborar gráfico de una variable

install.packages(“datasets”)

install.packages(“ggplot2”)

library(datasets)

library(ggplot2)

data(mtcars)

ggplot(mtcars, aes(x=as.factor(cyl) )) + geom_bar(color=“blue”, fill=rgb(0.1,0.4,0.5,0.7) )+theme_minimal()

Código para elaborar gráfico de una variable en varios grupos

library(ggplot2)

library(viridis)

library(hrbrthemes)

-create a dataset specie <- c(rep(“sorgho” , 3) , rep(“poacee” , 3), rep(“banana” , 3) , rep(“triticum” , 3) ) condition <- rep(c(“normal” , “stress” , “Nitrogen”) , 4)

value <- abs(rnorm(12 , 0 , 15))

data <- data.frame(specie,condition,value)

-Small multiple

ggplot(data, aes(fill=condition, y=value, x=specie)) + geom_bar(position=“stack”, stat=“identity”) + scale_fill_viridis(discrete = T) + ggtitle(“Studying 4 species..”) + theme_ipsum() + xlab(““)

RStudio y Mapas

Column

Mapas y georeferencias

Mapa en mosaico

Column

COVID19 y Mapas en RStudio

En construcción

Column

Autor

Cristian Guzmán Soto

Docente catedrático

Universidad del Magdalena

Agradeciemientos

A Lic. Martín Morales