Definiciones de estadística
Según su acepción más común, es una colección de datos numéricos ordenados y clasificados según un determinado criterio.
Es la ciencia que, utilizando como instrumento las matemáticas y el cálculo de probabilidades, estudia las leyes de comportamiento de aquellos fenómenos que no están sometidos a las leyes físicas y basándose en ellas predice e infiere resultados.
Técnica o métodos científico usado para recolectar, organizar, resumir, presentar, analizar, interpretar, generalizar y contrastar los resultados de las observaciones de los fenómenos reales.
Permite presentar y describir la información en forma adecuada
Inferir conclusiones sobre poblaciones grandes basándose solamente en la información obtenida de subconjuntos de ellas
Utilizar modelos para obtener pronósticos confiables
En RStudio podrás realizar una gran variedad de graficos según tu necesidad.
Aquí un link para que ver más opciones de graficos https://r-graph-gallery.com/
Población: es el conjunto total de objetos que son de interés para un problema dado. Personas, animales, producto fabricado, plantas…
Muestra: es un subconjunto de la población
Variable: cantidad que puede asumir cualquiera de un conjunto de valores
Datos u observaciones: son números o denominaciones que podemos asignara un individuo o elemento de la población
Parámetro: es cualquier característica medible de una población
Estadístico: es cualquier característica medible de una muestra
Censo: es la enumeración completa de la población
Se crea cuando se utilizan nombres para establecer categorías con la condición que cada dato pertenezca exclusivamente a una de ellas (no hay orden ni jerarquía). Juan, Andrés, Camila, Andrea…marcas de algún producto
Se colocan medidas en categorías, cada una de las cuales indica un nivel distinto respecto a un atributo qu se está midiendo. Profesional, especialista, magister, doctor
Los de escala ordinal a los que se les puede clasificar las distancias son de intervalo (no siempre hay un cero que indique ausencia de la medida). Puntajes de pruebas de inteligencia, temperatura Celsius, fechas
Aquellos datos de intervalo con un cero que significa “ninguno” se les llaman datos de razón. En esta escala si se puede medir cuantas veces en mayor una medida a otra…dinero, masa.
Pueden ser:
Cualitativas: Nominales y Orninales
Cuantitativas: Discretas y Continuas
El R actual es el resultado de un esfuerzo de colaboración con contribuciones de todo el mundo. R fue escrito inicialmente por Robert Gentleman y Ross Ihaka, también conocido como ” R & R ” del Departamento de Estadística de la Universidad de Auckland. Desde mediados de 1997 ha habido un grupo central, el R Core Team , con acceso de escritura a la fuente R.
En el siguiente link puedes conseguir más nombres de otros colaboradores
install.packages(“datasets”)
install.packages(“ggplot2”)
library(datasets)
library(ggplot2)
data(mtcars)
ggplot(mtcars, aes(x=as.factor(cyl) )) + geom_bar(color=“blue”, fill=rgb(0.1,0.4,0.5,0.7) )+theme_minimal()
library(ggplot2)
library(viridis)
library(hrbrthemes)
-create a dataset specie <- c(rep(“sorgho” , 3) , rep(“poacee” , 3), rep(“banana” , 3) , rep(“triticum” , 3) ) condition <- rep(c(“normal” , “stress” , “Nitrogen”) , 4)
value <- abs(rnorm(12 , 0 , 15))
data <- data.frame(specie,condition,value)
-Small multiple
ggplot(data, aes(fill=condition, y=value, x=specie)) + geom_bar(position=“stack”, stat=“identity”) + scale_fill_viridis(discrete = T) + ggtitle(“Studying 4 species..”) + theme_ipsum() + xlab(““)
Cristian Guzmán Soto
Docente catedrático
Universidad del Magdalena
Agradeciemientos
A Lic. Martín Morales