La estadistica es la rama de las matematicas que se encarga de recopilar, organizar y procesar datos con el fin de deducir las caracteristicas de la poblacion objetivo.
La bioestadistica es la aplicacion de la estadistica al estudio de los procesos biologicos.
Estadistica descriptiva: se usa para conocer las caracteristicas, analizando datos y determinando conclusiones acerca de los comportamientos de los datos. Por lo general en forma de cuadros o figuras.
Inferencia estadistica: tecnica medianta la cual se obtienen conclusiones o generalizaciones acerca de parametros de una poblacion. Se entiende como la abstraccion cuantitativa de un fenomeno con el proposito de analizarlo y estimar sus comportamientos en tiempo y espacio.
deducir o tomar decisiones acerca de una poblacion, basandose en la informacion contenida en una muestra.
describir las caracteristicas principales de los datos.
extraer conclusiones utiles sobre la totalidad de todas las observaciones posibles.
definir claramente la pregunta que se quiere responder acerca de la poblacion.
procedimiento de muestre o diseńo del experimento
recoleccion y analisis de datos
deducir acerca de la poblacion mediante una probabilidad.
confiabilidad de la inferencia.
poblacion: conjunto de todos los posibles elementos que son objeto de la investigacion. -tipos de poblacion: finita: tiene numero limitado de elementos, contable, se puede determinar y contar. Ejemplos: estudiantes matriculados, numero de peces contenidos en un experimento. infinita: numero ilimitado de elementos, no contable, no se puede establecer un limite. Ejemplo: numero de peces en un arrecife.
muestra: un conjunto de medidas y observaciones tomadas a partir de una poblacion. Es un subconjunto de la poblacion. Aleatoria -cuando usar muestras: poblacion infinita o muy grande, costoso, mucho tiempo, unidad de estudio se transforma o se destruye al ser examinada y resultados serian suficientemente precisos. -muestreo aleatorio sin reposicion: cuando se extrae elemento, este no es repuesto al total de la poblacion. -muestreo aleatorio con reposicion: el elemento puede ser extraido varias veces.
-tipos de muestreo:
muestreo sistematico: elementos seleccionados de manera ordenada. Se hace de acuerdo a criterios establecidos por el investigador.
muestreo aleatorio simple: se le asigna un numero a cada individuo y se eligen al azar hasta completar el tamaño de muestra.
muestreo estratificado: divide la poblacion en grupos (estratos). Por ejemplo: segun sexo, estado de madurez.
muestreo de conglomerados: tecnica de agrupamiento basada en las similitudes. Por ejemplo: la gente rica vive en una parte del barrio y la gente pobre en otra parte.
muestreo vs censo: muestreo= el estudio de una muestra representativa vs censo= el estudio completo de la poblacion.
independencia: una observacion en una muestra no esta relacionado con la de otra.
Las variables deben de ser comparables entre si y que tengan alguna relacion para ser datos estadisticos. Ejemplo: peso, edad.
-variables cualitativas: no toman valores numericos y describen cualidades.
-variables cualitativas nominales: categorias mutuamente excluyentes. Ejemplos: color de flores: rojo, amarillo, azul. Clasificar una colonia de coral como viva o muerta. Tipo de sangre.
-variables cualitativas ordinales: son escalas de categorias, ordena los datos en relacion > < o =. Ejemplo: un paciente esta sin mejoria, mejorando, muy mejorado.
-variables cuantitativas: cantidades numericas. ejemplo: DAP.
-Escala de intervalos: registra la distancia entre dos puntos. Ejemplos: años (2016-2017-2018), ubicacion en una carretera con respecto a otro punto.
-Escala de razones: las relaciones de los valores pueden calcularse. Ejemplo: longitud, peso.
-ambas escalas pueden tener variables:
-variable cuantitativa discreta: puede asumir solo ciertos valores numericos. Ejemplo: numero de crias por parto. Es un numero exacto (1,2,3,4).
-variables continuas: pueden asumir cualquier valor. Ejemplos: edad, altura, peso. Numero con decimales.
vector1 <-c(1,2,3,4,5)
vector1
## [1] 1 2 3 4 5
vector2 <-c(6,7,8,9,10)
vector2
## [1] 6 7 8 9 10
numeros10al20 <- 10:20
numeros10al20
## [1] 10 11 12 13 14 15 16 17 18 19 20
numerosdescendiente10al2<- 10:2
numerosdescendiente10al2
## [1] 10 9 8 7 6 5 4 3 2
matrices: un vector con un atributo denominado dimensión: reglones y columnas.
a <- array(c(1,2,3,4,5,6,7,8,9,10,11,12),dim=c(3,4)) #dim significa dimensionar
a
## [,1] [,2] [,3] [,4]
## [1,] 1 4 7 10
## [2,] 2 5 8 11
## [3,] 3 6 9 12
b <- array(c(1,2,3,4,5,6,7,8,9,10,11,12),dim=c(3,8))
b
## [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
## [1,] 1 4 7 10 1 4 7 10
## [2,] 2 5 8 11 2 5 8 11
## [3,] 3 6 9 12 3 6 9 12
m2 <- matrix(c(56,24,34,55,12,42,51,65,23,64),2,5)
m2
## [,1] [,2] [,3] [,4] [,5]
## [1,] 56 34 12 51 23
## [2,] 24 55 42 65 64
grupoA <- c(0.360, 0.160, 0.334, 0.146, 0.058, 0.044, 0.542)
grupoB <- c(3.66, 3.36, 3.26, 2.60, 2.15, 1.86, 0.435)
m5 <- data.frame(grupoA, grupoB)
m5
## grupoA grupoB
## 1 0.360 3.660
## 2 0.160 3.360
## 3 0.334 3.260
## 4 0.146 2.600
## 5 0.058 2.150
## 6 0.044 1.860
## 7 0.542 0.435
1:10
## [1] 1 2 3 4 5 6 7 8 9 10
seq(10,by=4,length=15)
## [1] 10 14 18 22 26 30 34 38 42 46 50 54 58 62 66
permite crear secuencias
rep(4,9)
## [1] 4 4 4 4 4 4 4 4 4
##FUNCION CONCATENAR
c(0, 3, 6, 7, 9, 12)
## [1] 0 3 6 7 9 12
x<- c(0, 3, 6, 7, 9, 12)
x
## [1] 0 3 6 7 9 12
w<- c(10, 13, 26, 37, 39, 42 ) # ahora w es un vector de 6 elementos
w
## [1] 10 13 26 37 39 42
plot(x,w) #genera un scatterplot
set.seed(2016)
datos<-rnorm(100,25,8)
plot(datos, main="Plot")
plot(datos, main="Plot", col="yellow4", col.main="red", col.lab="salmon")
plot(datos, main="Plot", col="yellow4", col.main="red", col.lab="salmon", pch=7)