INTRODUCCION A LA ESTADISTICA Y A R

La estadistica es la rama de las matematicas que se encarga de recopilar, organizar y procesar datos con el fin de deducir las caracteristicas de la poblacion objetivo.

La bioestadistica es la aplicacion de la estadistica al estudio de los procesos biologicos.

Tipos:

Estadistica descriptiva: se usa para conocer las caracteristicas, analizando datos y determinando conclusiones acerca de los comportamientos de los datos. Por lo general en forma de cuadros o figuras.
Inferencia estadistica: tecnica medianta la cual se obtienen conclusiones o generalizaciones acerca de parametros de una poblacion. Se entiende como la abstraccion cuantitativa de un fenomeno con el proposito de analizarlo y estimar sus comportamientos en tiempo y espacio.

Objetivo de la estadistica:

deducir o tomar decisiones acerca de una poblacion, basandose en la informacion contenida en una muestra.

Objetivo de la estadistica descriptiva:

describir las caracteristicas principales de los datos.

Objetivo de la Inferencia estadistica:

extraer conclusiones utiles sobre la totalidad de todas las observaciones posibles.

5 elementos fundamentales:

definir claramente la pregunta que se quiere responder acerca de la poblacion.
procedimiento de muestre o diseńo del experimento
recoleccion y analisis de datos
deducir acerca de la poblacion mediante una probabilidad.
confiabilidad de la inferencia.

Conceptos importantes:

poblacion: conjunto de todos los posibles elementos que son objeto de la investigacion. -tipos de poblacion: finita: tiene numero limitado de elementos, contable, se puede determinar y contar. Ejemplos: estudiantes matriculados, numero de peces contenidos en un experimento. infinita: numero ilimitado de elementos, no contable, no se puede establecer un limite. Ejemplo: numero de peces en un arrecife.
muestra: un conjunto de medidas y observaciones tomadas a partir de una poblacion. Es un subconjunto de la poblacion. Aleatoria -cuando usar muestras: poblacion infinita o muy grande, costoso, mucho tiempo, unidad de estudio se transforma o se destruye al ser examinada y resultados serian suficientemente precisos. -muestreo aleatorio sin reposicion: cuando se extrae elemento, este no es repuesto al total de la poblacion. -muestreo aleatorio con reposicion: el elemento puede ser extraido varias veces.

-tipos de muestreo:

muestreo sistematico: elementos seleccionados de manera ordenada. Se hace de acuerdo a criterios establecidos por el investigador.
muestreo aleatorio simple: se le asigna un numero a cada individuo y se eligen al azar hasta completar el tamaño de muestra.
muestreo estratificado: divide la poblacion en grupos (estratos). Por ejemplo: segun sexo, estado de madurez.
muestreo de conglomerados: tecnica de agrupamiento basada en las similitudes. Por ejemplo: la gente rica vive en una parte del barrio y la gente pobre en otra parte.

muestreo vs censo: muestreo= el estudio de una muestra representativa vs censo= el estudio completo de la poblacion.
independencia: una observacion en una muestra no esta relacionado con la de otra.

Organizacion de los datos:

Las variables deben de ser comparables entre si y que tengan alguna relacion para ser datos estadisticos. Ejemplo: peso, edad.

variables cualitativas: escala nominal y escala ordinal.

-variables cualitativas: no toman valores numericos y describen cualidades.

-variables cualitativas nominales: categorias mutuamente excluyentes. Ejemplos: color de flores: rojo, amarillo, azul. Clasificar una colonia de coral como viva o muerta. Tipo de sangre.

-variables cualitativas ordinales: son escalas de categorias, ordena los datos en relacion > < o =. Ejemplo: un paciente esta sin mejoria, mejorando, muy mejorado.

variables cuantitativas: escala de intervalos y de razones

-variables cuantitativas: cantidades numericas. ejemplo: DAP.

-Escala de intervalos: registra la distancia entre dos puntos. Ejemplos: años (2016-2017-2018), ubicacion en una carretera con respecto a otro punto.

-Escala de razones: las relaciones de los valores pueden calcularse. Ejemplo: longitud, peso.

-ambas escalas pueden tener variables:

-variable cuantitativa discreta: puede asumir solo ciertos valores numericos. Ejemplo: numero de crias por parto. Es un numero exacto (1,2,3,4).

-variables continuas: pueden asumir cualquier valor. Ejemplos: edad, altura, peso. Numero con decimales.

VECTORES

vector1 <-c(1,2,3,4,5)
vector1

## [1] 1 2 3 4 5

vector2 <-c(6,7,8,9,10)
vector2

## [1]  6  7  8  9 10

numeros10al20 <- 10:20
numeros10al20

##  [1] 10 11 12 13 14 15 16 17 18 19 20

numerosdescendiente10al2<- 10:2
numerosdescendiente10al2

## [1] 10  9  8  7  6  5  4  3  2

VECTORES Y MATRICES

matrices: un vector con un atributo denominado dimensión: reglones y columnas.

a <- array(c(1,2,3,4,5,6,7,8,9,10,11,12),dim=c(3,4)) #dim significa dimensionar
a

##      [,1] [,2] [,3] [,4]
## [1,]    1    4    7   10
## [2,]    2    5    8   11
## [3,]    3    6    9   12

b <- array(c(1,2,3,4,5,6,7,8,9,10,11,12),dim=c(3,8))
b

##      [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
## [1,]    1    4    7   10    1    4    7   10
## [2,]    2    5    8   11    2    5    8   11
## [3,]    3    6    9   12    3    6    9   12

m2 <- matrix(c(56,24,34,55,12,42,51,65,23,64),2,5)
m2

##      [,1] [,2] [,3] [,4] [,5]
## [1,]   56   34   12   51   23
## [2,]   24   55   42   65   64

grupoA <- c(0.360, 0.160, 0.334, 0.146, 0.058, 0.044, 0.542)

grupoB <- c(3.66, 3.36, 3.26, 2.60, 2.15, 1.86, 0.435)

m5 <- data.frame(grupoA, grupoB)
m5

##   grupoA grupoB
## 1  0.360  3.660
## 2  0.160  3.360
## 3  0.334  3.260
## 4  0.146  2.600
## 5  0.058  2.150
## 6  0.044  1.860
## 7  0.542  0.435

PATRONES SIMPLE PARA VECTORES

1:10

##  [1]  1  2  3  4  5  6  7  8  9 10

seq(10,by=4,length=15)

##  [1] 10 14 18 22 26 30 34 38 42 46 50 54 58 62 66

REPETIR PATRANOS USANDO REP()

permite crear secuencias

rep(4,9)

## [1] 4 4 4 4 4 4 4 4 4

##FUNCION CONCATENAR

c(0, 3, 6, 7, 9, 12)

## [1]  0  3  6  7  9 12

x<- c(0, 3, 6, 7, 9, 12)
x

## [1]  0  3  6  7  9 12

w<- c(10, 13, 26, 37, 39, 42 ) # ahora w es un vector de 6 elementos
w

## [1] 10 13 26 37 39 42

plot(x,w) #genera un scatterplot

EDICION GRAFICA

set.seed(2016)
datos<-rnorm(100,25,8)
plot(datos, main="Plot")

plot(datos, main="Plot", col="yellow4", col.main="red", col.lab="salmon")

plot(datos, main="Plot", col="yellow4", col.main="red", col.lab="salmon", pch=7)

Introduccion a la estadistica

Chesy Ulloa

9/7/2019