Estadística Inferencial

true
2024-01-29

{r setup, include=FALSE} knitr::opts_chunk$set(echo = TRUE,warning = FALSE,message = FALSE,out.width=“100%”)

Introducción a R-Studio

Es un entorno de desarrollo integrado para el lenguaje de programación R, dedicado a la computación estadística y gráficos.

R-STUDIO

Creación de Objetos

R es un lenguaje orientado a objetos. Los objetos pueden ser usados para guardar valores y pueden madificarse mediante funciones como por ejemplo sumar dos objetos o calcular la media.

X <- 4
Y <- 2

R como calculadora

Puedes usar el programa R como una calculadora, basta con conocer cuáles son los signos y comandos a utilizar para realizar las operaciones. Copia los comandos en tu script de R y ejecútalos para ver los resultados.

#suma
Z <- X +Y
Z
[1] 6
#multiplicación
2*2
[1] 4
#división
2/2
[1] 1
#potencia
4^2
[1] 16
#raíz cuadrada
sqrt(16)
[1] 4

Abrir una Base de R-STUDIO y Resumir

Cargar paquetes

Lo primero que tenemos que hacer es cargar los paquetes que vamos a utilizar para el análisis. En este caso vamos a usar:

library(tidyverse)# Incluye paquetes de importación, visualización entre otros
library(dplyr)# Manipulación de Datos
library(ggplot2)# Visualización de datos 
library(readxl)# Importación de datos
require(tibble)# Tablas

(Recordar que si no ha instalado estos paquetes debe correr primero el comando: install.packages(“nombre del paquete”))

Cargar base incorporada en R-Studio

R ya incorpora una serie de bases de datos que te pueden resultar de utilidad para empezar a explorar las posibilidades de análisis estadístico que te ofrece este programa.

Como ejemplo vamos a explorara la base de datos llamada “cars”.

# Cargar la base
data(cars)
# Visualizar los encabezados
#head(cars)
# Resumir con algunas estadísticas las variables de la base 
summary(cars)
     speed           dist       
 Min.   : 4.0   Min.   :  2.00  
 1st Qu.:12.0   1st Qu.: 26.00  
 Median :15.0   Median : 36.00  
 Mean   :15.4   Mean   : 42.98  
 3rd Qu.:19.0   3rd Qu.: 56.00  
 Max.   :25.0   Max.   :120.00  

Incluir gráficas

Puedes agregar fácilmente gráficos a tu análisis. Por ejemplo:

data(pressure)
head(pressure)
  temperature pressure
1           0   0.0002
2          20   0.0012
3          40   0.0060
4          60   0.0300
5          80   0.0900
6         100   0.2700
hist(pressure$temperature)
boxplot(pressure$temperature)

Construcción de una base de datos

A continuación se construirá la primera base de datos a partir de tres variables. Para esto, como se observa en los siguientes comandos, se parte por la construcción de tres variables de 9 casos cada una:

Sexo. Variable nominal con valores 1 y 2, que representan las categorías de respuesta “hombre” y “mujer”.

Edad. Variable continua con valores en años.

Nivel de estrés laboral. Variable ordinal medida en una escala del 1 al 5, donde 1 representa un bajo nivel de estrés y 5 representa un alto nivel de estrés.

#Creación de las variables: todas tienen la misma cantidad de casos.

Sexo <- c(1,1,2,1,2,2,2,1,2)

Edad <- c(23,35,37,38,42,33,34,40,56)

Estres <- c(1,1,3,2,4,1,5,3,2)
datos=data.frame(Sexo,Edad, Estres)
datos
  Sexo Edad Estres
1    1   23      1
2    1   35      1
3    2   37      3
4    1   38      2
5    2   42      4
6    2   33      1
7    2   34      5
8    1   40      3
9    2   56      2

A partir de las variables ya creadas se puede construir una base de datos.

Análisis Exploratorio de Datos

Ver video

https://www.youtube.com/watch?v=UeMpYEktLfU&ab_channel=Comunicaci%C3%B3nNum%C3%A9rica

El análisis exploratorio de datos (EDA por sus siglas en inglés) implica el uso de gráficos y visualizaciones para explorar y analizar un conjunto de datos. El objetivo es explorar, investigar y aprender, no confirmar hipótesis estadísticas.

¿Cuándo debo utilizarlo?

El análisis exploratorio de datos es una potente herramienta para explorar un conjunto de datos. Incluso cuando su objetivo es efectuar análisis planificados, el EDA puede utilizarse para limpiar datos, para análisis de subgrupos o simplemente para comprender mejor los datos. Un paso inicial importante en cualquier análisis de datos es representar los datos gráficamente.

No gráfico: Calcula estadísticas descriptivas de las variables

Gráfico: Calcula estadísticas de forma gráfica

Univariado: Analiza una sola variable a la vez

Multivariado: Analiza dos o más variables

A su vez, cada uno de esas dividisiones puede subdividirse según los tipos de datos con los que trabajemos: cateógicos o numéricos.

Situación Problema.

Exploración de la Intersección entre la Psicología y la Ciencia de Datos: Comportamiento Humano en Entornos Digitales

En un centro de investigación psicológica enfocado en el comportamiento humano en entornos digitales como redes sociales y plataformas de juegos en línea. Recopilamos datos que incluyen variables demográficas, patrones de uso de redes sociales, datos de juegos en línea y mediciones psicológicas. Utilizamos herramientas de ciencia de datos y análisis estadístico para identificar patrones significativos que ayuden a comprender cómo diferentes factores influyen en el comportamiento en línea y el bienestar psicológico. Este enfoque integrado entre la psicología y la ciencia de datos nos permite desarrollar intervenciones efectivas para mejorar la calidad de vida en línea y promover la salud mental de los usuarios.