Entregas al profe, entregar pagina web o phyton o matlab
#R script, para escribir codigo
#Consola, es para las salidas
#R studio, tiene un entorno donde me ahorro la escritura de codigo
#Incertidumbre, william briggs: lo hacemos mal: anova, p valor... capitulo 9. 9.7 Ronald Ficsher, creador del umbral donde el valor 0.05 fue puesto
#deberia eliminarse el rechazo de hipotesis
#No debería decirse "diferencia significativa"
#R studio y posit
#creemos un vector
pH <- c (5.4, 6.3, 6.3, 5.2, 4.7, 6.0, 7.2, 6.8, 6.1, 4.3, 4.6, 5.5)
length (pH) #pregunte por la cantidad de datos y abajo me imprime o en la consola tmbn
## [1] 12
boxplot(pH, col = "blue", horizontal = T, main = "distribucion pH") #cambiar color, ponerlo horizontal y nombre
media = mean(pH) #le voy a calcular la media
boxplot(pH, col = "blue", horizontal = T, main = "distribucion pH")
points(x = media, y = 1, col = "green", pch = 18, cex = 2) #se coloco un punto que muestra la media, puso en y=1 que significa en el valor y de 1 que es donde está la tabla, cex, tamaño de punto
pH2 <- c (5.4, 6.3, 6.3, 5.2, 2.4, 6.0, 7.2, 6.8, 6.1, 4.3, 4.6, 5.5) #cambie un solo dato, puse el 3.0
length (pH2)
## [1] 12
media = mean(pH2)
boxplot(pH2, col = "blue", horizontal = T, main = "distribucion pH2")
points(x = media, y = 1, col = "green", pch = 18, cex = 2)
par(mfrow = c(1,2)) #poner dos graficas juntas?
boxplot(pH, col = "blue", horizontal = T, main = "distribucion pH")
points(x = media, y = 1, col = "green", pch = 18, cex = 2)
boxplot(pH2, col = "blue", horizontal = T, main = "distribucion pH2")
points(x = media, y = 1, col = "green", pch = 18, cex = 2)
par(mfrow = c(1,2)) #poner dos graficas juntas?
hist(pH)
hist(pH2)
#solo se puede juzgar un atipito si tengo distribucion normal, si no es normal, no puedo decir que sea atipico
#al no tener distribucion normal al verlo en un histograma, no podria decir que tiene distribucion normal
#curva de la bañera rbeta
set.seed(123)
datosclase = rbeta(n = 100, shape1 = 0.5, shape2 = 0.5)
head(datosclase, 5)
## [1] 0.859887668 0.676206530 0.003991051 0.443966073 0.398207168
tail(datosclase, 5)
## [1] 0.4071619 0.9588012 0.8295986 0.8929247 0.3201373
hist(datosclase)
abline(v = mean(datosclase), col = "green", lwd = 2, lty = 2) #generar linea de los datos que genere en la media ##lty es tipo de linea, ### lwd es el grosor?
#si lo pongo en boxplot, no se ve la curva de la bañera, puede darme una mala imagen de mis datos
boxplot(datosclase, horizontal = T)
# Ahora aca vamos a crear una funcion exponencial
datosclase2 = rexp(n = 200, rate = 1.3)
hist(datosclase2)
boxplot(datosclase2)
#los puntos que se salen de las cajas, no se puede decir que son atipicos, aca la distribucion nos dice que los datos no tienen distribucion normal
#Verdades contigentes: verdades condicionadas
library(ggplot2) #llamar la libreria
#para hacer graficos mas bonitos podemos usar ggplot2
#a veces vende mas el grafico que el cuento, hacer buenos graficos es muy buena entrada
#ggplot2
dfdedatos = data.frame(datosclase2) #data.frame es una tabla
ggplot(dfdedatos, aes(x = datosclase2))+ #aca ya o tengo que poner el 2 en ggplot ##aes es estetica del grafico y en parentesis digo que quiero que mis datos esten en el eje x
geom_boxplot(color = "darkblue", fill = "lightblue")+
theme_bw() #puedo probar temas como dark o classic, para deplegar opciones, con tabular te sale la lista de temas
#Aca uso ggplot2 para generar un histograma
ggplot(dfdedatos, aes(x = datosclase2))+
geom_histogram(color = "darkblue", fill = "lightblue")+
theme_bw()
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
#diagramas de violin
ggplot(dfdedatos, aes(x = 1 , y = datosclase2))+
geom_violin(color = "darkblue", fill = "lightblue")+
theme_bw()
#grafico de densidad
ggplot(dfdedatos, aes(x = datosclase2))+
geom_density(color = "violet", fill = "lightblue")+
theme_bw()
set.seed(2024)
pH3 = rnorm(n = 200, mean = 5.5, sd = 0.75) #r indica que los numeros se generan al azar y luego sigue norm
trt = gl(n = 2, k = 100, length = 200, labels = c("T1", "T2")) #gl es generador de niveles, n es numero de trt, k es numero de datos, ya que son 200 datos y 2 trt, entonces k es 100 datos para cada trt
df3 = data.frame(pH3, trt)
View(df3) #ver mi data frame o tabla de datos
#Libreria para estadistica PSYCH de psicometria
library(psych)
##
## Attaching package: 'psych'
## The following objects are masked from 'package:ggplot2':
##
## %+%, alpha
#tengo 2 trt de pH, quiero ver estadisticas por trt de 100 datos, no por todos los 200 datos
describeBy(x = df3$pH3, group = df3$trt) #tengo que decirle de donde salen los datos, luego las columnas y la agrupacion
##
## Descriptive statistics by group
## group: T1
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 100 5.44 0.77 5.49 5.47 0.77 3.04 6.98 3.94 -0.44 -0.15 0.08
## ------------------------------------------------------------
## group: T2
## vars n mean sd median trimmed mad min max range skew kurtosis se
## X1 1 100 5.6 0.77 5.6 5.59 0.83 3.29 7.3 4.01 -0.03 -0.14 0.08
#En los datos anteriores, me generan datos como error estandar, pero ojo con lo que es
#SE
#¿Considera ud que lo hético se hereda? si y no ## cluster 1: ortografia mala: esta mal todo lo diferente a lo que él conoce; cluster2: si lo escribe el profe debe ser por que está bien; cluster 3: profe, que es hético con h? esta relacionado con salud y tuberculosis.
#debe usarse lenguaje sencillo en encuestas, ser claro
#var categorica, nominal, otras...
#Coeficiente de variacion es sd/ promedio x 100
#objetivo, la palabra dice determinar, pero no sabemos que significa
#area vs superficie en los cuadros de chirimoya
#Leerse el como preparar el Resumen (mini articulo se supone), capitulo 6 a conclusiones
#Escalas de medida
#1 Escala nominal, variables cualitativas, solo nombres, no se puede restar papa pastusa de papa suprema, otros son marca, hibrido, tratamiento, se usa mucho en encuestaS en temas sociales
#2 Escala ordinal: son nombres ordenados, como la escala Likert o ordinal (origen racista): parcialmente de acuerdo, o en desacuerdo, indiferente, totalmente en desacuerdo. Las distancias no son iguales entre los ordenes: Totalmente desacuerdo, parcialmente D, indiferente, parcialmente Acuerdo, Totalmente A. libro de J. D. Hobson o jhonson
#3 y 4: Escala de intervalo y escala de razon. Las dos admiten que se saquen diferencias, pero solo una permite sacar cocientes
#intervalo: cuantitativas, No Cocientes, se le puede sacar distancia
#razon: cuantitativas, cocientes (no de razonamiento)
#Elevación, pH,
T1_c = 25 #celsius
T2_c = 50
T1_k = 273+T1_c #kelvin
T2_k = 273+T2_c #kelvin
#Las dos temperaturas admiten diferencias, ambas toleran intervalos
T2_c - T1_c
## [1] 25
T2_k - T1_k
## [1] 25
T2_c / T1_c
## [1] 2
T2_k / T1_k
## [1] 1.083893
# se doblo la temperatura?
#una temperatura, la celsius se aumentó el doble, de 25 a 50, pero al verlo en kelvin, no hubo un aumento de doble, porque el celsius me dice la dinámica de temperatura, no se tiene una referencia clara, similar a la altura sobre el nivel del mar, o el pH tmbn porque es un logaritmo donde un 0 se impuso por una ecuación
#la kelvin tolera cocientes, la otra no,
#un coeficiente de variacion, depende de la escala.
#si el 0 es real, tolera cocientes: altura 0 de una planta, o el ingreso de salario en 0 en una cuenta bancaria
#movimiento por subjetividad, al ver el movimiento de por medio de los ojos, depende de la capacidad de ver
#ley de Feshner, juzgar temas segun la percepcion, escala de severidad al ojo, ahora es por tecnologia