Intervalo de confianza paramétrico asimétrico

Ejemplo

Cuando los datos son asimétricos (con sesgo positivo) un histograma de los logaritmos de los datos originales tiene forma simétrica. Como ejemplo recuerde los datos del arsenico:

a <- c(1.3, 8, 1.5, 9.5, 100, 580, 110, 1.8, 2.6, 2.8, 3.5, 12, 14, 19, 23,120, 190, 240, 250, 4.0, 41, 300, 4.8, 80, 340)
hist(a, col = "grey")

Si se calcula el logaritmo natural de los datos y se realiza la prueba de shapiro puede verse que al 90% de confianza los logaritmos son normales.

#log() calcula el logaritmo natural de un número.
y=log(a)
y
shapiro.test(y)

En estas situaciones puede construirse un intervalo de confianza para la mediana de la siguiente manera:

En R, el intervalo se puede calcular asi:

a <- c(1.3,8,1.5,9.5,100,580,110,1.8, 2.6, 2.8, 3.5,12, 14, 19, 23,120, 190, 240, 250,4.0,41,300,4.8,80,340)

# transformar a logaritmo
y=log(a)

#media de los logaritmos
em <- mean(y)
em
# desviación estándar de los logaritmos
es <- sd(y)
es
#valor de la distribución t al 95%, recuerde que el tamaño de muestra es 25 y en la formula dice n-1
et <- abs(qt(.025,24))
et
#Finalmente los límites de los intervalos
eli <- exp(em-et*sqrt(es^2/25))
els <- exp(em+et*sqrt(es^2/25))
eli
els

Finalmente podremos decir que la concentración mediana de arsénico se encuentra entre 10.63 ppb y 53.6 ppb.

TAREA

EJERCICIO The following 43 values are annual 7-day minimum flows for 1941-1983 on the Little Mahoning Creek at McCormick, PA.

flujos <- c(0.69,2.90,4.40,0.80,3.00,4.80,9.70, 9.80,1.30,3.10,4.90,10.00,1.40,3.30,5.70,11.00,1.50, 1.50, 1.80, 1.80, 2.10, 2.50,3.70 ,3.80, 3.80, 4.00, 4.10, 4.20,5.80, 5.90, 6.00, 6.10, 7.90, 8.00,11.00 ,12.00, 13.00, 16.00, 20.00, 23.00,2.8,4.2,8)

#Ordenar los Datos
f <- sort(flujos)

Construya un histograma de los datos originales, ¿Qué forma tienen?

Construya un histograma de los logaritmos de los datos originales,¿qué forma tienen?
Realice la prueba de shapiro para los logaritmos de los datos.¿A qué conclusión llega?
Construya el intervalo de confianza para mediana usando la fórmula vista en esta sesión. Interprételo.

Histograma

hist(f, col = "#E3F6CE", main = "Flujos", xlab = "Flujos")

Los datos al igual que en el ejemplo son asimétricos y presentan un sesgo positivo.

Histograma de los logaritmos de los datos originales

log <- log(f)
hist(log, col = "#F6E3CE", main = "Logaritmo de Flujos", xlab = "Flujos")

En este histograma los datos no mustran el sesgo positivo como en el caso anterior, estos datos siguen una forma mas cercana a la de una campana, puesto que, el logaritmo trata de hacer a los datos normales

Prueba de Shapiro-Wilk

shapiro.test(log)


    Shapiro-Wilk normality test

data:  log
W = 0.98696, p-value = 0.9001

En la prueba de Shapiro-Wilk el valor de p es mayor a 0.05 siendo este valor p = 0.9001 por lo que los datos ya son normales

Construir intervalo de Confianza

#A los datos ya se les aplico el logaritmo
m <- mean(log)
s <- sd(log)
n <- length(log)

#Valor de Distribucion t
t <- abs(qt(0.025,df=42))
t

[1] 2.018082

#Limites de los intervalos
#Inferior
li <- exp(m-t*sqrt(s^2/43))
li

[1] 3.446958

#Superior
ls <- exp(m+t*sqrt(s^2/43))
ls

[1] 5.735207

#El uso del exponencial deja ya indicado los valores que se buscan

El valor de la mediana de los flujos en este lugar se encuentran entre los valores 3.45 y 5.73.

LS0tDQp0aXRsZTogIkFzaWduYWNpw7NuIDIgTWVsYW5pZSBJY2VkbyBGw6lsaXgiDQpvdXRwdXQ6IGh0bWxfbm90ZWJvb2sNCi0tLQ0KDQoNCiMgSW50ZXJ2YWxvIGRlIGNvbmZpYW56YSBwYXJhbcOpdHJpY28gYXNpbcOpdHJpY28NCg0KIyMgRWplbXBsbw0KDQojIyMgQ3VhbmRvIGxvcyBkYXRvcyBzb24gYXNpbcOpdHJpY29zIChjb24gc2VzZ28gcG9zaXRpdm8pIHVuIGhpc3RvZ3JhbWEgZGUgbG9zIGxvZ2FyaXRtb3MgZGUgbG9zIGRhdG9zIG9yaWdpbmFsZXMgdGllbmUgZm9ybWEgc2ltw6l0cmljYS4gQ29tbyBlamVtcGxvIHJlY3VlcmRlIGxvcyBkYXRvcyBkZWwgYXJzZW5pY286DQoNCmBgYHtyfQ0KYSA8LSBjKDEuMywgOCwgMS41LCA5LjUsIDEwMCwgNTgwLCAxMTAsIDEuOCwgMi42LCAyLjgsIDMuNSwgMTIsIDE0LCAxOSwgMjMsMTIwLCAxOTAsIDI0MCwgMjUwLCA0LjAsIDQxLCAzMDAsIDQuOCwgODAsIDM0MCkNCmhpc3QoYSwgY29sID0gImdyZXkiKQ0KYGBgDQoNClNpIHNlIGNhbGN1bGEgZWwgbG9nYXJpdG1vIG5hdHVyYWwgZGUgbG9zIGRhdG9zIHkgc2UgcmVhbGl6YSBsYSBwcnVlYmEgZGUgc2hhcGlybyBwdWVkZSB2ZXJzZSBxdWUgYWwgOTAlIGRlIGNvbmZpYW56YSBsb3MgbG9nYXJpdG1vcyBzb24gbm9ybWFsZXMuDQoNCg0KYGBge3J9DQojbG9nKCkgY2FsY3VsYSBlbCBsb2dhcml0bW8gbmF0dXJhbCBkZSB1biBuw7ptZXJvLg0KeT1sb2coYSkNCnkNCnNoYXBpcm8udGVzdCh5KQ0KYGBgDQoNCkVuIGVzdGFzIHNpdHVhY2lvbmVzIHB1ZWRlIGNvbnN0cnVpcnNlIHVuIGludGVydmFsbyBkZSBjb25maWFuemEgcGFyYSBsYSBtZWRpYW5hIGRlIGxhIHNpZ3VpZW50ZSBtYW5lcmE6DQoNCkVuIFIsIGVsIGludGVydmFsbyBzZSBwdWVkZSBjYWxjdWxhciBhc2k6DQpgYGB7cn0NCmEgPC0gYygxLjMsOCwxLjUsOS41LDEwMCw1ODAsMTEwLDEuOCwgMi42LCAyLjgsIDMuNSwxMiwgMTQsIDE5LCAyMywxMjAsIDE5MCwgMjQwLCAyNTAsNC4wLDQxLDMwMCw0LjgsODAsMzQwKQ0KDQojIHRyYW5zZm9ybWFyIGEgbG9nYXJpdG1vDQp5PWxvZyhhKQ0KDQojbWVkaWEgZGUgbG9zIGxvZ2FyaXRtb3MNCmVtIDwtIG1lYW4oeSkNCmVtDQojIGRlc3ZpYWNpw7NuIGVzdMOhbmRhciBkZSBsb3MgbG9nYXJpdG1vcw0KZXMgPC0gc2QoeSkNCmVzDQojdmFsb3IgZGUgbGEgZGlzdHJpYnVjacOzbiB0IGFsIDk1JSwgcmVjdWVyZGUgcXVlIGVsIHRhbWHDsW8gZGUgbXVlc3RyYSBlcyAyNSB5IGVuIGxhIGZvcm11bGEgZGljZSBuLTENCmV0IDwtIGFicyhxdCguMDI1LDI0KSkNCmV0DQojRmluYWxtZW50ZSBsb3MgbMOtbWl0ZXMgZGUgbG9zIGludGVydmFsb3MNCmVsaSA8LSBleHAoZW0tZXQqc3FydChlc14yLzI1KSkNCmVscyA8LSBleHAoZW0rZXQqc3FydChlc14yLzI1KSkNCmVsaQ0KZWxzDQoNCmBgYA0KDQpGaW5hbG1lbnRlIHBvZHJlbW9zIGRlY2lyIHF1ZSBsYSBjb25jZW50cmFjacOzbiBtZWRpYW5hIGRlIGFyc8OpbmljbyBzZSBlbmN1ZW50cmEgZW50cmUgMTAuNjMgcHBiIHkgNTMuNiBwcGIuDQoNCiMjIFRBUkVBIA0KIyMgRUpFUkNJQ0lPIFRoZSBmb2xsb3dpbmcgNDMgdmFsdWVzIGFyZSBhbm51YWwgNy1kYXkgbWluaW11bSBmbG93cyBmb3IgMTk0MS0xOTgzIG9uIHRoZSBMaXR0bGUgTWFob25pbmcgQ3JlZWsgYXQgTWNDb3JtaWNrLCBQQS4NCg0KYGBge3J9DQpmbHVqb3MgPC0gYygwLjY5LDIuOTAsNC40MCwwLjgwLDMuMDAsNC44MCw5LjcwLCA5LjgwLDEuMzAsMy4xMCw0LjkwLDEwLjAwLDEuNDAsMy4zMCw1LjcwLDExLjAwLDEuNTAsIDEuNTAsIDEuODAsIDEuODAsIDIuMTAsIDIuNTAsMy43MCAsMy44MCwgMy44MCwgNC4wMCwgNC4xMCwgNC4yMCw1LjgwLCA1LjkwLCA2LjAwLCA2LjEwLCA3LjkwLCA4LjAwLDExLjAwICwxMi4wMCwgMTMuMDAsIDE2LjAwLCAyMC4wMCwgMjMuMDAsMi44LDQuMiw4KQ0KDQojT3JkZW5hciBsb3MgRGF0b3MNCmYgPC0gc29ydChmbHVqb3MpDQoNCmBgYA0KDQotICpDb25zdHJ1eWEgdW4gaGlzdG9ncmFtYSBkZSBsb3MgZGF0b3Mgb3JpZ2luYWxlcywgwr9RdcOpIGZvcm1hIHRpZW5lbj8qDQoNCg0KMS4gQ29uc3RydXlhIHVuIGhpc3RvZ3JhbWEgZGUgbG9zIGxvZ2FyaXRtb3MgZGUgbG9zIGRhdG9zIG9yaWdpbmFsZXMswr9xdcOpIGZvcm1hIHRpZW5lbj8NCjIuIFJlYWxpY2UgbGEgcHJ1ZWJhIGRlIHNoYXBpcm8gcGFyYSBsb3MgbG9nYXJpdG1vcyBkZSBsb3MgZGF0b3Muwr9BIHF1w6kgY29uY2x1c2nDs24gbGxlZ2E/DQozLiBDb25zdHJ1eWEgZWwgaW50ZXJ2YWxvIGRlIGNvbmZpYW56YSBwYXJhIG1lZGlhbmEgdXNhbmRvIGxhIGbDs3JtdWxhIHZpc3RhIGVuIGVzdGEgc2VzacOzbi4gSW50ZXJwcsOpdGVsby4NCg0KKiBIaXN0b2dyYW1hIA0KYGBge3IgaGlzdG9ncmFtYSBvcmlnaW5hbH0NCmhpc3QoZiwgY29sID0gIiNFM0Y2Q0UiLCBtYWluID0gIkZsdWpvcyIsIHhsYWIgPSAiRmx1am9zIikNCmBgYA0KDQoqKkxvcyBkYXRvcyBhbCBpZ3VhbCBxdWUgZW4gZWwgZWplbXBsbyBzb24gYXNpbcOpdHJpY29zIHkgcHJlc2VudGFuIHVuIHNlc2dvIHBvc2l0aXZvLioqDQoNCiogSGlzdG9ncmFtYSBkZSBsb3MgbG9nYXJpdG1vcyBkZSBsb3MgZGF0b3Mgb3JpZ2luYWxlcw0KYGBge3IgbG9nYXJpcm1vfQ0KbG9nIDwtIGxvZyhmKQ0KaGlzdChsb2csIGNvbCA9ICIjRjZFM0NFIiwgbWFpbiA9ICJMb2dhcml0bW8gZGUgRmx1am9zIiwgeGxhYiA9ICJGbHVqb3MiKQ0KYGBgDQoqKkVuIGVzdGUgaGlzdG9ncmFtYSBsb3MgZGF0b3Mgbm8gbXVzdHJhbiBlbCBzZXNnbyBwb3NpdGl2byBjb21vIGVuIGVsIGNhc28gYW50ZXJpb3IsIGVzdG9zIGRhdG9zIHNpZ3VlbiB1bmEgZm9ybWEgbWFzIGNlcmNhbmEgYSBsYSBkZSB1bmEgY2FtcGFuYSwgcHVlc3RvIHF1ZSwgZWwgbG9nYXJpdG1vIHRyYXRhIGRlIGhhY2VyIGEgbG9zIGRhdG9zIG5vcm1hbGVzKioNCg0KKiBQcnVlYmEgZGUgU2hhcGlyby1XaWxrDQpgYGB7ciBzaGFwaXJvfQ0Kc2hhcGlyby50ZXN0KGxvZykNCmBgYA0KKipFbiBsYSBwcnVlYmEgZGUgU2hhcGlyby1XaWxrIGVsIHZhbG9yIGRlIHAgZXMgbWF5b3IgYSAwLjA1IHNpZW5kbyBlc3RlIHZhbG9yIHAgPSAgMC45MDAxIHBvciBsbyBxdWUgbG9zIGRhdG9zIHlhIHNvbiBub3JtYWxlcyAqKg0KDQoqIENvbnN0cnVpciBpbnRlcnZhbG8gZGUgQ29uZmlhbnphDQpgYGB7ciBpbnRlcnZhbG8gZGUgY29uZmlhbnphfQ0KI0EgbG9zIGRhdG9zIHlhIHNlIGxlcyBhcGxpY28gZWwgbG9nYXJpdG1vDQptIDwtIG1lYW4obG9nKQ0KcyA8LSBzZChsb2cpDQpuIDwtIGxlbmd0aChsb2cpDQoNCiNWYWxvciBkZSBEaXN0cmlidWNpb24gdA0KdCA8LSBhYnMocXQoMC4wMjUsZGY9NDIpKQ0KdA0KDQojTGltaXRlcyBkZSBsb3MgaW50ZXJ2YWxvcw0KI0luZmVyaW9yDQpsaSA8LSBleHAobS10KnNxcnQoc14yLzQzKSkNCmxpDQoNCiNTdXBlcmlvcg0KbHMgPC0gZXhwKG0rdCpzcXJ0KHNeMi80MykpDQpscw0KDQojRWwgdXNvIGRlbCBleHBvbmVuY2lhbCBkZWphIHlhIGluZGljYWRvIGxvcyB2YWxvcmVzIHF1ZSBzZSBidXNjYW4uDQpgYGANCioqRWwgdmFsb3IgZGUgbGEgbWVkaWFuYSBkZSBsb3MgZmx1am9zIGVuIGVzdGUgbHVnYXIgc2UgZW5jdWVudHJhbiBlbnRyZSBsb3MgdmFsb3JlcyAzLjQ1IHkgNS43My4qKg0KDQoNCg0KDQoNCg0KLg0K

Asignación 2 Melanie Icedo Félix

Intervalo de confianza paramétrico asimétrico

Ejemplo

Cuando los datos son asimétricos (con sesgo positivo) un histograma de los logaritmos de los datos originales tiene forma simétrica. Como ejemplo recuerde los datos del arsenico:

TAREA

EJERCICIO The following 43 values are annual 7-day minimum flows for 1941-1983 on the Little Mahoning Creek at McCormick, PA.