library(htmltab)
pbinominal= htmltab(doc = "https://en.m.wikipedia.org/wiki/List_of_countries_by_GDP_(nominal)_per_capita", 
               which ="//*/table/tbody/tr[2]/td[1]",
               encoding = "UTF-8") 
pbinominal

VIENDO MI DATA STR

str(pbinominal)
'data.frame':   193 obs. of  3 variables:
 $ Rank             : chr  "1" "2" "—" "3" ...
 $ Country/Territory: chr  "  Luxembourg" "   Switzerland" "  Macau" "  Norway" ...
 $ US$              : chr  "114,234" "82,950" "82,388" "81,695" ...
names(pbinominal)
[1] "Rank"              "Country/Territory" "US$"              

CAMBIO NOMBRES

names(pbinominal)=c("Rank","Pais","PBInominal")
names(pbinominal)
[1] "Rank"       "Pais"       "PBInominal"

Ahora queremos cambiar la variable “PBInominal” a numérica pero antes debemos recordar que si los números de los casos tienen coma al cambiar la estructura lo que R hará, automáticamente, es convertir todos los valores a NA’s. Entonces:

pbinominal$PBInominal=gsub(",","",pbinominal$PBInominal)

VERIFICO LO DE COMA

str(pbinominal)
'data.frame':   193 obs. of  3 variables:
 $ Rank      : chr  "1" "2" "—" "3" ...
 $ Pais      : chr  "  Luxembourg" "   Switzerland" "  Macau" "  Norway" ...
 $ PBInominal: chr  "114234" "82950" "82388" "81695" ...

CAMBIO LA ESTRCUTURA AHORA DE PBINOMINAL A NUMERICA

pbinominal$PBInominal=as.numeric(pbinominal$PBInominal)
str(pbinominal)
'data.frame':   193 obs. of  3 variables:
 $ Rank      : chr  "1" "2" "—" "3" ...
 $ Pais      : chr  "  Luxembourg" "   Switzerland" "  Macau" "  Norway" ...
 $ PBInominal: num  114234 82950 82388 81695 76099 ...

RESETEA EL INDICE

row.names(pbinominal)=NULL

HISTOGRAMA

library(ggplot2)
histNum=ggplot(pbinominal,aes(x=PBInominal))+ geom_histogram(bins=5)
histNum

Del gráfico anterior, podemos decir que la distribución no es simétrica por lo tanto la MEDIA no será una medida representativa (la MEDIANA será mejor opción)

####Boxplot Esto es mejor para revisar los valores perdidos

box=ggplot(pbinominal,aes(y=PBInominal)) + geom_boxplot() + coord_flip() box

box=ggplot(pbinominal,aes(y=PBInominal)) + geom_boxplot() + coord_flip()
box

ESTADIGRAFOS . summary(pbinominal$PBInominal) #para hallarlos

summary(pbinominal$PBInominal)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    303    2085    5899   14806   18032  114234 

estadigrafos=round(as.vector(summary(pbinominal$PBInominal)),1)

box + scale_y_continuous(breaks = estadigrafos)

En este caso, observamos que la media es mayor a la mediana, eso significa que se tiene una asimetría positiva. Ahora podemos confirmarla con el siguiente codigo

library(DescTools) Skew(pbinominal$PBInominal,conf.level = 0.05)

library(DescTools)
Skew(pbinominal$PBInominal,conf.level = 0.05)
    skew   lwr.ci   upr.ci 
2.083208 2.126614 2.158282 

distancia intercuartilica IQR(pninominal$PBInominal)

IQR(pbinominal$PBInominal)
[1] 15947

Es decir, entre el primer y tercer cuartil hay 15947 valores; asi, el 50% de los valores centrales varian en 15947 valores. Así, podemos proponer que un atípico es aquel que está a una distancia lejana de estos valores centrales. Ahora podemos representarlos por GINI

Gini(pbinominal$PBInominal,conf.level=0.95)
     gini    lwr.ci    upr.ci 
0.6315895 0.5993354 0.6672150 

GRAFICO DE LA CURVA DE LORENZ

library(ggplot2)
library(gglorenz)
Registered S3 methods overwritten by 'ineq':
  method   from     
  plot.Lc  DescTools
  lines.Lc DescTools
ggplot(pbinominal,aes(x=PBInominal))+ gglorenz::stat_lorenz(color='purple') +
    geom_abline(linetype = "dashed") + coord_fixed() +
    labs(x = "% Paises ordenados por PBI nominal",
         y = "% Acumulado de PBI nominal",
         title = "Relación pais/PBI nominal",
         caption = "Fuente: Fondo Monetario Internacional")

AQUI SALE LOS DE MODA MEDIANA CONCENTRACION ETC. http://rpubs.com/EstadisticaCP_unmsm/521248} LINK DE DONDE ME AYUDE AQUI http://rpubs.com/EstadisticaCP_unmsm/524133 EXPLORACION VARIABLES NUMÉRICAS http://rpubs.com/EstadisticaCP_unmsm/524133

Parte 1. Exploración Gráfica NOTA: Las variables numéricas no requieren tablas de frecuencia para ser exploradas.

El grafico inicial a usar es el histograma: library(ggplot2) base1=ggplot(mineria,aes(x=accidentes)) histNum= base1 + geom_histogram(bins=7) histNum La exploración numérica nos debe sugerir:

Si la media es representativo o no. Si hay asimetría, y hacia donde se concentran los datos. Si hay valores atípicos. Del gráfico podemos decir que, como no es simétrico, informar la media de accidentes no será muy representativa (la mediana será la mejor opción); por otro lado, como la asimetría nos muestra que los accidentes son en su mayoría pocos. Hay un numero de accidentes que se aleja hacia valores altos, pero no estamos seguros si está tan lejos del ‘centro’ para ser atípico.

Los atípicos se ven claramente en un boxplot:

base2=ggplot(mineria,aes(y=accidentes)) box=base2 + geom_boxplot() + coord_flip()

box aqui va grafico

This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.

Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.

plot(cars)

Add a new chunk by clicking the Insert Chunk button on the toolbar or by pressing Ctrl+Alt+I.

When you save the notebook, an HTML file containing the code and output will be saved alongside it (click the Preview button or press Ctrl+Shift+K to preview the HTML file).

The preview shows you a rendered HTML copy of the contents of the editor. Consequently, unlike Knit, Preview does not run any R code chunks. Instead, the output of the chunk when it was last run in the editor is displayed.

LS0tCnRpdGxlOiAiUiBOb3RlYm9vayIKb3V0cHV0OiBodG1sX25vdGVib29rCi0tLQpgYGB7cn0KbGlicmFyeShodG1sdGFiKQpwYmlub21pbmFsPSBodG1sdGFiKGRvYyA9ICJodHRwczovL2VuLm0ud2lraXBlZGlhLm9yZy93aWtpL0xpc3Rfb2ZfY291bnRyaWVzX2J5X0dEUF8obm9taW5hbClfcGVyX2NhcGl0YSIsIAogICAgICAgICAgICAgICB3aGljaCA9Ii8vKi90YWJsZS90Ym9keS90clsyXS90ZFsxXSIsCiAgICAgICAgICAgICAgIGVuY29kaW5nID0gIlVURi04IikgCnBiaW5vbWluYWwgCmBgYAogVklFTkRPIE1JIERBVEEgU1RSCmBgYHtyfQpzdHIocGJpbm9taW5hbCkKYGBgCmBgYHtyfQpuYW1lcyhwYmlub21pbmFsKQpgYGAKCgpDQU1CSU8gTk9NQlJFUwpgYGB7cn0KbmFtZXMocGJpbm9taW5hbCk9YygiUmFuayIsIlBhaXMiLCJQQklub21pbmFsIikKYGBgCgoKYGBge3J9Cm5hbWVzKHBiaW5vbWluYWwpCmBgYAoKQWhvcmEgcXVlcmVtb3MgY2FtYmlhciBsYSB2YXJpYWJsZSDigJxQQklub21pbmFs4oCdIGEgbnVtw6lyaWNhIHBlcm8gYW50ZXMgZGViZW1vcyByZWNvcmRhciBxdWUgc2kgbG9zIG7Dum1lcm9zIGRlIGxvcyBjYXNvcyB0aWVuZW4gY29tYSBhbCBjYW1iaWFyIGxhIGVzdHJ1Y3R1cmEgbG8gcXVlIFIgaGFyw6EsIGF1dG9tw6F0aWNhbWVudGUsIGVzIGNvbnZlcnRpciB0b2RvcyBsb3MgdmFsb3JlcyBhIE5B4oCZcy4gRW50b25jZXM6CgoKYGBge3J9CnBiaW5vbWluYWwkUEJJbm9taW5hbD1nc3ViKCIsIiwiIixwYmlub21pbmFsJFBCSW5vbWluYWwpCmBgYAoKVkVSSUZJQ08gTE8gREUgQ09NQQpgYGB7cn0Kc3RyKHBiaW5vbWluYWwpCmBgYAoKQ0FNQklPIExBIEVTVFJDVVRVUkEgQUhPUkEgREUgUEJJTk9NSU5BTCBBIE5VTUVSSUNBCmBgYHtyfQpwYmlub21pbmFsJFBCSW5vbWluYWw9YXMubnVtZXJpYyhwYmlub21pbmFsJFBCSW5vbWluYWwpCmBgYApgYGB7cn0Kc3RyKHBiaW5vbWluYWwpCmBgYApSRVNFVEVBIEVMIElORElDRQpgYGB7cn0Kcm93Lm5hbWVzKHBiaW5vbWluYWwpPU5VTEwKYGBgCgpISVNUT0dSQU1BCmBgYHtyfQpsaWJyYXJ5KGdncGxvdDIpCmhpc3ROdW09Z2dwbG90KHBiaW5vbWluYWwsYWVzKHg9UEJJbm9taW5hbCkpKyBnZW9tX2hpc3RvZ3JhbShiaW5zPTUpCmhpc3ROdW0KYGBgCkRlbCBncsOhZmljbyBhbnRlcmlvciwgcG9kZW1vcyBkZWNpciBxdWUgbGEgZGlzdHJpYnVjacOzbiBubyBlcyBzaW3DqXRyaWNhIHBvciBsbyB0YW50byBsYSBNRURJQSBubyBzZXLDoSB1bmEgbWVkaWRhIHJlcHJlc2VudGF0aXZhIChsYSBNRURJQU5BIHNlcsOhIG1lam9yIG9wY2nDs24pCgojIyMjQm94cGxvdCBFc3RvIGVzIG1lam9yIHBhcmEgcmV2aXNhciBsb3MgdmFsb3JlcyBwZXJkaWRvcwoKYm94PWdncGxvdChwYmlub21pbmFsLGFlcyh5PVBCSW5vbWluYWwpKSArIGdlb21fYm94cGxvdCgpICsgY29vcmRfZmxpcCgpCmJveCAKCmBgYHtyfQpib3g9Z2dwbG90KHBiaW5vbWluYWwsYWVzKHk9UEJJbm9taW5hbCkpICsgZ2VvbV9ib3hwbG90KCkgKyBjb29yZF9mbGlwKCkKYm94CmBgYAoKCkVTVEFESUdSQUZPUyAuIHN1bW1hcnkocGJpbm9taW5hbCRQQklub21pbmFsKSAjcGFyYSBoYWxsYXJsb3MKCgpgYGB7cn0Kc3VtbWFyeShwYmlub21pbmFsJFBCSW5vbWluYWwpCmBgYAoKCgpgYGB7cn0KCmVzdGFkaWdyYWZvcz1yb3VuZChhcy52ZWN0b3Ioc3VtbWFyeShwYmlub21pbmFsJFBCSW5vbWluYWwpKSwxKQoKYm94ICsgc2NhbGVfeV9jb250aW51b3VzKGJyZWFrcyA9IGVzdGFkaWdyYWZvcykKYGBgCkVuIGVzdGUgY2Fzbywgb2JzZXJ2YW1vcyBxdWUgbGEgbWVkaWEgZXMgbWF5b3IgYSBsYSBtZWRpYW5hLCBlc28gc2lnbmlmaWNhIHF1ZSBzZSB0aWVuZSB1bmEgYXNpbWV0csOtYSBwb3NpdGl2YS4KQWhvcmEgcG9kZW1vcyBjb25maXJtYXJsYSBjb24gZWwgc2lndWllbnRlIGNvZGlnbwoKbGlicmFyeShEZXNjVG9vbHMpClNrZXcocGJpbm9taW5hbCRQQklub21pbmFsLGNvbmYubGV2ZWwgPSAwLjA1KQoKCmBgYHtyfQpsaWJyYXJ5KERlc2NUb29scykKU2tldyhwYmlub21pbmFsJFBCSW5vbWluYWwsY29uZi5sZXZlbCA9IDAuMDUpCmBgYApkaXN0YW5jaWEgaW50ZXJjdWFydGlsaWNhIElRUihwbmlub21pbmFsJFBCSW5vbWluYWwpCgpgYGB7cn0KSVFSKHBiaW5vbWluYWwkUEJJbm9taW5hbCkKYGBgCkVzIGRlY2lyLCBlbnRyZSBlbCBwcmltZXIgeSB0ZXJjZXIgY3VhcnRpbCBoYXkgMTU5NDcgdmFsb3JlczsgYXNpLCBlbCA1MCUgZGUgbG9zIHZhbG9yZXMgY2VudHJhbGVzIHZhcmlhbiBlbiAxNTk0NyB2YWxvcmVzLiBBc8OtLCBwb2RlbW9zIHByb3BvbmVyIHF1ZSB1biBhdMOtcGljbyBlcyBhcXVlbCBxdWUgZXN0w6EgYSB1bmEgZGlzdGFuY2lhIGxlamFuYSBkZSBlc3RvcyB2YWxvcmVzIGNlbnRyYWxlcy4KQWhvcmEgcG9kZW1vcyByZXByZXNlbnRhcmxvcyBwb3IgR0lOSQpgYGB7cn0KR2luaShwYmlub21pbmFsJFBCSW5vbWluYWwsY29uZi5sZXZlbD0wLjk1KQpgYGAKCkdSQUZJQ08gREUgTEEgQ1VSVkEgREUgTE9SRU5aCmBgYHtyfQpsaWJyYXJ5KGdncGxvdDIpCmxpYnJhcnkoZ2dsb3JlbnopCmBgYAoKYGBge3J9CmdncGxvdChwYmlub21pbmFsLGFlcyh4PVBCSW5vbWluYWwpKSsgZ2dsb3Jlbno6OnN0YXRfbG9yZW56KGNvbG9yPSdwdXJwbGUnKSArCiAgICBnZW9tX2FibGluZShsaW5ldHlwZSA9ICJkYXNoZWQiKSArIGNvb3JkX2ZpeGVkKCkgKwogICAgbGFicyh4ID0gIiUgUGFpc2VzIG9yZGVuYWRvcyBwb3IgUEJJIG5vbWluYWwiLAogICAgICAgICB5ID0gIiUgQWN1bXVsYWRvIGRlIFBCSSBub21pbmFsIiwKICAgICAgICAgdGl0bGUgPSAiUmVsYWNpw7NuIHBhaXMvUEJJIG5vbWluYWwiLAogICAgICAgICBjYXB0aW9uID0gIkZ1ZW50ZTogRm9uZG8gTW9uZXRhcmlvIEludGVybmFjaW9uYWwiKQpgYGAKCgpBUVVJIFNBTEUgTE9TIERFIE1PREEgTUVESUFOQSBDT05DRU5UUkFDSU9OIEVUQy4gaHR0cDovL3JwdWJzLmNvbS9Fc3RhZGlzdGljYUNQX3VubXNtLzUyMTI0OH0KTElOSyBERSBET05ERSBNRSBBWVVERSBBUVVJIGh0dHA6Ly9ycHVicy5jb20vRXN0YWRpc3RpY2FDUF91bm1zbS81MjQxMzMKRVhQTE9SQUNJT04gVkFSSUFCTEVTIE5VTcOJUklDQVMgaHR0cDovL3JwdWJzLmNvbS9Fc3RhZGlzdGljYUNQX3VubXNtLzUyNDEzMwoKClBhcnRlIDEuIEV4cGxvcmFjacOzbiBHcsOhZmljYQpOT1RBOiBMYXMgdmFyaWFibGVzIG51bcOpcmljYXMgbm8gcmVxdWllcmVuIHRhYmxhcyBkZSBmcmVjdWVuY2lhIHBhcmEgc2VyIGV4cGxvcmFkYXMuCgpFbCBncmFmaWNvIGluaWNpYWwgYSB1c2FyIGVzIGVsIGhpc3RvZ3JhbWE6CmxpYnJhcnkoZ2dwbG90MikKYmFzZTE9Z2dwbG90KG1pbmVyaWEsYWVzKHg9YWNjaWRlbnRlcykpCmhpc3ROdW09IGJhc2UxICsgZ2VvbV9oaXN0b2dyYW0oYmlucz03KSAKaGlzdE51bSAKTGEgZXhwbG9yYWNpw7NuIG51bcOpcmljYSBub3MgZGViZSBzdWdlcmlyOgoKU2kgbGEgbWVkaWEgZXMgcmVwcmVzZW50YXRpdm8gbyBuby4KU2kgaGF5IGFzaW1ldHLDrWEsIHkgaGFjaWEgZG9uZGUgc2UgY29uY2VudHJhbiBsb3MgZGF0b3MuClNpIGhheSB2YWxvcmVzIGF0w61waWNvcy4KRGVsIGdyw6FmaWNvIHBvZGVtb3MgZGVjaXIgcXVlLCBjb21vIG5vIGVzIHNpbcOpdHJpY28sIGluZm9ybWFyIGxhIG1lZGlhIGRlIGFjY2lkZW50ZXMgbm8gc2Vyw6EgbXV5IHJlcHJlc2VudGF0aXZhIChsYSBtZWRpYW5hIHNlcsOhIGxhIG1lam9yIG9wY2nDs24pOyBwb3Igb3RybyBsYWRvLCBjb21vIGxhIGFzaW1ldHLDrWEgbm9zIG11ZXN0cmEgcXVlIGxvcyBhY2NpZGVudGVzIHNvbiBlbiBzdSBtYXlvcsOtYSBwb2Nvcy4gSGF5IHVuIG51bWVybyBkZSBhY2NpZGVudGVzIHF1ZSBzZSBhbGVqYSBoYWNpYSB2YWxvcmVzIGFsdG9zLCBwZXJvIG5vIGVzdGFtb3Mgc2VndXJvcyBzaSBlc3TDoSB0YW4gbGVqb3MgZGVsIOKAmGNlbnRyb+KAmSBwYXJhIHNlciBhdMOtcGljby4KCkxvcyBhdMOtcGljb3Mgc2UgdmVuIGNsYXJhbWVudGUgZW4gdW4gYm94cGxvdDoKCmJhc2UyPWdncGxvdChtaW5lcmlhLGFlcyh5PWFjY2lkZW50ZXMpKQpib3g9YmFzZTIgKyBnZW9tX2JveHBsb3QoKSArIGNvb3JkX2ZsaXAoKQoKYm94IAphcXVpIHZhIGdyYWZpY28KCgoKCgoKVGhpcyBpcyBhbiBbUiBNYXJrZG93bl0oaHR0cDovL3JtYXJrZG93bi5yc3R1ZGlvLmNvbSkgTm90ZWJvb2suIFdoZW4geW91IGV4ZWN1dGUgY29kZSB3aXRoaW4gdGhlIG5vdGVib29rLCB0aGUgcmVzdWx0cyBhcHBlYXIgYmVuZWF0aCB0aGUgY29kZS4gCgpUcnkgZXhlY3V0aW5nIHRoaXMgY2h1bmsgYnkgY2xpY2tpbmcgdGhlICpSdW4qIGJ1dHRvbiB3aXRoaW4gdGhlIGNodW5rIG9yIGJ5IHBsYWNpbmcgeW91ciBjdXJzb3IgaW5zaWRlIGl0IGFuZCBwcmVzc2luZyAqQ3RybCtTaGlmdCtFbnRlciouIAoKYGBge3J9CnBsb3QoY2FycykKYGBgCgpBZGQgYSBuZXcgY2h1bmsgYnkgY2xpY2tpbmcgdGhlICpJbnNlcnQgQ2h1bmsqIGJ1dHRvbiBvbiB0aGUgdG9vbGJhciBvciBieSBwcmVzc2luZyAqQ3RybCtBbHQrSSouCgpXaGVuIHlvdSBzYXZlIHRoZSBub3RlYm9vaywgYW4gSFRNTCBmaWxlIGNvbnRhaW5pbmcgdGhlIGNvZGUgYW5kIG91dHB1dCB3aWxsIGJlIHNhdmVkIGFsb25nc2lkZSBpdCAoY2xpY2sgdGhlICpQcmV2aWV3KiBidXR0b24gb3IgcHJlc3MgKkN0cmwrU2hpZnQrSyogdG8gcHJldmlldyB0aGUgSFRNTCBmaWxlKS4KClRoZSBwcmV2aWV3IHNob3dzIHlvdSBhIHJlbmRlcmVkIEhUTUwgY29weSBvZiB0aGUgY29udGVudHMgb2YgdGhlIGVkaXRvci4gQ29uc2VxdWVudGx5LCB1bmxpa2UgKktuaXQqLCAqUHJldmlldyogZG9lcyBub3QgcnVuIGFueSBSIGNvZGUgY2h1bmtzLiBJbnN0ZWFkLCB0aGUgb3V0cHV0IG9mIHRoZSBjaHVuayB3aGVuIGl0IHdhcyBsYXN0IHJ1biBpbiB0aGUgZWRpdG9yIGlzIGRpc3BsYXllZC4K