library(htmltab)
pbinominal= htmltab(doc = "https://en.m.wikipedia.org/wiki/List_of_countries_by_GDP_(nominal)_per_capita",
which ="//*/table/tbody/tr[2]/td[1]",
encoding = "UTF-8")
pbinominal
VIENDO MI DATA STR
str(pbinominal)
'data.frame': 193 obs. of 3 variables:
$ Rank : chr "1" "2" "—" "3" ...
$ Country/Territory: chr " Luxembourg" " Switzerland" " Macau" " Norway" ...
$ US$ : chr "114,234" "82,950" "82,388" "81,695" ...
names(pbinominal)
[1] "Rank" "Country/Territory" "US$"
CAMBIO NOMBRES
names(pbinominal)=c("Rank","Pais","PBInominal")
names(pbinominal)
[1] "Rank" "Pais" "PBInominal"
Ahora queremos cambiar la variable “PBInominal” a numérica pero antes debemos recordar que si los números de los casos tienen coma al cambiar la estructura lo que R hará, automáticamente, es convertir todos los valores a NA’s. Entonces:
pbinominal$PBInominal=gsub(",","",pbinominal$PBInominal)
VERIFICO LO DE COMA
str(pbinominal)
'data.frame': 193 obs. of 3 variables:
$ Rank : chr "1" "2" "—" "3" ...
$ Pais : chr " Luxembourg" " Switzerland" " Macau" " Norway" ...
$ PBInominal: chr "114234" "82950" "82388" "81695" ...
CAMBIO LA ESTRCUTURA AHORA DE PBINOMINAL A NUMERICA
pbinominal$PBInominal=as.numeric(pbinominal$PBInominal)
str(pbinominal)
'data.frame': 193 obs. of 3 variables:
$ Rank : chr "1" "2" "—" "3" ...
$ Pais : chr " Luxembourg" " Switzerland" " Macau" " Norway" ...
$ PBInominal: num 114234 82950 82388 81695 76099 ...
RESETEA EL INDICE
row.names(pbinominal)=NULL
HISTOGRAMA
library(ggplot2)
histNum=ggplot(pbinominal,aes(x=PBInominal))+ geom_histogram(bins=5)
histNum

Del gráfico anterior, podemos decir que la distribución no es simétrica por lo tanto la MEDIA no será una medida representativa (la MEDIANA será mejor opción)
####Boxplot Esto es mejor para revisar los valores perdidos
box=ggplot(pbinominal,aes(y=PBInominal)) + geom_boxplot() + coord_flip() box
box=ggplot(pbinominal,aes(y=PBInominal)) + geom_boxplot() + coord_flip()
box

ESTADIGRAFOS . summary(pbinominal$PBInominal) #para hallarlos
summary(pbinominal$PBInominal)
Min. 1st Qu. Median Mean 3rd Qu. Max.
303 2085 5899 14806 18032 114234
estadigrafos=round(as.vector(summary(pbinominal$PBInominal)),1)
box + scale_y_continuous(breaks = estadigrafos)

En este caso, observamos que la media es mayor a la mediana, eso significa que se tiene una asimetría positiva. Ahora podemos confirmarla con el siguiente codigo
library(DescTools) Skew(pbinominal$PBInominal,conf.level = 0.05)
library(DescTools)
Skew(pbinominal$PBInominal,conf.level = 0.05)
skew lwr.ci upr.ci
2.083208 2.126614 2.158282
distancia intercuartilica IQR(pninominal$PBInominal)
IQR(pbinominal$PBInominal)
[1] 15947
Es decir, entre el primer y tercer cuartil hay 15947 valores; asi, el 50% de los valores centrales varian en 15947 valores. Así, podemos proponer que un atípico es aquel que está a una distancia lejana de estos valores centrales. Ahora podemos representarlos por GINI
Gini(pbinominal$PBInominal,conf.level=0.95)
gini lwr.ci upr.ci
0.6315895 0.5993354 0.6672150
GRAFICO DE LA CURVA DE LORENZ
library(ggplot2)
library(gglorenz)
Registered S3 methods overwritten by 'ineq':
method from
plot.Lc DescTools
lines.Lc DescTools
ggplot(pbinominal,aes(x=PBInominal))+ gglorenz::stat_lorenz(color='purple') +
geom_abline(linetype = "dashed") + coord_fixed() +
labs(x = "% Paises ordenados por PBI nominal",
y = "% Acumulado de PBI nominal",
title = "Relación pais/PBI nominal",
caption = "Fuente: Fondo Monetario Internacional")

AQUI SALE LOS DE MODA MEDIANA CONCENTRACION ETC. http://rpubs.com/EstadisticaCP_unmsm/521248} LINK DE DONDE ME AYUDE AQUI http://rpubs.com/EstadisticaCP_unmsm/524133 EXPLORACION VARIABLES NUMÉRICAS http://rpubs.com/EstadisticaCP_unmsm/524133
Parte 1. Exploración Gráfica NOTA: Las variables numéricas no requieren tablas de frecuencia para ser exploradas.
El grafico inicial a usar es el histograma: library(ggplot2) base1=ggplot(mineria,aes(x=accidentes)) histNum= base1 + geom_histogram(bins=7) histNum La exploración numérica nos debe sugerir:
Si la media es representativo o no. Si hay asimetría, y hacia donde se concentran los datos. Si hay valores atípicos. Del gráfico podemos decir que, como no es simétrico, informar la media de accidentes no será muy representativa (la mediana será la mejor opción); por otro lado, como la asimetría nos muestra que los accidentes son en su mayoría pocos. Hay un numero de accidentes que se aleja hacia valores altos, pero no estamos seguros si está tan lejos del ‘centro’ para ser atípico.
Los atípicos se ven claramente en un boxplot:
base2=ggplot(mineria,aes(y=accidentes)) box=base2 + geom_boxplot() + coord_flip()
box aqui va grafico
This is an R Markdown Notebook. When you execute code within the notebook, the results appear beneath the code.
Try executing this chunk by clicking the Run button within the chunk or by placing your cursor inside it and pressing Ctrl+Shift+Enter.
plot(cars)
Add a new chunk by clicking the Insert Chunk button on the toolbar or by pressing Ctrl+Alt+I.
When you save the notebook, an HTML file containing the code and output will be saved alongside it (click the Preview button or press Ctrl+Shift+K to preview the HTML file).
The preview shows you a rendered HTML copy of the contents of the editor. Consequently, unlike Knit, Preview does not run any R code chunks. Instead, the output of the chunk when it was last run in the editor is displayed.
LS0tCnRpdGxlOiAiUiBOb3RlYm9vayIKb3V0cHV0OiBodG1sX25vdGVib29rCi0tLQpgYGB7cn0KbGlicmFyeShodG1sdGFiKQpwYmlub21pbmFsPSBodG1sdGFiKGRvYyA9ICJodHRwczovL2VuLm0ud2lraXBlZGlhLm9yZy93aWtpL0xpc3Rfb2ZfY291bnRyaWVzX2J5X0dEUF8obm9taW5hbClfcGVyX2NhcGl0YSIsIAogICAgICAgICAgICAgICB3aGljaCA9Ii8vKi90YWJsZS90Ym9keS90clsyXS90ZFsxXSIsCiAgICAgICAgICAgICAgIGVuY29kaW5nID0gIlVURi04IikgCnBiaW5vbWluYWwgCmBgYAogVklFTkRPIE1JIERBVEEgU1RSCmBgYHtyfQpzdHIocGJpbm9taW5hbCkKYGBgCmBgYHtyfQpuYW1lcyhwYmlub21pbmFsKQpgYGAKCgpDQU1CSU8gTk9NQlJFUwpgYGB7cn0KbmFtZXMocGJpbm9taW5hbCk9YygiUmFuayIsIlBhaXMiLCJQQklub21pbmFsIikKYGBgCgoKYGBge3J9Cm5hbWVzKHBiaW5vbWluYWwpCmBgYAoKQWhvcmEgcXVlcmVtb3MgY2FtYmlhciBsYSB2YXJpYWJsZSDigJxQQklub21pbmFs4oCdIGEgbnVtw6lyaWNhIHBlcm8gYW50ZXMgZGViZW1vcyByZWNvcmRhciBxdWUgc2kgbG9zIG7Dum1lcm9zIGRlIGxvcyBjYXNvcyB0aWVuZW4gY29tYSBhbCBjYW1iaWFyIGxhIGVzdHJ1Y3R1cmEgbG8gcXVlIFIgaGFyw6EsIGF1dG9tw6F0aWNhbWVudGUsIGVzIGNvbnZlcnRpciB0b2RvcyBsb3MgdmFsb3JlcyBhIE5B4oCZcy4gRW50b25jZXM6CgoKYGBge3J9CnBiaW5vbWluYWwkUEJJbm9taW5hbD1nc3ViKCIsIiwiIixwYmlub21pbmFsJFBCSW5vbWluYWwpCmBgYAoKVkVSSUZJQ08gTE8gREUgQ09NQQpgYGB7cn0Kc3RyKHBiaW5vbWluYWwpCmBgYAoKQ0FNQklPIExBIEVTVFJDVVRVUkEgQUhPUkEgREUgUEJJTk9NSU5BTCBBIE5VTUVSSUNBCmBgYHtyfQpwYmlub21pbmFsJFBCSW5vbWluYWw9YXMubnVtZXJpYyhwYmlub21pbmFsJFBCSW5vbWluYWwpCmBgYApgYGB7cn0Kc3RyKHBiaW5vbWluYWwpCmBgYApSRVNFVEVBIEVMIElORElDRQpgYGB7cn0Kcm93Lm5hbWVzKHBiaW5vbWluYWwpPU5VTEwKYGBgCgpISVNUT0dSQU1BCmBgYHtyfQpsaWJyYXJ5KGdncGxvdDIpCmhpc3ROdW09Z2dwbG90KHBiaW5vbWluYWwsYWVzKHg9UEJJbm9taW5hbCkpKyBnZW9tX2hpc3RvZ3JhbShiaW5zPTUpCmhpc3ROdW0KYGBgCkRlbCBncsOhZmljbyBhbnRlcmlvciwgcG9kZW1vcyBkZWNpciBxdWUgbGEgZGlzdHJpYnVjacOzbiBubyBlcyBzaW3DqXRyaWNhIHBvciBsbyB0YW50byBsYSBNRURJQSBubyBzZXLDoSB1bmEgbWVkaWRhIHJlcHJlc2VudGF0aXZhIChsYSBNRURJQU5BIHNlcsOhIG1lam9yIG9wY2nDs24pCgojIyMjQm94cGxvdCBFc3RvIGVzIG1lam9yIHBhcmEgcmV2aXNhciBsb3MgdmFsb3JlcyBwZXJkaWRvcwoKYm94PWdncGxvdChwYmlub21pbmFsLGFlcyh5PVBCSW5vbWluYWwpKSArIGdlb21fYm94cGxvdCgpICsgY29vcmRfZmxpcCgpCmJveCAKCmBgYHtyfQpib3g9Z2dwbG90KHBiaW5vbWluYWwsYWVzKHk9UEJJbm9taW5hbCkpICsgZ2VvbV9ib3hwbG90KCkgKyBjb29yZF9mbGlwKCkKYm94CmBgYAoKCkVTVEFESUdSQUZPUyAuIHN1bW1hcnkocGJpbm9taW5hbCRQQklub21pbmFsKSAjcGFyYSBoYWxsYXJsb3MKCgpgYGB7cn0Kc3VtbWFyeShwYmlub21pbmFsJFBCSW5vbWluYWwpCmBgYAoKCgpgYGB7cn0KCmVzdGFkaWdyYWZvcz1yb3VuZChhcy52ZWN0b3Ioc3VtbWFyeShwYmlub21pbmFsJFBCSW5vbWluYWwpKSwxKQoKYm94ICsgc2NhbGVfeV9jb250aW51b3VzKGJyZWFrcyA9IGVzdGFkaWdyYWZvcykKYGBgCkVuIGVzdGUgY2Fzbywgb2JzZXJ2YW1vcyBxdWUgbGEgbWVkaWEgZXMgbWF5b3IgYSBsYSBtZWRpYW5hLCBlc28gc2lnbmlmaWNhIHF1ZSBzZSB0aWVuZSB1bmEgYXNpbWV0csOtYSBwb3NpdGl2YS4KQWhvcmEgcG9kZW1vcyBjb25maXJtYXJsYSBjb24gZWwgc2lndWllbnRlIGNvZGlnbwoKbGlicmFyeShEZXNjVG9vbHMpClNrZXcocGJpbm9taW5hbCRQQklub21pbmFsLGNvbmYubGV2ZWwgPSAwLjA1KQoKCmBgYHtyfQpsaWJyYXJ5KERlc2NUb29scykKU2tldyhwYmlub21pbmFsJFBCSW5vbWluYWwsY29uZi5sZXZlbCA9IDAuMDUpCmBgYApkaXN0YW5jaWEgaW50ZXJjdWFydGlsaWNhIElRUihwbmlub21pbmFsJFBCSW5vbWluYWwpCgpgYGB7cn0KSVFSKHBiaW5vbWluYWwkUEJJbm9taW5hbCkKYGBgCkVzIGRlY2lyLCBlbnRyZSBlbCBwcmltZXIgeSB0ZXJjZXIgY3VhcnRpbCBoYXkgMTU5NDcgdmFsb3JlczsgYXNpLCBlbCA1MCUgZGUgbG9zIHZhbG9yZXMgY2VudHJhbGVzIHZhcmlhbiBlbiAxNTk0NyB2YWxvcmVzLiBBc8OtLCBwb2RlbW9zIHByb3BvbmVyIHF1ZSB1biBhdMOtcGljbyBlcyBhcXVlbCBxdWUgZXN0w6EgYSB1bmEgZGlzdGFuY2lhIGxlamFuYSBkZSBlc3RvcyB2YWxvcmVzIGNlbnRyYWxlcy4KQWhvcmEgcG9kZW1vcyByZXByZXNlbnRhcmxvcyBwb3IgR0lOSQpgYGB7cn0KR2luaShwYmlub21pbmFsJFBCSW5vbWluYWwsY29uZi5sZXZlbD0wLjk1KQpgYGAKCkdSQUZJQ08gREUgTEEgQ1VSVkEgREUgTE9SRU5aCmBgYHtyfQpsaWJyYXJ5KGdncGxvdDIpCmxpYnJhcnkoZ2dsb3JlbnopCmBgYAoKYGBge3J9CmdncGxvdChwYmlub21pbmFsLGFlcyh4PVBCSW5vbWluYWwpKSsgZ2dsb3Jlbno6OnN0YXRfbG9yZW56KGNvbG9yPSdwdXJwbGUnKSArCiAgICBnZW9tX2FibGluZShsaW5ldHlwZSA9ICJkYXNoZWQiKSArIGNvb3JkX2ZpeGVkKCkgKwogICAgbGFicyh4ID0gIiUgUGFpc2VzIG9yZGVuYWRvcyBwb3IgUEJJIG5vbWluYWwiLAogICAgICAgICB5ID0gIiUgQWN1bXVsYWRvIGRlIFBCSSBub21pbmFsIiwKICAgICAgICAgdGl0bGUgPSAiUmVsYWNpw7NuIHBhaXMvUEJJIG5vbWluYWwiLAogICAgICAgICBjYXB0aW9uID0gIkZ1ZW50ZTogRm9uZG8gTW9uZXRhcmlvIEludGVybmFjaW9uYWwiKQpgYGAKCgpBUVVJIFNBTEUgTE9TIERFIE1PREEgTUVESUFOQSBDT05DRU5UUkFDSU9OIEVUQy4gaHR0cDovL3JwdWJzLmNvbS9Fc3RhZGlzdGljYUNQX3VubXNtLzUyMTI0OH0KTElOSyBERSBET05ERSBNRSBBWVVERSBBUVVJIGh0dHA6Ly9ycHVicy5jb20vRXN0YWRpc3RpY2FDUF91bm1zbS81MjQxMzMKRVhQTE9SQUNJT04gVkFSSUFCTEVTIE5VTcOJUklDQVMgaHR0cDovL3JwdWJzLmNvbS9Fc3RhZGlzdGljYUNQX3VubXNtLzUyNDEzMwoKClBhcnRlIDEuIEV4cGxvcmFjacOzbiBHcsOhZmljYQpOT1RBOiBMYXMgdmFyaWFibGVzIG51bcOpcmljYXMgbm8gcmVxdWllcmVuIHRhYmxhcyBkZSBmcmVjdWVuY2lhIHBhcmEgc2VyIGV4cGxvcmFkYXMuCgpFbCBncmFmaWNvIGluaWNpYWwgYSB1c2FyIGVzIGVsIGhpc3RvZ3JhbWE6CmxpYnJhcnkoZ2dwbG90MikKYmFzZTE9Z2dwbG90KG1pbmVyaWEsYWVzKHg9YWNjaWRlbnRlcykpCmhpc3ROdW09IGJhc2UxICsgZ2VvbV9oaXN0b2dyYW0oYmlucz03KSAKaGlzdE51bSAKTGEgZXhwbG9yYWNpw7NuIG51bcOpcmljYSBub3MgZGViZSBzdWdlcmlyOgoKU2kgbGEgbWVkaWEgZXMgcmVwcmVzZW50YXRpdm8gbyBuby4KU2kgaGF5IGFzaW1ldHLDrWEsIHkgaGFjaWEgZG9uZGUgc2UgY29uY2VudHJhbiBsb3MgZGF0b3MuClNpIGhheSB2YWxvcmVzIGF0w61waWNvcy4KRGVsIGdyw6FmaWNvIHBvZGVtb3MgZGVjaXIgcXVlLCBjb21vIG5vIGVzIHNpbcOpdHJpY28sIGluZm9ybWFyIGxhIG1lZGlhIGRlIGFjY2lkZW50ZXMgbm8gc2Vyw6EgbXV5IHJlcHJlc2VudGF0aXZhIChsYSBtZWRpYW5hIHNlcsOhIGxhIG1lam9yIG9wY2nDs24pOyBwb3Igb3RybyBsYWRvLCBjb21vIGxhIGFzaW1ldHLDrWEgbm9zIG11ZXN0cmEgcXVlIGxvcyBhY2NpZGVudGVzIHNvbiBlbiBzdSBtYXlvcsOtYSBwb2Nvcy4gSGF5IHVuIG51bWVybyBkZSBhY2NpZGVudGVzIHF1ZSBzZSBhbGVqYSBoYWNpYSB2YWxvcmVzIGFsdG9zLCBwZXJvIG5vIGVzdGFtb3Mgc2VndXJvcyBzaSBlc3TDoSB0YW4gbGVqb3MgZGVsIOKAmGNlbnRyb+KAmSBwYXJhIHNlciBhdMOtcGljby4KCkxvcyBhdMOtcGljb3Mgc2UgdmVuIGNsYXJhbWVudGUgZW4gdW4gYm94cGxvdDoKCmJhc2UyPWdncGxvdChtaW5lcmlhLGFlcyh5PWFjY2lkZW50ZXMpKQpib3g9YmFzZTIgKyBnZW9tX2JveHBsb3QoKSArIGNvb3JkX2ZsaXAoKQoKYm94IAphcXVpIHZhIGdyYWZpY28KCgoKCgoKVGhpcyBpcyBhbiBbUiBNYXJrZG93bl0oaHR0cDovL3JtYXJrZG93bi5yc3R1ZGlvLmNvbSkgTm90ZWJvb2suIFdoZW4geW91IGV4ZWN1dGUgY29kZSB3aXRoaW4gdGhlIG5vdGVib29rLCB0aGUgcmVzdWx0cyBhcHBlYXIgYmVuZWF0aCB0aGUgY29kZS4gCgpUcnkgZXhlY3V0aW5nIHRoaXMgY2h1bmsgYnkgY2xpY2tpbmcgdGhlICpSdW4qIGJ1dHRvbiB3aXRoaW4gdGhlIGNodW5rIG9yIGJ5IHBsYWNpbmcgeW91ciBjdXJzb3IgaW5zaWRlIGl0IGFuZCBwcmVzc2luZyAqQ3RybCtTaGlmdCtFbnRlciouIAoKYGBge3J9CnBsb3QoY2FycykKYGBgCgpBZGQgYSBuZXcgY2h1bmsgYnkgY2xpY2tpbmcgdGhlICpJbnNlcnQgQ2h1bmsqIGJ1dHRvbiBvbiB0aGUgdG9vbGJhciBvciBieSBwcmVzc2luZyAqQ3RybCtBbHQrSSouCgpXaGVuIHlvdSBzYXZlIHRoZSBub3RlYm9vaywgYW4gSFRNTCBmaWxlIGNvbnRhaW5pbmcgdGhlIGNvZGUgYW5kIG91dHB1dCB3aWxsIGJlIHNhdmVkIGFsb25nc2lkZSBpdCAoY2xpY2sgdGhlICpQcmV2aWV3KiBidXR0b24gb3IgcHJlc3MgKkN0cmwrU2hpZnQrSyogdG8gcHJldmlldyB0aGUgSFRNTCBmaWxlKS4KClRoZSBwcmV2aWV3IHNob3dzIHlvdSBhIHJlbmRlcmVkIEhUTUwgY29weSBvZiB0aGUgY29udGVudHMgb2YgdGhlIGVkaXRvci4gQ29uc2VxdWVudGx5LCB1bmxpa2UgKktuaXQqLCAqUHJldmlldyogZG9lcyBub3QgcnVuIGFueSBSIGNvZGUgY2h1bmtzLiBJbnN0ZWFkLCB0aGUgb3V0cHV0IG9mIHRoZSBjaHVuayB3aGVuIGl0IHdhcyBsYXN0IHJ1biBpbiB0aGUgZWRpdG9yIGlzIGRpc3BsYXllZC4K