Primeira lista de Exercícios de Estatística Computacional 2

Análise Exploratória do conjunto de dados “USArrests”

data(USArrests)

#help(USArrests)
#Vai abrir uma página no internet explorer, vou te poupar deste problema.

head(USArrests)
##            Murder Assault UrbanPop Rape
## Alabama      13.2     236       58 21.2
## Alaska       10.0     263       48 44.5
## Arizona       8.1     294       80 31.0
## Arkansas      8.8     190       50 19.5
## California    9.0     276       91 40.6
## Colorado      7.9     204       78 38.7
tail(USArrests)
##               Murder Assault UrbanPop Rape
## Vermont          2.2      48       32 11.2
## Virginia         8.5     156       63 20.7
## Washington       4.0     145       73 26.2
## West Virginia    5.7      81       39  9.3
## Wisconsin        2.6      53       66 10.8
## Wyoming          6.8     161       60 15.6

a) Encontre as taxas mínimas, máximas, médias, medianas, e os primeiros e terceiros quartis para cada crime.

Primeiro iremos descobrir quais variáveis (crimes) contêm no dataset proposto

names(USArrests)
## [1] "Murder"   "Assault"  "UrbanPop" "Rape"

Criteriosamente, “Murder”, “Assault” e “Rape” são as variáveis de interesse da questão a). Vamos agora attachar o dataset para que não seja acometido nenhum tipo de alteração indesejada.

attach(USArrests)

Mínimos:

min(Murder)
## [1] 0.8
min(Assault)
## [1] 45
min(Rape)
## [1] 7.3

Máximos:

max(Murder)
## [1] 17.4
max(Assault)
## [1] 337
max(Rape)
## [1] 46

Médias:

mean(Murder)
## [1] 7.788
mean(Assault)
## [1] 170.76
mean(Rape)
## [1] 21.232

Medianas:

median(Murder)
## [1] 7.25
median(Assault)
## [1] 159
median(Rape)
## [1] 20.1

Quantis:

quantile(USArrests, na.rm = T)
##      0%     25%     50%     75%    100% 
##   0.800  12.575  42.300  81.000 337.000

b) Faça um gráfico adequado para a taxa de assassinatos (murder).

estados=rownames(USArrests)
barplot(Murder, names.arg = estados, las = 3, border = TRUE,col = rainbow(20))

c) Faça um diagrama de ramo-e-folhas para a taxa de estupros (rape).

stem(Murder)
## 
##   The decimal point is at the |
## 
##    0 | 8
##    2 | 11226672348
##    4 | 0349379
##    6 | 003682349
##    8 | 158007
##   10 | 04134
##   12 | 127022
##   14 | 444
##   16 | 14

d) Calcule as correlações entre as taxas dos diferentes tipos de crime.

cor(Murder, Rape)
## [1] 0.5635788
cor(Rape, Assault)
## [1] 0.6652412
cor(Assault,Murder)
## [1] 0.8018733

e) Calcule as correlações entre as taxas dos crimes e a proporção de população urbana.

cor(Murder, UrbanPop)
## [1] 0.06957262
cor(Rape, UrbanPop)
## [1] 0.4113412
cor(Assault,UrbanPop)
## [1] 0.2588717

f) Encontre os estados com maior e menor ocorrência de cada tipo de crime.

A solução que eu encontrei não é nem um pouco elegante, mas é funcional.

Estados<-rownames(USArrests)

novo.USArrest <- as.data.frame(cbind(USArrests,Estados))
head(novo.USArrest)
##            Murder Assault UrbanPop Rape    Estados
## Alabama      13.2     236       58 21.2    Alabama
## Alaska       10.0     263       48 44.5     Alaska
## Arizona       8.1     294       80 31.0    Arizona
## Arkansas      8.8     190       50 19.5   Arkansas
## California    9.0     276       91 40.6 California
## Colorado      7.9     204       78 38.7   Colorado
attach(novo.USArrest)
## The following object is masked _by_ .GlobalEnv:
## 
##     Estados
## The following objects are masked from USArrests:
## 
##     Assault, Murder, Rape, UrbanPop
Estados[which.max(Murder)]
## [1] "Georgia"
Estados[which.min(Murder)]
## [1] "North Dakota"
Estados[which.max(Rape)]
## [1] "Nevada"
Estados[which.min(Rape)]
## [1] "North Dakota"
Estados[which.max(Assault)]
## [1] "North Carolina"
Estados[which.min(Assault)]
## [1] "North Dakota"

Isso mesmo, eu criei um novo dataframe contendo uma nova variável com todos os estados.

g) Encontre os estados com maior e menor ocorrência da soma entre as taxas de todos os crimes.

Supondo a população urbana

novo.USArrest <- transform(novo.USArrest, Taxa = (Murder+Assault+Rape)/UrbanPop)

novo.USArrest
##                Murder Assault UrbanPop Rape        Estados      Taxa
## Alabama          13.2     236       58 21.2        Alabama 4.6620690
## Alaska           10.0     263       48 44.5         Alaska 6.6145833
## Arizona           8.1     294       80 31.0        Arizona 4.1637500
## Arkansas          8.8     190       50 19.5       Arkansas 4.3660000
## California        9.0     276       91 40.6     California 3.5780220
## Colorado          7.9     204       78 38.7       Colorado 3.2128205
## Connecticut       3.3     110       77 11.1    Connecticut 1.6155844
## Delaware          5.9     238       72 15.8       Delaware 3.6069444
## Florida          15.4     335       80 31.9        Florida 4.7787500
## Georgia          17.4     211       60 25.8        Georgia 4.2366667
## Hawaii            5.3      46       83 20.2         Hawaii 0.8614458
## Idaho             2.6     120       54 14.2          Idaho 2.5333333
## Illinois         10.4     249       83 24.0       Illinois 3.4144578
## Indiana           7.2     113       65 21.0        Indiana 2.1723077
## Iowa              2.2      56       57 11.3           Iowa 1.2192982
## Kansas            6.0     115       66 18.0         Kansas 2.1060606
## Kentucky          9.7     109       52 16.3       Kentucky 2.5961538
## Louisiana        15.4     249       66 22.2      Louisiana 4.3424242
## Maine             2.1      83       51  7.8          Maine 1.8215686
## Maryland         11.3     300       67 27.8       Maryland 5.0611940
## Massachusetts     4.4     149       85 16.3  Massachusetts 1.9964706
## Michigan         12.1     255       74 35.1       Michigan 4.0837838
## Minnesota         2.7      72       66 14.9      Minnesota 1.3575758
## Mississippi      16.1     259       44 17.1    Mississippi 6.6409091
## Missouri          9.0     178       70 28.2       Missouri 3.0742857
## Montana           6.0     109       53 16.4        Montana 2.4792453
## Nebraska          4.3     102       62 16.5       Nebraska 1.9806452
## Nevada           12.2     252       81 46.0         Nevada 3.8296296
## New Hampshire     2.1      57       56  9.5  New Hampshire 1.2250000
## New Jersey        7.4     159       89 18.8     New Jersey 2.0808989
## New Mexico       11.4     285       70 32.1     New Mexico 4.6928571
## New York         11.1     254       86 26.1       New York 3.3860465
## North Carolina   13.0     337       45 16.1 North Carolina 8.1355556
## North Dakota      0.8      45       44  7.3   North Dakota 1.2068182
## Ohio              7.3     120       75 21.4           Ohio 1.9826667
## Oklahoma          6.6     151       68 20.0       Oklahoma 2.6117647
## Oregon            4.9     159       67 29.3         Oregon 2.8835821
## Pennsylvania      6.3     106       72 14.9   Pennsylvania 1.7666667
## Rhode Island      3.4     174       87  8.3   Rhode Island 2.1344828
## South Carolina   14.4     279       48 22.5 South Carolina 6.5812500
## South Dakota      3.8      86       45 12.8   South Dakota 2.2800000
## Tennessee        13.2     188       59 26.9      Tennessee 3.8661017
## Texas            12.7     201       80 25.5          Texas 2.9900000
## Utah              3.2     120       80 22.9           Utah 1.8262500
## Vermont           2.2      48       32 11.2        Vermont 1.9187500
## Virginia          8.5     156       63 20.7       Virginia 2.9396825
## Washington        4.0     145       73 26.2     Washington 2.4000000
## West Virginia     5.7      81       39  9.3  West Virginia 2.4615385
## Wisconsin         2.6      53       66 10.8      Wisconsin 1.0060606
## Wyoming           6.8     161       60 15.6        Wyoming 3.0566667
attach(novo.USArrest)
## The following object is masked _by_ .GlobalEnv:
## 
##     Estados
## The following objects are masked from novo.USArrest (pos = 3):
## 
##     Assault, Estados, Murder, Rape, UrbanPop
## The following objects are masked from USArrests:
## 
##     Assault, Murder, Rape, UrbanPop
Estados[which.min(Taxa)]
## [1] "Hawaii"

Supondo apenas os numeros totais

USArrests$UrbanPop <- NULL

which.min(rowSums(USArrests))
## North Dakota 
##           34