Emufinal

library(s20x)
emu.df = read.table('emu.txt', header = TRUE)
summary(emu.df)

     height          weight      
 Min.   :1.009   Min.   : 27.02  
 1st Qu.:1.255   1st Qu.: 37.34  
 Median :1.519   Median : 45.01  
 Mean   :1.451   Mean   : 47.40  
 3rd Qu.:1.594   3rd Qu.: 50.83  
 Max.   :1.831   Max.   :108.86

plot(weight ~ height, data = emu.df)
abline(a=-15.33, b=43.23, col="red")

Exploratory Analysis:

The mean emu height in this sample is 1.45 meters, and the mean weight is approximately 47.4 kilograms. There is a moderately strong linear relationship between the height and the weight of an emu, and the scatter is relatively constant. There is one unusual value, with a weight of over 100 kilograms, and a height of about 1.6 meters.

emu.fit = lm(weight ~ height, data = emu.df)

plot(emu.fit, which=1)

modcheck(emu.fit)

summary(emu.fit)


Call:
lm(formula = weight ~ height, data = emu.df)

Residuals:
    Min      1Q  Median      3Q     Max 
-12.022  -8.309  -3.633   3.284  53.970 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)  
(Intercept)   -15.33      23.05  -0.665   0.5155  
height         43.23      15.69   2.756   0.0141 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 15.49 on 16 degrees of freedom
Multiple R-squared:  0.3219,    Adjusted R-squared:  0.2796 
F-statistic: 7.597 on 1 and 16 DF,  p-value: 0.01405

confint(emu.fit)

                 2.5 %   97.5 %
(Intercept) -64.194057 33.53649
height        9.980616 76.48495

plot(weight ~ height, main="Emu height vs weight", data = emu.df)
abline(emu.fit)

# Check for effect of dropping observation 11
emu.fit2 <- lm(weight ~ height, data = emu.df[-11, ])
summary(emu.fit2)


Call:
lm(formula = weight ~ height, data = emu.df[-11, ])

Residuals:
    Min      1Q  Median      3Q     Max 
-10.769  -4.606  -1.195   4.491  13.390 

Coefficients:
            Estimate Std. Error t value Pr(>|t|)    
(Intercept)   -3.386      9.907  -0.342 0.737215    
height        32.741      6.786   4.825 0.000223 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 6.591 on 15 degrees of freedom
Multiple R-squared:  0.6082,    Adjusted R-squared:  0.582 
F-statistic: 23.28 on 1 and 15 DF,  p-value: 0.0002227

predheight.df = data.frame(height = 1.5)
predict(emu.fit, predheight.df, interval = "prediction")

       fit      lwr      upr
1 49.52039 15.74109 83.29969

Methods and Assumptions Check:

Given the scatter is relatively consistent, a linear model was fitted. The data appears to be independently collected. The equality of variance and normality assumptions are met. While point 11 had a significance greater than 0.4 in the Cooks plot, when it was removed, the change was less than one standard error, so this point was in the final analysis as it did not have undue influence. Our final model is \(weight = \beta_0 + \beta_1 × height+ \epsilon_i\) where \(\overset{\mathrm{iid}}{\sim} N(0, \sigma^2)\).

Executive Summary:

The aim is to investigate the relationship between height and weight of emus, and estimate the weight of a specific emu. We found that there is a positive correlation between the height and weight of an emu. We carried out a predication for the weight of an emu with the height of 1.5 meters, and it gave us a range of 15.7 to 83.3 kilograms. Our model can explain 31% of the variation.

LS0tDQp0aXRsZTogIkVtdWZpbmFsIg0Kb3V0cHV0OiBodG1sX25vdGVib29rDQotLS0NCg0KYGBge3J9DQpsaWJyYXJ5KHMyMHgpDQplbXUuZGYgPSByZWFkLnRhYmxlKCdlbXUudHh0JywgaGVhZGVyID0gVFJVRSkNCnN1bW1hcnkoZW11LmRmKQ0KcGxvdCh3ZWlnaHQgfiBoZWlnaHQsIGRhdGEgPSBlbXUuZGYpDQphYmxpbmUoYT0tMTUuMzMsIGI9NDMuMjMsIGNvbD0icmVkIikNCmBgYA0KDQojIyBFeHBsb3JhdG9yeSBBbmFseXNpczoNCg0KVGhlIG1lYW4gZW11IGhlaWdodCBpbiB0aGlzIHNhbXBsZSBpcyAxLjQ1IG1ldGVycywgYW5kIHRoZSBtZWFuIHdlaWdodCBpcyBhcHByb3hpbWF0ZWx5IDQ3LjQga2lsb2dyYW1zLiBUaGVyZSBpcyBhIG1vZGVyYXRlbHkgc3Ryb25nIGxpbmVhciByZWxhdGlvbnNoaXAgYmV0d2VlbiB0aGUgaGVpZ2h0IGFuZCB0aGUgd2VpZ2h0IG9mIGFuIGVtdSwgYW5kIHRoZSBzY2F0dGVyIGlzIHJlbGF0aXZlbHkgY29uc3RhbnQuIFRoZXJlIGlzIG9uZSB1bnVzdWFsIHZhbHVlLCB3aXRoIGEgd2VpZ2h0IG9mIG92ZXIgMTAwIGtpbG9ncmFtcywgYW5kIGEgaGVpZ2h0IG9mIGFib3V0IDEuNiBtZXRlcnMuDQpgYGB7cn0NCmVtdS5maXQgPSBsbSh3ZWlnaHQgfiBoZWlnaHQsIGRhdGEgPSBlbXUuZGYpDQoNCmBgYA0KYGBge3J9DQpwbG90KGVtdS5maXQsIHdoaWNoPTEpDQptb2RjaGVjayhlbXUuZml0KQ0Kc3VtbWFyeShlbXUuZml0KQ0KY29uZmludChlbXUuZml0KQ0KcGxvdCh3ZWlnaHQgfiBoZWlnaHQsIG1haW49IkVtdSBoZWlnaHQgdnMgd2VpZ2h0IiwgZGF0YSA9IGVtdS5kZikNCmFibGluZShlbXUuZml0KQ0KDQpgYGANCg0KDQpgYGB7cn0NCiMgQ2hlY2sgZm9yIGVmZmVjdCBvZiBkcm9wcGluZyBvYnNlcnZhdGlvbiAxMQ0KZW11LmZpdDIgPC0gbG0od2VpZ2h0IH4gaGVpZ2h0LCBkYXRhID0gZW11LmRmWy0xMSwgXSkNCnN1bW1hcnkoZW11LmZpdDIpDQoNCnByZWRoZWlnaHQuZGYgPSBkYXRhLmZyYW1lKGhlaWdodCA9IDEuNSkNCnByZWRpY3QoZW11LmZpdCwgcHJlZGhlaWdodC5kZiwgaW50ZXJ2YWwgPSAicHJlZGljdGlvbiIpDQpgYGANCg0KIyMgTWV0aG9kcyBhbmQgQXNzdW1wdGlvbnMgQ2hlY2s6DQoNCkdpdmVuIHRoZSBzY2F0dGVyIGlzIHJlbGF0aXZlbHkgY29uc2lzdGVudCwgYSBsaW5lYXIgbW9kZWwgd2FzIGZpdHRlZC4gVGhlIGRhdGEgYXBwZWFycyB0byBiZSBpbmRlcGVuZGVudGx5IGNvbGxlY3RlZC4gVGhlIGVxdWFsaXR5IG9mIHZhcmlhbmNlIGFuZCBub3JtYWxpdHkgYXNzdW1wdGlvbnMgYXJlIG1ldC4gV2hpbGUgcG9pbnQgMTEgaGFkIGEgc2lnbmlmaWNhbmNlIGdyZWF0ZXIgdGhhbiAwLjQgaW4gdGhlIENvb2tzIHBsb3QsIHdoZW4gaXQgd2FzIHJlbW92ZWQsIHRoZSBjaGFuZ2Ugd2FzIGxlc3MgdGhhbiBvbmUgc3RhbmRhcmQgZXJyb3IsIHNvIHRoaXMgcG9pbnQgd2FzIGluIHRoZSBmaW5hbCBhbmFseXNpcyBhcyBpdCBkaWQgbm90IGhhdmUgdW5kdWUgaW5mbHVlbmNlLiBPdXIgZmluYWwgbW9kZWwgaXMgJHdlaWdodCA9IFxiZXRhXzAgKyBcYmV0YV8xIMOXIGhlaWdodCsgXGVwc2lsb25faSQgd2hlcmUgJFxvdmVyc2V0e1xtYXRocm17aWlkfX17XHNpbX0gTigwLCBcc2lnbWFeMikkLg0KDQojIyBFeGVjdXRpdmUgU3VtbWFyeToNCg0KVGhlIGFpbSBpcyB0byBpbnZlc3RpZ2F0ZSB0aGUgcmVsYXRpb25zaGlwIGJldHdlZW4gaGVpZ2h0IGFuZCB3ZWlnaHQgb2YgZW11cywgYW5kIGVzdGltYXRlIHRoZSB3ZWlnaHQgb2YgYSBzcGVjaWZpYyBlbXUuIFdlIGZvdW5kIHRoYXQgdGhlcmUgaXMgYSBwb3NpdGl2ZSBjb3JyZWxhdGlvbiBiZXR3ZWVuIHRoZSBoZWlnaHQgYW5kIHdlaWdodCBvZiBhbiBlbXUuIFdlIGNhcnJpZWQgb3V0IGEgcHJlZGljYXRpb24gZm9yIHRoZSB3ZWlnaHQgb2YgYW4gZW11IHdpdGggdGhlIGhlaWdodCBvZiAxLjUgbWV0ZXJzLCBhbmQgaXQgZ2F2ZSB1cyBhIHJhbmdlIG9mIDE1LjcgdG8gODMuMyBraWxvZ3JhbXMuIE91ciBtb2RlbCBjYW4gZXhwbGFpbiAzMSUgb2YgdGhlIHZhcmlhdGlvbi4gDQo=