En esta parte del proyecto se realizara la identificacion de cada variable y se identificara como cualitativa o cuantitativa. El numero de variables de la base de datos es de nueve variables las cuales se las clasifica a continuacion:
library(readxl)
Cuesvas <- read_excel("Cuesvas.xlsx")
var(Cuesvas$Materia_organica)
## [1] 1.871879
var(Cuesvas$Fosforo)
## [1] 1.913119
var(Cuesvas$pH)
## [1] 2.19309
var(Cuesvas$Nitrogeno)
## [1] 0.02960419
var(Cuesvas$Potasio)
## [1] 19.17093
var(Cuesvas$Zinc)
## [1] 0.008142662
var(Cuesvas$Cobre)
## [1] 0.01069861
El color no presenta una varianza debido a que esta variable es de tipo caracter,cualitativa de intervalo.
Los estudiantes no se puede calcular la variaza,porque es de tipo cualitativa nominal.
De las anteriores varianzas se puede identificar que la que presenta una varianza mucho mas amplia es el protasio con una varianza de 19.17093.
range(Cuesvas$Materia_organica)
## [1] 0.7431697 7.1390254
range(Cuesvas$Fosforo)
## [1] -2.639723 3.976916
range(Cuesvas$pH)
## [1] 3.136701 10.034409
range(Cuesvas$Nitrogeno)
## [1] 0.06738298 0.66323450
range(Cuesvas$Potasio)
## [1] 412.2045 437.0507
range(Cuesvas$Zinc)
## [1] 1.047038 1.511698
range(Cuesvas$Cobre)
## [1] -0.1260551 0.4558800
De acuerdo a los anteriores valores de rango de cada una de las variables de la base de datos se puede identificar que se presenta un mayor rango es pH con un rango de:
Minimo=3.136701
Maximo=10.034409.
Ademas se puede evidenciar un error en las variables fosforo y cobre,debido a que en estas se presenta un valor menor a 1 o valor negativo lo cual es imposible que se produzca debido a que no pueden dar valores negativos en la toma de datos.