library(psych)
## Warning: package 'psych' was built under R version 3.5.3
agri2018=read.table("C:\\Users\\juanl\\Downloads\\agri2018.txt", header=TRUE )
agri2017=read.table("C:\\Users\\juanl\\Downloads\\agri2017.txt", header=TRUE )
agri2016=read.table("C:\\Users\\juanl\\Downloads\\agri2017.txt", header=TRUE )
names(agri2018)
## [1] "Sembrada" "Cosechada" "Siniestrada"
## [4] "Volumenproduccion" "Rendimiento" "Precio"
## [7] "Valorproduccion"
La presente investigación se refiere al análisis de datos de agricultura en Cajeme a través de los años, que se puede definir como análisis de los cultivos agrícolas en Cajeme en los últimos años. Se hace por el interés de saber la producción agrícola en Cajeme y saber su incremento disminución a través de los años, ya que se a dado los cosas de algunas partes del país donde la agricultura ha disminuido y además si hay algunos factores que dificultan la agricultura.
Antes de se deben de dar algunos datos de la agricultura de Cajeme, el municipio cuenta con aproximadamente 221,000 hectáreas de agricultura bajo riego, de las cuales el 58 por ciento son ejidales y el 42 por ciento de propiedad privada. El sector privado está representado por 4,645 propietarios y el sector social por 19,616 ejidatarios. 9 la actividad agrícola basa su producción principalmente en el cultivo de trigo, frijol, maíz, sorgo, frutales y hortalizas, básicamente.
Como se hará el trabajo es la abstracción de datos de los datos abiertos de agricultura del gobierno y por los distintos métodos estadísticos vistos en clase y algunos otros necesarios para el desarrollo de la investigación, se vera el crecimiento o disminución del sector agrícola. Pero uno de los principales aspectos negativos es que la información es muy estática y no proporciona lo necesario para lo que nos interesa que es los factores que hacen que se aumente o disminuye la producción agrícola en Cajeme, como el fertilizantes, el agua, la temporada, etc. Pero aun así es lo suficiente para ver el crecimiento en el área.
cor(agri2018)
## Sembrada Cosechada Siniestrada Volumenproduccion
## Sembrada 1.00000000 0.99995658 -0.019625111 0.93368591
## Cosechada 0.99995658 1.00000000 -0.019735074 0.93381124
## Siniestrada -0.01962511 -0.01973507 1.000000000 -0.01801764
## Volumenproduccion 0.93368591 0.93381124 -0.018017643 1.00000000
## Rendimiento -0.05633303 -0.05605792 -0.007232866 -0.03551952
## Precio -0.08207464 -0.08720549 0.005516818 -0.13033779
## Valorproduccion 0.87564410 0.87549937 -0.010711125 0.93902776
## Rendimiento Precio Valorproduccion
## Sembrada -0.056333034 -0.082074636 0.87564410
## Cosechada -0.056057915 -0.087205488 0.87549937
## Siniestrada -0.007232866 0.005516818 -0.01071112
## Volumenproduccion -0.035519520 -0.130337788 0.93902776
## Rendimiento 1.000000000 -0.088386189 -0.05366759
## Precio -0.088386189 1.000000000 -0.02105180
## Valorproduccion -0.053667588 -0.021051801 1.00000000
cor(agri2017)
## Sembrada Cosechada Siniestrada Volumenproduccion
## Sembrada 1.00000000 0.99958036 0.01142070 0.96364741
## Cosechada 0.99958036 1.00000000 -0.01266482 0.96456563
## Siniestrada 0.01142070 -0.01266482 1.00000000 -0.02624550
## Volumenproduccion 0.96364741 0.96456563 -0.02624550 1.00000000
## Rendimiento -0.04681779 -0.04594395 -0.01485193 -0.02650015
## Precio -0.06157500 -0.06965690 -0.01252855 -0.11014336
## Valorproduccion 0.92297576 0.92365062 -0.02870403 0.97213404
## Rendimiento Precio Valorproduccion
## Sembrada -0.04681779 -0.06157500 0.92297576
## Cosechada -0.04594395 -0.06965690 0.92365062
## Siniestrada -0.01485193 -0.01252855 -0.02870403
## Volumenproduccion -0.02650015 -0.11014336 0.97213404
## Rendimiento 1.00000000 -0.08296051 -0.04220749
## Precio -0.08296051 1.00000000 -0.02305412
## Valorproduccion -0.04220749 -0.02305412 1.00000000
cor(agri2016)
## Sembrada Cosechada Siniestrada Volumenproduccion
## Sembrada 1.00000000 0.99958036 0.01142070 0.96364741
## Cosechada 0.99958036 1.00000000 -0.01266482 0.96456563
## Siniestrada 0.01142070 -0.01266482 1.00000000 -0.02624550
## Volumenproduccion 0.96364741 0.96456563 -0.02624550 1.00000000
## Rendimiento -0.04681779 -0.04594395 -0.01485193 -0.02650015
## Precio -0.06157500 -0.06965690 -0.01252855 -0.11014336
## Valorproduccion 0.92297576 0.92365062 -0.02870403 0.97213404
## Rendimiento Precio Valorproduccion
## Sembrada -0.04681779 -0.06157500 0.92297576
## Cosechada -0.04594395 -0.06965690 0.92365062
## Siniestrada -0.01485193 -0.01252855 -0.02870403
## Volumenproduccion -0.02650015 -0.11014336 0.97213404
## Rendimiento 1.00000000 -0.08296051 -0.04220749
## Precio -0.08296051 1.00000000 -0.02305412
## Valorproduccion -0.04220749 -0.02305412 1.00000000
La relaciones de estos datos en algunos se ve que su relación es mucha y otras pocas, pero es por ser no muy relacionales, solo dos a tres variables en verdad tienen relación, pero nadie depende de la otra, esa es una de las principales problemas de la investigación y de los datos, mucho de ellos son independientes, se necesitarían mas datos relacionales a ellos, espero que en el desarrollo del proyecto nuestro asesor pueda contar con la información suficiente para eso.
str(agri2016)
## 'data.frame': 275 obs. of 7 variables:
## $ Sembrada : num 300 856 118 272 1303 ...
## $ Cosechada : num 300 856 118 272 1303 ...
## $ Siniestrada : int 0 0 0 0 0 0 22 0 0 11 ...
## $ Volumenproduccion: num 4590 2311 4295 5195 1535 ...
## $ Rendimiento : num 15.3 2.7 36.4 19.1 1.18 1.92 0 25.3 7.85 0 ...
## $ Precio : num 7541 6808 4323 6326 17252 ...
## $ Valorproduccion : num 34614016 15735482 18566861 32864887 26476136 ...
str(agri2017)
## 'data.frame': 275 obs. of 7 variables:
## $ Sembrada : num 300 856 118 272 1303 ...
## $ Cosechada : num 300 856 118 272 1303 ...
## $ Siniestrada : int 0 0 0 0 0 0 22 0 0 11 ...
## $ Volumenproduccion: num 4590 2311 4295 5195 1535 ...
## $ Rendimiento : num 15.3 2.7 36.4 19.1 1.18 1.92 0 25.3 7.85 0 ...
## $ Precio : num 7541 6808 4323 6326 17252 ...
## $ Valorproduccion : num 34614016 15735482 18566861 32864887 26476136 ...
str(agri2018)
## 'data.frame': 249 obs. of 7 variables:
## $ Sembrada : num 230 705 77 140 617 ...
## $ Cosechada : num 230 705 77 140 617 ...
## $ Siniestrada : int 0 0 0 0 0 0 0 0 0 0 ...
## $ Volumenproduccion: num 5788 1685 3068 2645 1209 ...
## $ Rendimiento : num 25.17 2.39 39.84 18.89 1.96 ...
## $ Precio : num 6802 7583 3100 5750 18580 ...
## $ Valorproduccion : num 39371076 12776352 9509808 15208750 22468984 ...
datosA2018 <- data.frame(agri2018$Sembrada,agri2018$Cosechada,agri2018$Siniestrada,agri2018$Valorproduccion,agri2018$Valorproduccion)
pairs(datosA2018)
La relación con los gráficos es la misma se ve que sembrado y cosecha es muy grande la relación. Porque es casi la misma, pero se ve perdida, pero mínima, cosecha y producción también, pero con el precio no, ya que es algo más independiente, aquí se necesitan esos nuevos datos, como crecimiento, productos, varianza de temporada. Quiero pensar que esos datos los podemos tener con un supervisor.
datosA2017 <- data.frame(agri2017$Sembrada,agri2017$Cosechada,agri2017$Siniestrada,agri2017$Valorproduccion,agri2017$Valorproduccion)
pairs(datosA2017)
No hay mucha diferencia entre años
datosA2016 <- data.frame(agri2016$Sembrada,agri2016$Cosechada,agri2016$Siniestrada,agri2016$Valorproduccion,agri2016$Valorproduccion)
pairs(datosA2016)
No hay mucha diferencia entre años
pairs.panels(agri2016[c(1,2)])
pairs.panels(agri2017[c(1,2)])
pairs.panels(agri2018[c(1,2)])
La relación entre las dos variables está cercana al 1 que mejor ponen como 1, aquí se ve que son casi las mismas variables
pairs.panels(agri2016[c(1,4)])
pairs.panels(agri2017[c(1,4)])
pairs.panels(agri2018[c(1,4)])
Aquí es grande la relación, pero no tan cerca al 1, no se redondea. Pero aquí se ve una variable de dependencia a la otra o de medio, porque si una es grande la otra también
pairs.panels(agri2016[c(1,5)])
pairs.panels(agri2017[c(1,5)])
pairs.panels(agri2018[c(1,5)])
Aquí se ve el punto más grande que decía, no tienen nada que ver, es negativo y con muy chico, nada de relación. Variables que son necesarias para lo que es el archivo, pero no para estos análisis
pairs.panels(agri2016[c(1,6)])
pairs.panels(agri2017[c(1,6)])
pairs.panels(agri2018[c(1,6)])
Aquí se ve el punto más grande que decía, no tienen nada que ver, es negativo y con muy chico, nada de relación. Variables que son necesarias para lo que es el archivo, pero no para estos análisis
pairs.panels(agri2016[c(1,7)])
pairs.panels(agri2017[c(1,7)])
pairs.panels(agri2018[c(1,7)])
Aquí es grande la relación, pero no tan cerca al 1, no se redondea. Pero aquí se ve una variable de dependencia a la otra o de medio, porque si una es grande la otra también