Le jeu de donnée est les résultats comptables de 3985 exploitations issus du Réseau d’Information Comptable Agricole (RICA)
Nous chargeons dans un premier temps le jeu de données simlifié, en ajoutant certaines colonnes (‘OTEXE’, ’ Type d’exploitation’,‘PITOT’ correspondant à l’intraconsommation ) à partir du jeu de données complet de 988 variables. Nous ajoutons aussi une colonne UGB volailles, à partir des colonnes UGB Total et UGB Bovin, Ovins, Caprins et Porcins (soustraction), ainsi que les nouveaux noms de régions.
Nous regardons dans un premier temps le nombre d’exploitations en fonction de(s) l’espèce(s) élevée(s) (nous comptons qu’une exploitation élève un type d’animal à partir de 5 UGB pour cet animal) : nous obtenons le tableau suivant pour les exploitations élevant une ou deux espèces.
| Bovins | Ovins | Porcins | Volailles | Caprins | |
|---|---|---|---|---|---|
| Bovins | 2850 | 201 | 144 | 324 | 56 |
| Ovins | 541 | 8 | 54 | 14 | |
| Porcins | 353 | 30 | 0 | ||
| Volailles | 770 | 9 | |||
| Caprins | 145 |
Nous observons donc une plus grande majorité d’élevage bovin qui peuvent être spécialisés ou mixtes. Les élevages spécialisés sont majoritaires.
Pour information, pour les nombres exploitations élevant plus de 5
UGB de trois espèces distinctes, les valeurs non nulles sont les
suivantes :
- Ovins, Volailles, Caprins : 2 exploitations
- Bovins, Ovins, Volailles : 31 exploitations
- Bovins, Volailles, Caprins : 3 exploitations
- Bovins, Ovins, Caprins : 6 exploitations
- Bovins, Ovins, Porcins : 4 exploitations
- Bovins, Ovins, Volailles, Caprins : 1
exploitation
La répartition des exploitations en fonction du nombre d’UGB Total
sur les exploitations donne le graphe suivant:
Nous observons deux choses : d’abord, que la variable UGBTO n’est pas
une variable réellement quantitative, mais une variable qualitative avec
certains choix de classes. Par exemple, les valeurs de UGBTO=400
correspondent à la moyenne des valeurs d’UGBTO comprises entre 375 et
425. Pour régler ce problème, nous créons des classes d’UGB qui pourront
servir en tant que variables qualitatives lors de futures ACP.
Aussi, certaines des exploitations possèdent moins de 10 UGB. Nous
décidons de les exclure de notre analyse (pourquoi?compléter)
Nous pouvons décomposer la répartition des exploitations en fonction du nombre d’animaux qu’ils possèdent en fonction des différentes espèces : on voit alors que la répartition globale est fortement impactée par les exploitations bovines, majoritaires :
Pour rappel, “500” signifie “500 et plus”. Compléter commentaire sur répartition espèces (notamment Porcins et Volailles plein de 500+
Nous avons ensuite regardé le nombre moyen d’UGB (total) pour chaque type d’exploitation (*moyenne pour chaque type d’exploitation représentée sur le graphe en rouge) (pour rappel les rectangles des boxplot sont délimités par les premier et troisième quartile:
à compléter interpréation
Nous nous sommes ensuite intéressés aux régions pour voir si le nombre d’UGB leur était lié, pour les UGB Totaux et les différentes espèces (différents UGB):
graphes suivants plutôt faire un facewerap pour qu’il y ait une légende commune aux 4 graphes plutôt que de la remettre à chaque fois
à compléter description (bretagne c bcp, porcs souvent bcp, etc)
Aussi, en observant la colonne SAUTI (def SAUTI ** à compléter **), nous avons observé que le problème de “fausses classes” était le même que pour les UGB. Nous avons donc créé une colonne de SAUTI par classes.
** à compléter ** : on ajoute descrption données et SAU? Genre type d’exploitation etc? en mode polycult élevage a plus de surfaces etc? Sinon on verra dansles acp jsp
## [1] 293
## Warning: ggrepel: 7 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps
On observe: -Les charges totales fossiles sont fortement corrélées à
SUT1GCFOU -LANMX : le loyer des animaux n’est corrélé à aucune autre
variable. -Les achats d’aliments grossiers (ACHAG) ne sont pas corrélés
à d’autres variables que celles qu’elles composent (Charges d’aliments
grossiers car peu de variations de stock) -Toutes les variables du bilan
comptable sont fortement corrélées entre elles
(CHRTO,PBRTO,VAPBR,EBEXP,RESEX,CHSOX). L’intraconsommation de produits
végétaux pour les animaux (Intraconsommation_animaux) est corrélée aux
éléments comptables ((CHRTO,PBRTO,VAPBR,EBEXP,RESEX), car elle permet
une réduction des charges tout en permettant une production de produits
animaux. Elle est décorrélée des surface.
On trace la même ACP avec les variables bien représentées en noires et celles moins bien représentées sont en grise et seront retirées pour la prochaine ACP
## Warning in plot.PCA(res.PCA44, choix = "var", habillage = "Type_exploitation",
## : Habillage must be in c('contrib','cos2','none')
## [1] "NREG" "OTEXE" "IDNUM"
## [4] "PBUCE" "CDEXE" "OTE64F"
## [7] "REGIO" "ZDEFA" "TRA05"
## [10] "UTANS" "UTATO" "UGBBO"
## [13] "UGBCA" "UGBOV" "UGBPO"
## [16] "UGBTO" "SAUTI" "SFPTO"
## [19] "SUT1GCU" "SUT1CFOU" "SUT3PTEM"
## [22] "SUT3PPER" "CHRGTO" "CHSOX"
## [25] "PBRTO" "VAPBR" "EBEXP"
## [28] "RESEX" "CHREN" "CHRAM"
## [31] "CHRSE" "CHRPH" "CHRAC"
## [34] "CHRAG" "CHRPV" "Total_charges_fossiles"
## [37] "TCULT" "TELEV" "ELECT"
## [40] "CAGR1" "ENTB+EMTMT" "CAGR3"
## [43] "LANMX" "LFERM+LMATE" "SUBEX"
## [46] "PITOT" "INTVH" "INTVP"
## [49] "INTVV" "ACHAG" "ACHAC"
## [52] "Type_exploitation" "SFP" "REGIONS"
## [55] "UGBVO" "ACHA_SOMME" "Intra_conso_animaux"
## [58] "CHRATO" "UGBTO_classe" "UGBBO_classe"
## [61] "UGBOV_classe" "UGBCA_classe" "UGBPO_classe"
## [64] "UGBVO_classe" "SAUTI_classe"
## Warning: ggrepel: 16 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps
Nous avons réalisé une nouvelle ACP sans le type d’exploitation
“granivore” pour voir si elle influençait les résultats de l’ACP. Les
exploitations qui se distinguent le plus sont les exploitations bovines
( viande et mixte) et petits ruminants possèdant plus de SFP par rapport
aux autres exploitations. Les exploitations bovines laitières ne sont
pas bien représentées. Les exploitations de poly élevage ont plus de
charges alimentaires, ce qui est cohérent avec l’ACP précédente.
Nous nous intéressons désormais aux Achats alimentaires. Celles-ci (charges d’aliments concentrés ‘CHRAC’ et grossiers ‘CHRAG’) sont liées à l’alimentation du troupeau. Nous avons créé une variable ‘ACHA_SOMME’ de la somme de ces deux charges. Dans un premier temps, nous pouvons comparer les Achats alimentaires pour différents types d’exploitation : en premier, la somme, puis les deux types d’aliments (concentrés et grossiers) :
à facetwrapper
En dehors du fait que l’échelle est écrasée par les valeurs très élevées
de charges des élevages granivores,on observe que les charges dépendent
fortement du type d’exploitation, et ce, en grande partie parce que les
exploitations ont des nombre d’animaux à nourrir très différents. Pour
réellement savoir si les exploitations reposent sur ces charges pour
nourrir leurs animaux, nous créons des variables de charge par unité
d’UGB (on divise ces charges par le nombre total d’UGB). En effet, on
voit bien que les charges augmentent en fonction du nombre total d’UGB,
ce qui est logique (et on a vu précédemment que les différents types
d’exploitation avaient des nombre d’UGB distincts).
On trace les mêmes graphes de charges par type d’exploitation, mais désormais les charges sont divisées par le nombre d’UGB total pour chaque exploitation :
à compléter
Pour construire un modèle ayant comme variable à expliquer les Achats alimentaires, nous regardons dans un premier temps les relations (analyse bivariée) entre les Achats alimentaires et les autres variables :
## `geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'
## `geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'
## `geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'
On observe dans le premier graphe que les explotations granivores se distinguent des autres, probablement parce que à compléter à compléter sur autres graphes et interprétation (# UGB de 500 + se distingue également )
Séparer en sous classes :
## Warning: ggrepel: 13 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps
## Warning in plot.PCA(res.PCA_sous_classe, choix = "var", habillage =
## "Grande_classe", : Habillage must be in c('contrib','cos2','none')
## Warning: ggrepel: 3 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps
## Warning in plot.PCA(res.PCA_sous_classe, choix = "var", habillage =
## "Grande_classe", : Habillage must be in c('contrib','cos2','none')
## [1] "NREG" "OTEXE"
## [3] "IDNUM" "PBUCE"
## [5] "CDEXE" "OTE64F"
## [7] "REGIO" "ZDEFA"
## [9] "TRA05" "UTANS"
## [11] "UTATO" "UGBBO"
## [13] "UGBCA" "UGBOV"
## [15] "UGBPO" "UGBTO"
## [17] "SAUTI" "SFPTO"
## [19] "SUT1GCU" "SUT1CFOU"
## [21] "SUT3PTEM" "SUT3PPER"
## [23] "CHRGTO" "CHSOX"
## [25] "PBRTO" "VAPBR"
## [27] "EBEXP" "RESEX"
## [29] "CHREN" "CHRAM"
## [31] "CHRSE" "CHRPH"
## [33] "CHRAC" "CHRAG"
## [35] "CHRPV" "Total_charges_fossiles"
## [37] "TCULT" "TELEV"
## [39] "ELECT" "CAGR1"
## [41] "ENTB+EMTMT" "CAGR3"
## [43] "LANMX" "LFERM+LMATE"
## [45] "SUBEX" "PITOT"
## [47] "INTVH" "INTVP"
## [49] "INTVV" "ACHAG"
## [51] "ACHAC" "Type_exploitation"
## [53] "SFP" "REGIONS"
## [55] "UGBVO" "ACHA_SOMME"
## [57] "Intra_conso_animaux" "CHRATO"
## [59] "UGBTO_classe" "UGBBO_classe"
## [61] "UGBOV_classe" "UGBCA_classe"
## [63] "UGBPO_classe" "UGBVO_classe"
## [65] "SAUTI_classe" "ACHA_SOMME_UGBTO"
## [67] "ACHAG_UGBTO" "ACHAC_UGBTO"
## [69] "ratio_Achat" "ratio_intraconsommation_animaux"
## [71] "Grande_classe"
à compléter commentaires graphes bivar
A l’aune de ces analyses, nous créons un modèle linéaire. Les variables explicatives choisies sont àcompléter
## Start: AIC=87039.96
## ACHA_SOMME ~ log(SFP + 1)
##
## Df Sum of Sq RSS AIC
## <none> 1.1828e+14 87040
## - log(SFP + 1) 1 1.2651e+13 1.3093e+14 87403
## 2 6 22 31 45 63 68 71 92 108 153 160 161 174 243 320
## 2 6 20 28 40 54 58 61 79 93 131 136 137 148 212 282
## 375 488 569 580 584 600 646 652 688 714 762 789 792 819 822 831
## 331 432 508 519 523 539 579 585 620 645 691 714 717 743 746 754
## 856 864 893 899 919 943 945 955 963 972 1086 1107 1180 1235 1307 1310
## 778 786 815 820 840 863 865 875 883 892 1004 1025 1098 1147 1214 1217
## 1353 1376 1387 1424 1470 1494 1571 1579 1599 1606 1632 1658 1660 1691 1721 1748
## 1258 1280 1291 1327 1371 1393 1459 1467 1483 1489 1514 1536 1538 1566 1595 1621
## 1785 1829 1866 1867 1879 1880 1897 1905 1910 1916 1920 1921 1934 1950 1961 1964
## 1651 1689 1721 1722 1733 1734 1749 1755 1760 1765 1769 1770 1782 1796 1805 1808
## 1972 1985 1986 1989 1997 1999 2000 2004 2007 2008 2009 2012 2015 2022 2025 2029
## 1814 1827 1828 1831 1839 1841 1842 1845 1848 1849 1850 1853 1856 1862 1865 1868
## 2030 2038 2040 2043 2053 2057 2059 2063 2064 2068 2081 2084 2085 2096 2104 2108
## 1869 1876 1878 1881 1890 1894 1896 1899 1900 1903 1914 1917 1918 1928 1936 1940
## 2120 2128 2133 2141 2142 2144 2147 2151 2155 2156 2164 2168 2170 2174 2179 2181
## 1949 1957 1961 1968 1969 1971 1974 1978 1982 1983 1991 1995 1996 2000 2004 2006
## 2183 2190 2191 2192 2195 2196 2198 2200 2202 2204 2205 2208 2210 2211 2212 2218
## 2007 2014 2015 2016 2018 2019 2021 2022 2024 2025 2026 2029 2031 2032 2033 2038
## 2229 2230 2231 2233 2235 2242 2243 2245 2249 2260 2264 2271 2272 2274 2275 2277
## 2049 2050 2051 2053 2055 2062 2063 2065 2068 2078 2081 2088 2089 2091 2092 2094
## 2280 2283 2284 2287 2288 2412 2458 2483 2497 2516 2592 2626 2636 2671 2686 2700
## 2097 2100 2101 2104 2105 2205 2245 2265 2277 2293 2358 2383 2391 2420 2435 2448
## 2746 2747 2787 2788 2795 2818 2820 2829 2860 2884 2911 2947 2950 2968 3019 3282
## 2485 2486 2520 2521 2528 2548 2550 2559 2586 2607 2632 2667 2670 2688 2732 2973
## 3287 3394 3524 3540 3568 3647 3648 3652 3673 3675 3793 3832 3869 3902 3905 3908
## 2978 3072 3184 3197 3222 3296 3297 3301 3320 3322 3425 3461 3493 3524 3527 3530
##Etude des charges énergétiques fossiles##
à compléter def de nos charges fossiles avec la somme
Analyses bivariées à faire
Nous avons réalisé une ACP à compléter et expliquer:
## Warning in plot.PCA(res.PCA, choix = "var", habillage = "Type_exploitation", :
## Habillage must be in c('contrib','cos2','none')
Nous avons donc fait un modèle …. à compléter
##Etude des facteurs économiques## On choisit quoi ? EBE? Produit sans les subventions? A discuter.
## OTEXE n
## 1 15 166
## 2 16 131
## 3 45 825
## 4 46 647
## 5 47 208
## 6 48 381
## 7 50 560
## 8 61 28
## 9 73 58
## 10 74 73
## 11 83 386
## 12 84 131
à compléter ######################### Modèle Résultats économiques ##########################