Introduction

Le jeu de donnée est les résultats comptables de 3985 exploitations issus du Réseau d’Information Comptable Agricole (RICA)

Nous chargeons dans un premier temps le jeu de données simlifié, en ajoutant certaines colonnes (‘OTEXE’, ’ Type d’exploitation’,‘PITOT’ correspondant à l’intraconsommation ) à partir du jeu de données complet de 988 variables. Nous ajoutons aussi une colonne UGB volailles, à partir des colonnes UGB Total et UGB Bovin, Ovins, Caprins et Porcins (soustraction), ainsi que les nouveaux noms de régions.

Présentation générale des données

Nous regardons dans un premier temps le nombre d’exploitations en fonction de(s) l’espèce(s) élevée(s) (nous comptons qu’une exploitation élève un type d’animal à partir de 5 UGB pour cet animal) : nous obtenons le tableau suivant pour les exploitations élevant une ou deux espèces.

Bovins Ovins Porcins Volailles Caprins
Bovins 2850 201 144 324 56
Ovins 541 8 54 14
Porcins 353 30 0
Volailles 770 9
Caprins 145

Nous observons donc une plus grande majorité d’élevage bovin qui peuvent être spécialisés ou mixtes. Les élevages spécialisés sont majoritaires.

Pour information, pour les nombres exploitations élevant plus de 5 UGB de trois espèces distinctes, les valeurs non nulles sont les suivantes :
- Ovins, Volailles, Caprins : 2 exploitations
- Bovins, Ovins, Volailles : 31 exploitations
- Bovins, Volailles, Caprins : 3 exploitations
- Bovins, Ovins, Caprins : 6 exploitations
- Bovins, Ovins, Porcins : 4 exploitations
- Bovins, Ovins, Volailles, Caprins : 1 exploitation

La répartition des exploitations en fonction du nombre d’UGB Total sur les exploitations donne le graphe suivant:

Nous observons deux choses : d’abord, que la variable UGBTO n’est pas une variable réellement quantitative, mais une variable qualitative avec certains choix de classes. Par exemple, les valeurs de UGBTO=400 correspondent à la moyenne des valeurs d’UGBTO comprises entre 375 et 425. Pour régler ce problème, nous créons des classes d’UGB qui pourront servir en tant que variables qualitatives lors de futures ACP.
Aussi, certaines des exploitations possèdent moins de 10 UGB. Nous décidons de les exclure de notre analyse (pourquoi?compléter)

Nous pouvons décomposer la répartition des exploitations en fonction du nombre d’animaux qu’ils possèdent en fonction des différentes espèces : on voit alors que la répartition globale est fortement impactée par les exploitations bovines, majoritaires :

Pour rappel, “500” signifie “500 et plus”. Compléter commentaire sur répartition espèces (notamment Porcins et Volailles plein de 500+

Nous avons ensuite regardé le nombre moyen d’UGB (total) pour chaque type d’exploitation (*moyenne pour chaque type d’exploitation représentée sur le graphe en rouge) (pour rappel les rectangles des boxplot sont délimités par les premier et troisième quartile:

à compléter interpréation

Nous nous sommes ensuite intéressés aux régions pour voir si le nombre d’UGB leur était lié, pour les UGB Totaux et les différentes espèces (différents UGB):

graphes suivants plutôt faire un facewerap pour qu’il y ait une légende commune aux 4 graphes plutôt que de la remettre à chaque fois

à compléter description (bretagne c bcp, porcs souvent bcp, etc)

Aussi, en observant la colonne SAUTI (def SAUTI ** à compléter **), nous avons observé que le problème de “fausses classes” était le même que pour les UGB. Nous avons donc créé une colonne de SAUTI par classes.

** à compléter ** : on ajoute descrption données et SAU? Genre type d’exploitation etc? en mode polycult élevage a plus de surfaces etc? Sinon on verra dansles acp jsp

Analyse préliminaire des OTEXE

## [1] 293

## Warning: ggrepel: 7 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

On observe: -Les charges totales fossiles sont fortement corrélées à SUT1GCFOU -LANMX : le loyer des animaux n’est corrélé à aucune autre variable. -Les achats d’aliments grossiers (ACHAG) ne sont pas corrélés à d’autres variables que celles qu’elles composent (Charges d’aliments grossiers car peu de variations de stock) -Toutes les variables du bilan comptable sont fortement corrélées entre elles (CHRTO,PBRTO,VAPBR,EBEXP,RESEX,CHSOX). L’intraconsommation de produits végétaux pour les animaux (Intraconsommation_animaux) est corrélée aux éléments comptables ((CHRTO,PBRTO,VAPBR,EBEXP,RESEX), car elle permet une réduction des charges tout en permettant une production de produits animaux. Elle est décorrélée des surface.

On trace la même ACP avec les variables bien représentées en noires et celles moins bien représentées sont en grise et seront retirées pour la prochaine ACP

## Warning in plot.PCA(res.PCA44, choix = "var", habillage = "Type_exploitation",
## : Habillage must be in c('contrib','cos2','none')

##  [1] "NREG"                   "OTEXE"                  "IDNUM"                 
##  [4] "PBUCE"                  "CDEXE"                  "OTE64F"                
##  [7] "REGIO"                  "ZDEFA"                  "TRA05"                 
## [10] "UTANS"                  "UTATO"                  "UGBBO"                 
## [13] "UGBCA"                  "UGBOV"                  "UGBPO"                 
## [16] "UGBTO"                  "SAUTI"                  "SFPTO"                 
## [19] "SUT1GCU"                "SUT1CFOU"               "SUT3PTEM"              
## [22] "SUT3PPER"               "CHRGTO"                 "CHSOX"                 
## [25] "PBRTO"                  "VAPBR"                  "EBEXP"                 
## [28] "RESEX"                  "CHREN"                  "CHRAM"                 
## [31] "CHRSE"                  "CHRPH"                  "CHRAC"                 
## [34] "CHRAG"                  "CHRPV"                  "Total_charges_fossiles"
## [37] "TCULT"                  "TELEV"                  "ELECT"                 
## [40] "CAGR1"                  "ENTB+EMTMT"             "CAGR3"                 
## [43] "LANMX"                  "LFERM+LMATE"            "SUBEX"                 
## [46] "PITOT"                  "INTVH"                  "INTVP"                 
## [49] "INTVV"                  "ACHAG"                  "ACHAC"                 
## [52] "Type_exploitation"      "SFP"                    "REGIONS"               
## [55] "UGBVO"                  "ACHA_SOMME"             "Intra_conso_animaux"   
## [58] "CHRATO"                 "UGBTO_classe"           "UGBBO_classe"          
## [61] "UGBOV_classe"           "UGBCA_classe"           "UGBPO_classe"          
## [64] "UGBVO_classe"           "SAUTI_classe"

## Warning: ggrepel: 16 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

Nous avons réalisé une nouvelle ACP sans le type d’exploitation “granivore” pour voir si elle influençait les résultats de l’ACP. Les exploitations qui se distinguent le plus sont les exploitations bovines ( viande et mixte) et petits ruminants possèdant plus de SFP par rapport aux autres exploitations. Les exploitations bovines laitières ne sont pas bien représentées. Les exploitations de poly élevage ont plus de charges alimentaires, ce qui est cohérent avec l’ACP précédente.

Etude des Achats alimentaires

Nous nous intéressons désormais aux Achats alimentaires. Celles-ci (charges d’aliments concentrés ‘CHRAC’ et grossiers ‘CHRAG’) sont liées à l’alimentation du troupeau. Nous avons créé une variable ‘ACHA_SOMME’ de la somme de ces deux charges. Dans un premier temps, nous pouvons comparer les Achats alimentaires pour différents types d’exploitation : en premier, la somme, puis les deux types d’aliments (concentrés et grossiers) :

à facetwrapper

En dehors du fait que l’échelle est écrasée par les valeurs très élevées de charges des élevages granivores,on observe que les charges dépendent fortement du type d’exploitation, et ce, en grande partie parce que les exploitations ont des nombre d’animaux à nourrir très différents. Pour réellement savoir si les exploitations reposent sur ces charges pour nourrir leurs animaux, nous créons des variables de charge par unité d’UGB (on divise ces charges par le nombre total d’UGB). En effet, on voit bien que les charges augmentent en fonction du nombre total d’UGB, ce qui est logique (et on a vu précédemment que les différents types d’exploitation avaient des nombre d’UGB distincts).

On trace les mêmes graphes de charges par type d’exploitation, mais désormais les charges sont divisées par le nombre d’UGB total pour chaque exploitation :

à compléter

Pour construire un modèle ayant comme variable à expliquer les Achats alimentaires, nous regardons dans un premier temps les relations (analyse bivariée) entre les Achats alimentaires et les autres variables :

## `geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'

## `geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'

## `geom_smooth()` using method = 'gam' and formula = 'y ~ s(x, bs = "cs")'

On observe dans le premier graphe que les explotations granivores se distinguent des autres, probablement parce que à compléter à compléter sur autres graphes et interprétation (# UGB de 500 + se distingue également )

Séparer en sous classes :

## Warning: ggrepel: 13 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

## Warning in plot.PCA(res.PCA_sous_classe, choix = "var", habillage =
## "Grande_classe", : Habillage must be in c('contrib','cos2','none')
## Warning: ggrepel: 3 unlabeled data points (too many overlaps). Consider
## increasing max.overlaps

## Warning in plot.PCA(res.PCA_sous_classe, choix = "var", habillage =
## "Grande_classe", : Habillage must be in c('contrib','cos2','none')

##  [1] "NREG"                            "OTEXE"                          
##  [3] "IDNUM"                           "PBUCE"                          
##  [5] "CDEXE"                           "OTE64F"                         
##  [7] "REGIO"                           "ZDEFA"                          
##  [9] "TRA05"                           "UTANS"                          
## [11] "UTATO"                           "UGBBO"                          
## [13] "UGBCA"                           "UGBOV"                          
## [15] "UGBPO"                           "UGBTO"                          
## [17] "SAUTI"                           "SFPTO"                          
## [19] "SUT1GCU"                         "SUT1CFOU"                       
## [21] "SUT3PTEM"                        "SUT3PPER"                       
## [23] "CHRGTO"                          "CHSOX"                          
## [25] "PBRTO"                           "VAPBR"                          
## [27] "EBEXP"                           "RESEX"                          
## [29] "CHREN"                           "CHRAM"                          
## [31] "CHRSE"                           "CHRPH"                          
## [33] "CHRAC"                           "CHRAG"                          
## [35] "CHRPV"                           "Total_charges_fossiles"         
## [37] "TCULT"                           "TELEV"                          
## [39] "ELECT"                           "CAGR1"                          
## [41] "ENTB+EMTMT"                      "CAGR3"                          
## [43] "LANMX"                           "LFERM+LMATE"                    
## [45] "SUBEX"                           "PITOT"                          
## [47] "INTVH"                           "INTVP"                          
## [49] "INTVV"                           "ACHAG"                          
## [51] "ACHAC"                           "Type_exploitation"              
## [53] "SFP"                             "REGIONS"                        
## [55] "UGBVO"                           "ACHA_SOMME"                     
## [57] "Intra_conso_animaux"             "CHRATO"                         
## [59] "UGBTO_classe"                    "UGBBO_classe"                   
## [61] "UGBOV_classe"                    "UGBCA_classe"                   
## [63] "UGBPO_classe"                    "UGBVO_classe"                   
## [65] "SAUTI_classe"                    "ACHA_SOMME_UGBTO"               
## [67] "ACHAG_UGBTO"                     "ACHAC_UGBTO"                    
## [69] "ratio_Achat"                     "ratio_intraconsommation_animaux"
## [71] "Grande_classe"

à compléter commentaires graphes bivar

A l’aune de ces analyses, nous créons un modèle linéaire. Les variables explicatives choisies sont àcompléter

## Start:  AIC=87039.96
## ACHA_SOMME ~ log(SFP + 1)
## 
##                Df  Sum of Sq        RSS   AIC
## <none>                       1.1828e+14 87040
## - log(SFP + 1)  1 1.2651e+13 1.3093e+14 87403

##    2    6   22   31   45   63   68   71   92  108  153  160  161  174  243  320 
##    2    6   20   28   40   54   58   61   79   93  131  136  137  148  212  282 
##  375  488  569  580  584  600  646  652  688  714  762  789  792  819  822  831 
##  331  432  508  519  523  539  579  585  620  645  691  714  717  743  746  754 
##  856  864  893  899  919  943  945  955  963  972 1086 1107 1180 1235 1307 1310 
##  778  786  815  820  840  863  865  875  883  892 1004 1025 1098 1147 1214 1217 
## 1353 1376 1387 1424 1470 1494 1571 1579 1599 1606 1632 1658 1660 1691 1721 1748 
## 1258 1280 1291 1327 1371 1393 1459 1467 1483 1489 1514 1536 1538 1566 1595 1621 
## 1785 1829 1866 1867 1879 1880 1897 1905 1910 1916 1920 1921 1934 1950 1961 1964 
## 1651 1689 1721 1722 1733 1734 1749 1755 1760 1765 1769 1770 1782 1796 1805 1808 
## 1972 1985 1986 1989 1997 1999 2000 2004 2007 2008 2009 2012 2015 2022 2025 2029 
## 1814 1827 1828 1831 1839 1841 1842 1845 1848 1849 1850 1853 1856 1862 1865 1868 
## 2030 2038 2040 2043 2053 2057 2059 2063 2064 2068 2081 2084 2085 2096 2104 2108 
## 1869 1876 1878 1881 1890 1894 1896 1899 1900 1903 1914 1917 1918 1928 1936 1940 
## 2120 2128 2133 2141 2142 2144 2147 2151 2155 2156 2164 2168 2170 2174 2179 2181 
## 1949 1957 1961 1968 1969 1971 1974 1978 1982 1983 1991 1995 1996 2000 2004 2006 
## 2183 2190 2191 2192 2195 2196 2198 2200 2202 2204 2205 2208 2210 2211 2212 2218 
## 2007 2014 2015 2016 2018 2019 2021 2022 2024 2025 2026 2029 2031 2032 2033 2038 
## 2229 2230 2231 2233 2235 2242 2243 2245 2249 2260 2264 2271 2272 2274 2275 2277 
## 2049 2050 2051 2053 2055 2062 2063 2065 2068 2078 2081 2088 2089 2091 2092 2094 
## 2280 2283 2284 2287 2288 2412 2458 2483 2497 2516 2592 2626 2636 2671 2686 2700 
## 2097 2100 2101 2104 2105 2205 2245 2265 2277 2293 2358 2383 2391 2420 2435 2448 
## 2746 2747 2787 2788 2795 2818 2820 2829 2860 2884 2911 2947 2950 2968 3019 3282 
## 2485 2486 2520 2521 2528 2548 2550 2559 2586 2607 2632 2667 2670 2688 2732 2973 
## 3287 3394 3524 3540 3568 3647 3648 3652 3673 3675 3793 3832 3869 3902 3905 3908 
## 2978 3072 3184 3197 3222 3296 3297 3301 3320 3322 3425 3461 3493 3524 3527 3530

##Etude des charges énergétiques fossiles##

à compléter def de nos charges fossiles avec la somme

  • à compléter interprétation* puis tracer même graphe mais pour total charges fossiles divisées par (PBRTO-SUBVENTIONS) qui représente ce qu’on a vendu.

Analyses bivariées à faire

Nous avons réalisé une ACP à compléter et expliquer:

## Warning in plot.PCA(res.PCA, choix = "var", habillage = "Type_exploitation", :
## Habillage must be in c('contrib','cos2','none')

Nous avons donc fait un modèle …. à compléter

##Etude des facteurs économiques## On choisit quoi ? EBE? Produit sans les subventions? A discuter.

##    OTEXE   n
## 1     15 166
## 2     16 131
## 3     45 825
## 4     46 647
## 5     47 208
## 6     48 381
## 7     50 560
## 8     61  28
## 9     73  58
## 10    74  73
## 11    83 386
## 12    84 131

à compléter ######################### Modèle Résultats économiques ##########################