library(haven)
library(knitr)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(haven)
BASE_TP<- read_sav("C:/Users/USER/Desktop/LPAS3/statistique de l'agriculture/PROJET_AGRICULTURE_GROUPE4/PROJET_AGRICULTURE_GROUPE4/Projet_statistique_agricole/BASE_TP_VF.sav")
head(BASE_TP)
## # A tibble: 6 × 36
##   REG              PROV       COM VILL           MEN StrateDef PARCELLE NUM_RESP
##   <dbl+lbl>        <dbl+lb> <dbl> <dbl+lbl>    <dbl> <dbl+lbl>    <dbl>    <dbl>
## 1 1 [BOUCLE DU MO… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        1        1
## 2 1 [BOUCLE DU MO… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        3        1
## 3 1 [BOUCLE DU MO… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        2        1
## 4 1 [BOUCLE DU MO… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        4        1
## 5 1 [BOUCLE DU MO… 13 [KOS…  1301 1.30e6 [Bab…    61 2 [Petit…        5        1
## 6 1 [BOUCLE DU MO… 13 [KOS…  1301 1.30e6 [Bab…    61 2 [Petit…        4        1
## # ℹ 28 more variables: CULT1_tab <dbl+lbl>, CULT2_tab <dbl+lbl>,
## #   POIDCULT1 <dbl>, POIDCULT2 <dbl>, REMUNE <dbl+lbl>, QTITE_HOM_JOUR <dbl>,
## #   COUT_MO <dbl>, ENTRAID <dbl+lbl>, MODER1 <dbl+lbl>, MODER2 <dbl+lbl>,
## #   MODER3 <dbl+lbl>, S12C04 <dbl+lbl>, S12C05 <dbl+lbl>, S12C06 <dbl+lbl>,
## #   S12C07 <chr+lbl>, S12C12 <dbl+lbl>, S12C13 <dbl+lbl>, S12C18 <dbl+lbl>,
## #   S12C18A <dbl+lbl>, S12C19 <dbl+lbl>, CARREND <dbl+lbl>,
## #   SUPERFICIE_DEF_PESE_TAB2 <dbl>, rend11C <dbl>, rend12C <dbl>, …
# Installation si nécessaire
if (!require(zoo))

# Chargement des bibliothèques nécessaires
library(dplyr)
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
library(zoo)  # Charger explicitement le package zoo pour na.locf

# Étape 1 : Vérification et nettoyage de COEF
BASE_TP <- BASE_TP %>%
  group_by(VILL, StrateDef) %>%  # Regrouper par village et strate
  mutate(
    COEF = if_else(is.na(COEF), na.locf(COEF, na.rm = FALSE), COEF), # Remplissage vers l'avant
    COEF = if_else(is.na(COEF), na.locf(COEF, fromLast = TRUE, na.rm = FALSE), COEF) # Remplissage vers l'arrière
  ) %>%
  ungroup()

# Étape 2 : Création de la base pondérée
# Répéter chaque ligne en fonction de la valeur arrondie de COEF
BASE_TP_ponderee <- BASE_TP[rep(1:nrow(BASE_TP), times = round(BASE_TP$COEF)), ]

# Afficher un aperçu des premières lignes
#head(BASE_TP_ponderee)

A ce niveau nous avons labéllisé les variables importantes. pour cela nous créé la modalité riz qui prend en compte les deux types de riz cultivés à savoir riz bas fond non aménagé et riz de haute terre. Egalement nous nous créé la modalité Sorgho qui fusionne les deux modalités sorgho blanc,sorgho rouge.

BASE_TP=BASE_TP_ponderee
# Convertir CULT1_tab en caractère (si nécessaire)
BASE_TP$CULT1_tab <- as.character(BASE_TP$CULT1_tab)
# Modifier les valeurs dans CULT1_tab
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "5"] <- "4"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "8"] <- "7"

# Convertir CULT2_tab en caractère
BASE_TP$CULT2_tab <- as.character(BASE_TP$CULT2_tab)
# Modifier les valeurs dans CULT2_tab
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "5"] <- "4"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "8"] <- "7"

## Recoding BASE_TP$REG
BASE_TP$REG <- as.character(BASE_TP$REG)
BASE_TP$REG[BASE_TP$REG == "1"] <- "Boucle du Mouhoun"
BASE_TP$REG[BASE_TP$REG == "2"] <- "CASCADES"
BASE_TP$REG[BASE_TP$REG == "3"] <- "CENTRE"
BASE_TP$REG[BASE_TP$REG == "4"] <- "CENTRE EST"
BASE_TP$REG[BASE_TP$REG == "5"] <- "CENTRE NORD"
BASE_TP$REG[BASE_TP$REG == "6"] <- "CENTRE OUEST"
BASE_TP$REG[BASE_TP$REG == "7"] <- "CENTRE SUD"
BASE_TP$REG[BASE_TP$REG == "8"] <- "EST"
BASE_TP$REG[BASE_TP$REG == "9"] <- "HAUT BASSIN"
BASE_TP$REG[BASE_TP$REG == "10"] <- "NORD"
BASE_TP$REG[BASE_TP$REG == "11"] <- "PLATEAUX CENTRALE"
BASE_TP$REG[BASE_TP$REG == "12"] <- "SAHEL"
BASE_TP$REG[BASE_TP$REG == "13"] <- "SUD OUEST"



## Recoding BASE_TP$CULT1_tab into BASE_TP$CULT1_tab_rec
BASE_TP$CULT1_tab <- BASE_TP$CULT1_tab
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "1"] <- "mil"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "10"] <- "coton"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "13"] <- "arachide"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "14"] <- "sésame"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "16"] <- "igname"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "18"] <- "niébé"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "2"] <- "mais"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "4"] <- "riz"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "6"] <- "fonio"
BASE_TP$CULT1_tab[BASE_TP$CULT1_tab == "7"] <- "sorgho"


## Recoding BASE_TP$CULT1_tab into BASE_TP$CULT1_tab_rec
BASE_TP$CULT2_tab<- BASE_TP$CULT2_tab
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "1"] <- "mil"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "10"] <- "coton"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "13"] <- "arachide"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "14"] <- "sésame"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "16"] <- "igname"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "18"] <- "niébé"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "2"] <- "mais"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "4"] <- "riz"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "6"] <- "fonio"
BASE_TP$CULT2_tab[BASE_TP$CULT2_tab == "7"] <- "sorgho"


## Recoding BASE_TP$TYPE_ASS into BASE_TP$TYPE_ASS_rec
BASE_TP$TYPE_ASS <- as.character(BASE_TP$TYPE_ASS)
BASE_TP$TYPE_ASS[BASE_TP$TYPE_ASS == "1"] <- "Pure"
BASE_TP$TYPE_ASS[BASE_TP$TYPE_ASS == "2"] <- "Associé"

Le diagramme circulaire présenté illustre la répartition des types d’association des cultures entre deux catégories : “Pure” et “Associé”.

Analyse du graphique :

  1. “Pure” (10859170) :

    • Cette catégorie représente la majorité des observations.

    • Elle occupe une large portion du cercle

  2. “Associé” (3485193) :

    • Cette catégorie représente une proportion nettement plus faible.

    • Elle occupe une plus petite portion du cercle.

# Comptage des occurrences pour chaque catégorie
counts <- table(BASE_TP$TYPE_ASS)

# Création du diagramme circulaire
pie(
  counts,
  labels = paste0(names(counts), " (", counts, ")"), # Étiquettes avec nom et fréquence
  col = rainbow(length(counts)), # Couleurs
  main = "Répartition des Types d'Association des cultures"
)

Nous avons créé une variable appélée Culture qui contient les 10 cultures sélectionnées en se basant sur certains critères.Nous avons utilisé les variables Type Association(TYPE_ASS),CULT1_tab,CULT2_tab REND11C et REND12C. Ainsi, si nous avons deux culture associées sur la même parcelle alors la superficie de la parcelle sera attribuée à la culture ayant le plus de rendement sinon garder le nom de la culture et la superficie de la parcelle si la culture est Pure. Et nous attribuons également le nom à la culture ayant le plus de rendement comme la culture cultivée sur la superficie.cette variable contenant uniquement les 10 cultures sélectionnées est utilisée pour le reste du travail.

library(dplyr)

# Définir les cultures d'intérêt
cultures_interet <- c("mil", "mais", "riz", "fonio", "sorgho", "coton", "arachide", "sésame", "niébé", "igname")

# Créer la variable Culture en fonction des conditions
BASE_TP <- BASE_TP %>%
  mutate(
    Culture = case_when(
      # Cas 1 : TYPE_ASS == "Pure", on garde CULT1_tab si c'est une culture d'intérêt
      TYPE_ASS == "Pure" & CULT1_tab %in% cultures_interet ~ CULT1_tab,
      
      # Cas 2 : TYPE_ASS == "Associé", comparer les rendements rend11C et rend12C
      TYPE_ASS == "Associé" & CULT1_tab %in% cultures_interet & 
        (is.na(rend12C) | rend11C >= rend12C) ~ CULT1_tab,  # Choisir CULT1 si meilleur rendement ou rend12C manquant
      
      TYPE_ASS == "Associé" & CULT2_tab %in% cultures_interet & 
        (is.na(rend11C) | rend12C > rend11C) ~ CULT2_tab,  # Choisir CULT2 si meilleur rendement
      
      # Si aucune condition n'est remplie, NA
      TRUE ~ NA_character_
    )
  )

# Afficher les résultats
head(BASE_TP)
## # A tibble: 6 × 37
##   REG    PROV       COM VILL           MEN StrateDef PARCELLE NUM_RESP CULT1_tab
##   <chr>  <dbl+lb> <dbl> <dbl+lbl>    <dbl> <dbl+lbl>    <dbl>    <dbl> <chr>    
## 1 Boucl… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        1        1 mil      
## 2 Boucl… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        1        1 mil      
## 3 Boucl… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        1        1 mil      
## 4 Boucl… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        1        1 mil      
## 5 Boucl… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        1        1 mil      
## 6 Boucl… 13 [KOS…  1301 1.30e6 [Bab…    31 4 [Gros …        1        1 mil      
## # ℹ 28 more variables: CULT2_tab <chr>, POIDCULT1 <dbl>, POIDCULT2 <dbl>,
## #   REMUNE <dbl+lbl>, QTITE_HOM_JOUR <dbl>, COUT_MO <dbl>, ENTRAID <dbl+lbl>,
## #   MODER1 <dbl+lbl>, MODER2 <dbl+lbl>, MODER3 <dbl+lbl>, S12C04 <dbl+lbl>,
## #   S12C05 <dbl+lbl>, S12C06 <dbl+lbl>, S12C07 <chr+lbl>, S12C12 <dbl+lbl>,
## #   S12C13 <dbl+lbl>, S12C18 <dbl+lbl>, S12C18A <dbl+lbl>, S12C19 <dbl+lbl>,
## #   CARREND <dbl+lbl>, SUPERFICIE_DEF_PESE_TAB2 <dbl>, rend11C <dbl>,
## #   rend12C <dbl>, TYPE_ASS <chr>, PROD1 <dbl>, PROD2 <dbl>, COEF <dbl>, …
## Recoding BASE_TP$S12C12
BASE_TP$S12C12 <- as.character(BASE_TP$S12C12)
BASE_TP$S12C12[BASE_TP$S12C12 == "0"] <- "Aucun"
BASE_TP$S12C12[BASE_TP$S12C12 == "1"] <- "Titre foncier"
BASE_TP$S12C12[BASE_TP$S12C12 == "2"] <- "Bail"
BASE_TP$S12C12[BASE_TP$S12C12 == "3"] <- "Attestation de Possession Fonciere(APF)"
BASE_TP$S12C12[BASE_TP$S12C12 == "4"] <- "Permis d'exploiter"
BASE_TP$S12C12[BASE_TP$S12C12 == "5"] <- "Acte de cession de possession fonciere rurale"
BASE_TP$S12C12[BASE_TP$S12C12 == "6"] <- "Possesseur terrien"
BASE_TP$S12C12[BASE_TP$S12C12 == "7"] <- "Autorisation de mise en valeur temporaire"

1.1 superficie totale par culture et par region

# Charger les packages nécessaires
library(dplyr)

# Trier les données par région et culture
BASE_TP <- BASE_TP %>%
  arrange(REG, Culture)  # Tri par région et culture

# Calcul de la superficie totale par culture et par région
superficie_totale <- BASE_TP %>%
  group_by(REG, Culture) %>%
  summarise(superficie_totale = sum(SUPERFICIE_DEF_PESE_TAB2, na.rm = TRUE), .groups = "drop")  # .groups = "drop" pour supprimer la structure de groupe

# Afficher les résultats (optionnel)
kable(na.omit(superficie_totale))
REG Culture superficie_totale
Boucle du Mouhoun arachide 102857.4497
Boucle du Mouhoun coton 200893.4153
Boucle du Mouhoun fonio 26010.7025
Boucle du Mouhoun mais 154315.4029
Boucle du Mouhoun mil 289326.7062
Boucle du Mouhoun niébé 42785.2750
Boucle du Mouhoun riz 22194.9923
Boucle du Mouhoun sorgho 294547.7481
Boucle du Mouhoun sésame 96378.5514
CASCADES arachide 58980.1982
CASCADES coton 53383.1423
CASCADES fonio 815.9768
CASCADES igname 612.8028
CASCADES mais 138487.8667
CASCADES mil 9689.8523
CASCADES niébé 25330.8065
CASCADES riz 18017.6322
CASCADES sorgho 27650.9465
CASCADES sésame 29381.3427
CENTRE arachide 7149.8882
CENTRE mais 12308.1008
CENTRE mil 2636.9556
CENTRE niébé 5843.3211
CENTRE riz 54.6099
CENTRE sorgho 13337.8904
CENTRE sésame 1161.5082
CENTRE EST arachide 105259.2831
CENTRE EST coton 8253.6007
CENTRE EST mais 104136.9610
CENTRE EST mil 54708.7662
CENTRE EST niébé 52295.4194
CENTRE EST riz 20438.4391
CENTRE EST sorgho 99552.7819
CENTRE EST sésame 11523.9811
CENTRE NORD arachide 35186.7820
CENTRE NORD coton 57.0000
CENTRE NORD mais 22524.2451
CENTRE NORD mil 31189.2294
CENTRE NORD niébé 41644.1467
CENTRE NORD riz 623.1727
CENTRE NORD sorgho 180198.6889
CENTRE NORD sésame 8616.1278
CENTRE OUEST arachide 80555.7058
CENTRE OUEST coton 29844.3780
CENTRE OUEST igname 737.8315
CENTRE OUEST mais 138863.4187
CENTRE OUEST mil 120478.9346
CENTRE OUEST niébé 82583.9316
CENTRE OUEST riz 7453.7446
CENTRE OUEST sorgho 346289.8322
CENTRE OUEST sésame 127525.6111
CENTRE SUD arachide 38197.1401
CENTRE SUD coton 10130.9805
CENTRE SUD mais 69510.0761
CENTRE SUD mil 36888.6722
CENTRE SUD niébé 25880.5750
CENTRE SUD riz 10451.4050
CENTRE SUD sorgho 57956.4134
CENTRE SUD sésame 16471.5443
EST arachide 114123.8002
EST coton 2730.4333
EST fonio 1.1970
EST mais 74104.8737
EST mil 102912.6884
EST niébé 51326.9834
EST riz 26231.0553
EST sorgho 197753.6971
EST sésame 24905.1223
HAUT BASSIN arachide 77286.2327
HAUT BASSIN coton 230094.5202
HAUT BASSIN fonio 676.3787
HAUT BASSIN igname 655.3364
HAUT BASSIN mais 284364.6127
HAUT BASSIN mil 33734.6343
HAUT BASSIN niébé 56274.3341
HAUT BASSIN riz 32867.0232
HAUT BASSIN sorgho 91105.9906
HAUT BASSIN sésame 9656.8185
NORD arachide 51309.3429
NORD mais 27074.1730
NORD mil 50353.3946
NORD niébé 46385.6832
NORD riz 2388.0432
NORD sorgho 201496.6132
NORD sésame 4806.2730
PLATEAUX CENTRALE arachide 29373.8700
PLATEAUX CENTRALE coton 8438.0640
PLATEAUX CENTRALE mais 39887.5719
PLATEAUX CENTRALE mil 29279.6779
PLATEAUX CENTRALE niébé 39074.3962
PLATEAUX CENTRALE riz 183.7557
PLATEAUX CENTRALE sorgho 119203.3004
PLATEAUX CENTRALE sésame 8104.3277
SAHEL arachide 4578.1592
SAHEL mais 3399.8253
SAHEL mil 139786.6261
SAHEL niébé 6176.0197
SAHEL sorgho 26583.5844
SAHEL sésame 1546.1339
SUD OUEST arachide 35845.4517
SUD OUEST coton 34890.6307
SUD OUEST igname 2887.2399
SUD OUEST mais 123720.9936
SUD OUEST mil 33173.9949
SUD OUEST niébé 45890.4288
SUD OUEST riz 4466.1386
SUD OUEST sorgho 105535.6051
SUD OUEST sésame 30960.5864

1.2 Quelle est la superficie moyenne d’un ménage par région

library(dplyr)

# Calcul de la superficie totale et du nombre total de ménages par région
superficie_moyenne_par_menage <- BASE_TP %>%
  group_by(REG) %>%  # Regrouper par région
  summarise(
    superficie_totale_region = sum(SUPERFICIE_DEF_PESE_TAB2/COEF, na.rm = TRUE),  
    menage_total_region = n_distinct(MEN),  # Nombre total de ménages distincts par région
    superficie_moyenne_menage = ifelse(menage_total_region > 0, 
                                       superficie_totale_region / menage_total_region, 
                                       NA)  # Superficie moyenne par ménage
  ) %>%
  ungroup()

# Afficher les résultats
kable(superficie_moyenne_par_menage)
REG superficie_totale_region menage_total_region superficie_moyenne_menage
Boucle du Mouhoun 4448.1696 182 24.440493
CASCADES 1212.6434 111 10.924716
CENTRE 334.8132 96 3.487637
CENTRE EST 1216.6716 160 7.604197
CENTRE NORD 1075.0499 187 5.748930
CENTRE OUEST 3236.1137 212 15.264688
CENTRE SUD 2058.2927 248 8.299567
EST 2229.2944 166 13.429484
HAUT BASSIN 4461.2262 182 24.512232
NORD 1198.8964 160 7.493103
PLATEAUX CENTRALE 1270.0987 201 6.318899
SAHEL 689.4536 127 5.428769
SUD OUEST 1906.6995 151 12.627149

1.3 Quelle est la superficie moyenne d’un responsable de parcelle par région

library(dplyr)

# Calcul de la superficie totale et du nombre total de responsables par région
superficie_moyenne_par_responsable <- BASE_TP %>%
  group_by(REG) %>%  # Regrouper par région
  summarise(
    superficie_totale_region = sum(SUPERFICIE_DEF_PESE_TAB2 / COEF, na.rm = TRUE),  # Superficie totale ajustée par COEF
    total_responsables_region = n_distinct(NUM_RESP),  # Nombre total de responsables de parcelles distincts
    superficie_moyenne_responsable = ifelse(total_responsables_region > 0, 
                                            superficie_totale_region / total_responsables_region, 
                                            NA)  # Superficie moyenne par responsable
  ) %>%
  ungroup()
kable(superficie_moyenne_par_responsable)
REG superficie_totale_region total_responsables_region superficie_moyenne_responsable
Boucle du Mouhoun 4448.1696 39 114.05563
CASCADES 1212.6434 29 41.81529
CENTRE 334.8132 24 13.95055
CENTRE EST 1216.6716 35 34.76205
CENTRE NORD 1075.0499 41 26.22073
CENTRE OUEST 3236.1137 38 85.16089
CENTRE SUD 2058.2927 36 57.17480
EST 2229.2944 35 63.69413
HAUT BASSIN 4461.2262 46 96.98318
NORD 1198.8964 46 26.06297
PLATEAUX CENTRALE 1270.0987 45 28.22442
SAHEL 689.4536 19 36.28703
SUD OUEST 1906.6995 32 59.58436

2.1 Calcul du rendement moyen en pure par culture et par région

library(dplyr)

# Calcul du rendement moyen en pur par culture et par région
rendement_moyen_pur_culture <- BASE_TP %>%
  filter(
    TYPE_ASS == "Pure"  # Modalité "Pure" uniquement
          # Rendement rend12C non manquant
  ) %>%
  group_by( Culture,REG) %>%  # Regrouper par région et culture
  summarise(
    rendement_moyen_pure = mean(rend11C, na.rm = TRUE),  # Moyenne des rendements (rend11C + rend12C)
    .groups = "drop"  # Supprimer les regroupements après calcul
  )

# Afficher les résultats
kable(na.omit(rendement_moyen_pur_culture))
Culture REG rendement_moyen_pure
arachide Boucle du Mouhoun 748.7123
arachide CASCADES 920.6970
arachide CENTRE 881.4651
arachide CENTRE EST 992.2433
arachide CENTRE NORD 708.4486
arachide CENTRE OUEST 824.1052
arachide CENTRE SUD 956.2709
arachide EST 979.9114
arachide HAUT BASSIN 900.3417
arachide NORD 680.5623
arachide PLATEAUX CENTRALE 780.7436
arachide SAHEL 438.2495
arachide SUD OUEST 931.8976
coton Boucle du Mouhoun 1076.7077
coton CASCADES 1334.3337
coton CENTRE EST 707.6738
coton CENTRE NORD 142.7368
coton CENTRE OUEST 852.1722
coton CENTRE SUD 1140.1500
coton EST 510.9503
coton HAUT BASSIN 1170.5155
coton PLATEAUX CENTRALE 1197.7473
coton SUD OUEST 1252.2106
fonio Boucle du Mouhoun 547.3172
fonio CASCADES 1372.9100
fonio EST 420.0000
fonio HAUT BASSIN 752.2968
igname CASCADES 12555.1298
igname CENTRE OUEST 18959.3083
igname HAUT BASSIN 13307.2989
igname SUD OUEST 12626.6033
mais Boucle du Mouhoun 1338.2762
mais CASCADES 1731.4914
mais CENTRE 1592.5373
mais CENTRE EST 1411.0316
mais CENTRE NORD 839.1486
mais CENTRE OUEST 1229.9593
mais CENTRE SUD 1505.1630
mais EST 1399.5930
mais HAUT BASSIN 1797.6930
mais NORD 634.5975
mais PLATEAUX CENTRALE 1090.8129
mais SAHEL 712.0295
mais SUD OUEST 1348.6081
mil Boucle du Mouhoun 951.6882
mil CASCADES 1344.5643
mil CENTRE 831.9188
mil CENTRE EST 779.8441
mil CENTRE NORD 527.0815
mil CENTRE OUEST 816.6434
mil CENTRE SUD 1040.3854
mil EST 960.8921
mil HAUT BASSIN 713.9142
mil NORD 446.2061
mil PLATEAUX CENTRALE 696.0165
mil SAHEL 603.2026
mil SUD OUEST 878.8302
niébé Boucle du Mouhoun 753.4841
niébé CASCADES 686.5561
niébé CENTRE 848.3419
niébé CENTRE EST 757.3942
niébé CENTRE NORD 661.4405
niébé CENTRE OUEST 691.3584
niébé CENTRE SUD 858.4351
niébé EST 1029.2207
niébé HAUT BASSIN 688.0991
niébé NORD 451.2026
niébé PLATEAUX CENTRALE 634.3948
niébé SAHEL 747.1593
niébé SUD OUEST 711.2344
riz Boucle du Mouhoun 1684.0454
riz CASCADES 1510.9062
riz CENTRE 2102.1024
riz CENTRE EST 1377.8827
riz CENTRE NORD 970.3410
riz CENTRE OUEST 1557.7662
riz CENTRE SUD 1306.2274
riz EST 2763.4081
riz HAUT BASSIN 1594.8959
riz NORD 1175.4666
riz PLATEAUX CENTRALE 912.5164
riz SUD OUEST 1548.0125
sorgho Boucle du Mouhoun 1050.0462
sorgho CASCADES 1124.1362
sorgho CENTRE 1104.8036
sorgho CENTRE EST 1268.8003
sorgho CENTRE NORD 739.7757
sorgho CENTRE OUEST 932.2799
sorgho CENTRE SUD 1126.5925
sorgho EST 1170.4537
sorgho HAUT BASSIN 889.4594
sorgho NORD 788.2744
sorgho PLATEAUX CENTRALE 921.5689
sorgho SAHEL 719.0552
sorgho SUD OUEST 921.4285
sésame Boucle du Mouhoun 568.3400
sésame CASCADES 602.0556
sésame CENTRE 836.8530
sésame CENTRE EST 646.2066
sésame CENTRE NORD 436.8248
sésame CENTRE OUEST 573.4647
sésame CENTRE SUD 636.4287
sésame EST 609.4485
sésame HAUT BASSIN 544.7590
sésame NORD 376.4322
sésame PLATEAUX CENTRALE 373.8625
sésame SAHEL 320.3211
sésame SUD OUEST 641.0477

2.•2 Quelle est la production (en tonnes) pour chaque culture par région ?

## Calcul de la superficie totale et du nombre total de ménages par région
library(dplyr)

production_totale <- BASE_TP %>%
  filter(!is.na(Culture), !is.na(PROD1), !is.na(PROD2)) %>%  # Filtrer les valeurs non manquantes
  group_by(REG, Culture) %>%  # Grouper par région, CULT1_tab et CULT2_tab
  summarise(
    production_totale = sum(PROD1 + PROD2, na.rm = TRUE),  # Somme de PROD1 et PROD2
    .groups = "drop"  # Supprimer le regroupement après calcul
  ) %>%
  arrange(Culture,REG)  # Optionnel : trier les résultats par région et culture

# Afficher les résultats
kable(production_totale)
REG Culture production_totale
Boucle du Mouhoun arachide 24854.31426
CASCADES arachide 16808.73467
CENTRE arachide 232.40837
CENTRE EST arachide 33547.62682
CENTRE NORD arachide 6769.21228
CENTRE OUEST arachide 16116.06885
CENTRE SUD arachide 16221.96757
EST arachide 57866.35710
HAUT BASSIN arachide 8618.59857
NORD arachide 8619.27432
PLATEAUX CENTRALE arachide 691.33629
SAHEL arachide 796.06419
SUD OUEST arachide 7834.95513
Boucle du Mouhoun coton 9700.80492
CENTRE EST coton 739.60940
CENTRE OUEST coton 453.79966
CENTRE SUD coton 171.25421
EST coton 1247.42049
HAUT BASSIN coton 13997.76478
PLATEAUX CENTRALE coton 477.50000
SUD OUEST coton 5164.44733
CASCADES igname 4256.95050
CENTRE OUEST igname 26.48940
HAUT BASSIN igname 502.26904
SUD OUEST igname 9239.55703
Boucle du Mouhoun mais 4261.55758
CASCADES mais 9955.12842
CENTRE mais 1863.05755
CENTRE EST mais 24470.79221
CENTRE NORD mais 1384.48290
CENTRE OUEST mais 15399.55040
CENTRE SUD mais 11071.35849
EST mais 33082.94283
HAUT BASSIN mais 33418.28604
NORD mais 12646.22067
PLATEAUX CENTRALE mais 469.08010
SAHEL mais 510.78853
SUD OUEST mais 36017.67247
Boucle du Mouhoun mil 89755.00028
CASCADES mil 2168.95117
CENTRE mil 2575.22298
CENTRE EST mil 46116.98809
CENTRE NORD mil 26072.97387
CENTRE OUEST mil 60978.24984
CENTRE SUD mil 44328.38238
EST mil 70622.30713
HAUT BASSIN mil 4143.05589
NORD mil 35892.00465
PLATEAUX CENTRALE mil 17904.54578
SAHEL mil 88788.33919
SUD OUEST mil 20922.17948
Boucle du Mouhoun niébé 6560.93665
CASCADES niébé 12105.55224
CENTRE niébé 2858.95595
CENTRE EST niébé 17528.15739
CENTRE NORD niébé 11270.87625
CENTRE OUEST niébé 14416.29407
CENTRE SUD niébé 1900.03021
EST niébé 25636.60666
HAUT BASSIN niébé 7566.24265
NORD niébé 15602.76979
PLATEAUX CENTRALE niébé 3665.06959
SAHEL niébé 11695.45640
SUD OUEST niébé 7982.97972
Boucle du Mouhoun riz 505.18553
CENTRE EST riz 414.34500
CENTRE OUEST riz 1245.28268
CENTRE SUD riz 16822.77569
EST riz 176.80517
HAUT BASSIN riz 214.80645
SUD OUEST riz 54.01595
Boucle du Mouhoun sorgho 128296.15055
CASCADES sorgho 27210.76639
CENTRE sorgho 14978.46802
CENTRE EST sorgho 67334.78221
CENTRE NORD sorgho 148107.80937
CENTRE OUEST sorgho 175638.54606
CENTRE SUD sorgho 20655.53266
EST sorgho 160596.33257
HAUT BASSIN sorgho 12865.52391
NORD sorgho 147719.40393
PLATEAUX CENTRALE sorgho 68044.73893
SAHEL sorgho 7654.16589
SUD OUEST sorgho 37337.67111
Boucle du Mouhoun sésame 7823.35492
CASCADES sésame 35.90560
CENTRE sésame 224.72164
CENTRE EST sésame 1216.44788
CENTRE NORD sésame 2022.89765
CENTRE OUEST sésame 7087.47576
CENTRE SUD sésame 24447.90098
EST sésame 6304.22538
NORD sésame 323.37182
PLATEAUX CENTRALE sésame 937.24487
SAHEL sésame 179.08348
SUD OUEST sésame 568.03121

2.3 Quel est le rendement moyen en pure de chaque culture par région et selon le relief de la parcelle ?

# Charger le package dplyr
library(dplyr)
library(questionr)

## Recoding BASE_TP$S12C06 into BASE_TP$S12C06_rec
BASE_TP$S12C06 <- as.character(BASE_TP$S12C06)
BASE_TP$S12C06[BASE_TP$S12C06 == "1"] <- "Plaine/Plateau"
BASE_TP$S12C06[BASE_TP$S12C06 == "2"] <- "Bas-fonds"
BASE_TP$S12C06[BASE_TP$S12C06 == "3"] <- "Versant"# Filtrer les données pour TYPE_ASS = "Pure" et valeurs non manquantes
rendement_moyen_pure <- BASE_TP %>%
  filter(
    TYPE_ASS == "Pure",  # Filtrer uniquement les parcelles en culture Pure
          # Retirer les valeurs manquantes pour rend12C (rendement)
  ) %>%
  group_by(REG, Culture, S12C06) %>%  # Regrouper par région, culture et relief
  summarise(
    rendement_moyen = mean(rend11C, na.rm = TRUE),  # Calcul de la moyenne des rendements
    .groups = "drop"  # Supprimer le regroupement après calcul
  )

# Afficher les résultats
kable(rendement_moyen_pure)
REG Culture S12C06 rendement_moyen
Boucle du Mouhoun arachide Bas-fonds 408.00000
Boucle du Mouhoun arachide Plaine/Plateau 752.79844
Boucle du Mouhoun arachide Versant 675.61638
Boucle du Mouhoun coton Bas-fonds 1135.51634
Boucle du Mouhoun coton Plaine/Plateau 1081.96197
Boucle du Mouhoun coton Versant 937.74991
Boucle du Mouhoun fonio Plaine/Plateau 553.20011
Boucle du Mouhoun fonio Versant 479.54517
Boucle du Mouhoun fonio NA NaN
Boucle du Mouhoun mais Bas-fonds 782.82540
Boucle du Mouhoun mais Plaine/Plateau 1347.08531
Boucle du Mouhoun mais Versant 1572.71939
Boucle du Mouhoun mais NA NaN
Boucle du Mouhoun mil Plaine/Plateau 938.12049
Boucle du Mouhoun mil Versant 1141.81858
Boucle du Mouhoun mil NA 800.00000
Boucle du Mouhoun niébé Bas-fonds 400.00000
Boucle du Mouhoun niébé Plaine/Plateau 752.98163
Boucle du Mouhoun niébé Versant 762.96365
Boucle du Mouhoun riz Bas-fonds 1796.42294
Boucle du Mouhoun riz Plaine/Plateau 1207.74276
Boucle du Mouhoun riz Versant 1842.77361
Boucle du Mouhoun sorgho Bas-fonds 866.07562
Boucle du Mouhoun sorgho Plaine/Plateau 1061.89654
Boucle du Mouhoun sorgho Versant 994.52046
Boucle du Mouhoun sorgho NA NaN
Boucle du Mouhoun sésame Bas-fonds 435.21289
Boucle du Mouhoun sésame Plaine/Plateau 574.06929
Boucle du Mouhoun sésame Versant 556.33175
Boucle du Mouhoun NA Bas-fonds 1477.89474
Boucle du Mouhoun NA Plaine/Plateau 6359.99005
Boucle du Mouhoun NA Versant 852.58072
CASCADES arachide Bas-fonds NaN
CASCADES arachide Plaine/Plateau 927.71990
CASCADES arachide Versant 643.69355
CASCADES coton Plaine/Plateau 1314.38806
CASCADES coton Versant 1579.70612
CASCADES fonio Plaine/Plateau 1438.12334
CASCADES fonio Versant 1040.00000
CASCADES igname Plaine/Plateau 12555.12984
CASCADES mais Bas-fonds 1659.24766
CASCADES mais Plaine/Plateau 1720.41451
CASCADES mais Versant 1877.78447
CASCADES mil Plaine/Plateau 1350.54409
CASCADES mil Versant 1200.00000
CASCADES niébé Bas-fonds 500.00000
CASCADES niébé Plaine/Plateau 699.95124
CASCADES niébé Versant 585.20897
CASCADES riz Bas-fonds 1487.69597
CASCADES riz Plaine/Plateau 1769.51096
CASCADES riz Versant 800.00000
CASCADES sorgho Bas-fonds 1251.59882
CASCADES sorgho Plaine/Plateau 1117.03136
CASCADES sorgho Versant 1570.27523
CASCADES sésame Plaine/Plateau 603.36348
CASCADES sésame Versant 480.00000
CASCADES NA Bas-fonds 7237.97722
CASCADES NA Plaine/Plateau 4404.92268
CASCADES NA Versant 1813.50520
CENTRE arachide Bas-fonds 869.03483
CENTRE arachide Plaine/Plateau 881.76109
CENTRE arachide Versant 848.00000
CENTRE arachide NA NaN
CENTRE mais Bas-fonds 1615.72542
CENTRE mais Plaine/Plateau 1597.18071
CENTRE mais Versant 1216.19972
CENTRE mil Plaine/Plateau 866.68722
CENTRE mil Versant 280.00000
CENTRE niébé Bas-fonds 1354.90605
CENTRE niébé Plaine/Plateau 835.92433
CENTRE niébé Versant 815.21270
CENTRE riz Bas-fonds 2102.10243
CENTRE sorgho Bas-fonds 1623.42961
CENTRE sorgho Plaine/Plateau 1082.08385
CENTRE sorgho Versant 951.11111
CENTRE sésame Bas-fonds NaN
CENTRE sésame Plaine/Plateau 838.26584
CENTRE sésame Versant 480.00000
CENTRE NA Bas-fonds 2400.00000
CENTRE NA Plaine/Plateau 4265.08433
CENTRE NA Versant 1803.73869
CENTRE NA NA NaN
CENTRE EST arachide Bas-fonds 802.31405
CENTRE EST arachide Plaine/Plateau 990.33616
CENTRE EST arachide Versant 1109.11746
CENTRE EST coton Bas-fonds 224.00000
CENTRE EST coton Plaine/Plateau 699.69268
CENTRE EST coton Versant 901.45800
CENTRE EST mais Bas-fonds 926.10085
CENTRE EST mais Plaine/Plateau 1452.43655
CENTRE EST mais Versant 1654.53039
CENTRE EST mil Plaine/Plateau 778.30692
CENTRE EST mil Versant 876.46552
CENTRE EST niébé Bas-fonds 680.01925
CENTRE EST niébé Plaine/Plateau 763.80409
CENTRE EST niébé Versant 661.75836
CENTRE EST riz Bas-fonds 1441.89331
CENTRE EST riz Plaine/Plateau 985.65716
CENTRE EST riz Versant 1438.28010
CENTRE EST sorgho Bas-fonds 1502.61483
CENTRE EST sorgho Plaine/Plateau 1264.95718
CENTRE EST sorgho Versant 968.14755
CENTRE EST sésame Bas-fonds 160.00000
CENTRE EST sésame Plaine/Plateau 645.17826
CENTRE EST sésame Versant 736.38716
CENTRE EST NA Bas-fonds 3112.19119
CENTRE EST NA Plaine/Plateau 4028.36811
CENTRE EST NA Versant 1810.75661
CENTRE NORD arachide Bas-fonds 670.32687
CENTRE NORD arachide Plaine/Plateau 706.15846
CENTRE NORD arachide Versant 748.99646
CENTRE NORD arachide NA NaN
CENTRE NORD coton Versant 142.73684
CENTRE NORD mais Bas-fonds 954.84697
CENTRE NORD mais Plaine/Plateau 813.86599
CENTRE NORD mais Versant 1098.00088
CENTRE NORD mil Bas-fonds 844.77405
CENTRE NORD mil Plaine/Plateau 466.51160
CENTRE NORD mil Versant 654.23159
CENTRE NORD niébé Bas-fonds 885.07219
CENTRE NORD niébé Plaine/Plateau 654.51122
CENTRE NORD niébé Versant 634.89270
CENTRE NORD riz Bas-fonds 1063.12164
CENTRE NORD riz Plaine/Plateau 784.17855
CENTRE NORD sorgho Bas-fonds 770.83960
CENTRE NORD sorgho Plaine/Plateau 772.41478
CENTRE NORD sorgho Versant 571.78003
CENTRE NORD sésame Bas-fonds 395.49634
CENTRE NORD sésame Plaine/Plateau 445.88386
CENTRE NORD sésame Versant 431.32469
CENTRE NORD NA Bas-fonds 2826.63643
CENTRE NORD NA Plaine/Plateau 1237.29816
CENTRE NORD NA Versant 3036.32047
CENTRE OUEST arachide Bas-fonds 812.75268
CENTRE OUEST arachide Plaine/Plateau 817.80523
CENTRE OUEST arachide Versant 910.97957
CENTRE OUEST arachide NA 1151.22705
CENTRE OUEST coton Bas-fonds 632.00000
CENTRE OUEST coton Plaine/Plateau 859.81074
CENTRE OUEST coton Versant 790.43275
CENTRE OUEST igname Plaine/Plateau 18959.30834
CENTRE OUEST mais Bas-fonds 1147.34266
CENTRE OUEST mais Plaine/Plateau 1229.13416
CENTRE OUEST mais Versant 1243.11558
CENTRE OUEST mais NA 1914.59716
CENTRE OUEST mil Bas-fonds 966.15385
CENTRE OUEST mil Plaine/Plateau 819.60657
CENTRE OUEST mil Versant 755.78520
CENTRE OUEST niébé Bas-fonds 594.36929
CENTRE OUEST niébé Plaine/Plateau 692.08209
CENTRE OUEST niébé Versant 688.87803
CENTRE OUEST niébé NA 940.00000
CENTRE OUEST riz Bas-fonds 1584.85015
CENTRE OUEST riz Plaine/Plateau 826.09694
CENTRE OUEST sorgho Bas-fonds 876.99229
CENTRE OUEST sorgho Plaine/Plateau 929.47838
CENTRE OUEST sorgho Versant 995.47761
CENTRE OUEST sorgho NA NaN
CENTRE OUEST sésame Bas-fonds 692.48743
CENTRE OUEST sésame Plaine/Plateau 571.75729
CENTRE OUEST sésame Versant 609.83617
CENTRE OUEST sésame NA 455.37559
CENTRE OUEST NA Bas-fonds 3529.69577
CENTRE OUEST NA Plaine/Plateau 3812.55931
CENTRE OUEST NA Versant 2544.68775
CENTRE OUEST NA NA 4800.00000
CENTRE SUD arachide Bas-fonds 869.16556
CENTRE SUD arachide Plaine/Plateau 953.71417
CENTRE SUD arachide Versant 1055.73443
CENTRE SUD arachide NA 419.95238
CENTRE SUD coton Bas-fonds 938.00000
CENTRE SUD coton Plaine/Plateau 1159.23388
CENTRE SUD coton Versant 1032.93964
CENTRE SUD coton NA 1222.00000
CENTRE SUD mais Bas-fonds 1314.05346
CENTRE SUD mais Plaine/Plateau 1497.99703
CENTRE SUD mais Versant 1777.63323
CENTRE SUD mais NA 2828.93525
CENTRE SUD mil Bas-fonds 545.97194
CENTRE SUD mil Plaine/Plateau 1048.32068
CENTRE SUD mil Versant 955.54070
CENTRE SUD niébé Bas-fonds 1505.26776
CENTRE SUD niébé Plaine/Plateau 857.39603
CENTRE SUD niébé Versant 829.59259
CENTRE SUD niébé NA 1134.00000
CENTRE SUD riz Bas-fonds 1367.43036
CENTRE SUD riz Plaine/Plateau 1156.40091
CENTRE SUD riz Versant 1086.39534
CENTRE SUD riz NA NaN
CENTRE SUD sorgho Bas-fonds 1213.78104
CENTRE SUD sorgho Plaine/Plateau 1119.56512
CENTRE SUD sorgho Versant 1257.91608
CENTRE SUD sorgho NA 1032.00000
CENTRE SUD sésame Bas-fonds 449.84510
CENTRE SUD sésame Plaine/Plateau 644.23785
CENTRE SUD sésame Versant 602.04165
CENTRE SUD NA Bas-fonds 2580.74306
CENTRE SUD NA Plaine/Plateau 7104.27733
CENTRE SUD NA Versant 8715.91254
CENTRE SUD NA NA 22070.00000
EST arachide Bas-fonds 928.66067
EST arachide Plaine/Plateau 981.43830
EST arachide Versant 1016.57891
EST coton Bas-fonds 400.00000
EST coton Plaine/Plateau 1040.42194
EST fonio Plaine/Plateau 420.00000
EST mais Bas-fonds 1323.60970
EST mais Plaine/Plateau 1388.66728
EST mais Versant 1548.64345
EST mil Bas-fonds 1365.39657
EST mil Plaine/Plateau 962.68065
EST mil Versant 851.40499
EST niébé Bas-fonds 776.22758
EST niébé Plaine/Plateau 1035.85221
EST niébé Versant 1128.85279
EST riz Bas-fonds 3239.04991
EST riz Plaine/Plateau 2090.84519
EST riz Versant 2000.00000
EST sorgho Bas-fonds 1050.38348
EST sorgho Plaine/Plateau 1204.91334
EST sorgho Versant 884.87457
EST sésame Bas-fonds 853.32203
EST sésame Plaine/Plateau 616.79620
EST sésame Versant 562.49141
EST NA Bas-fonds 595.31227
EST NA Plaine/Plateau 4509.19755
EST NA Versant 2402.78784
HAUT BASSIN arachide Bas-fonds 1292.49489
HAUT BASSIN arachide Plaine/Plateau 891.94495
HAUT BASSIN arachide Versant 962.17097
HAUT BASSIN coton Bas-fonds 1052.36454
HAUT BASSIN coton Plaine/Plateau 1176.51867
HAUT BASSIN coton Versant 1118.36153
HAUT BASSIN fonio Plaine/Plateau 752.29682
HAUT BASSIN igname Bas-fonds 13233.33333
HAUT BASSIN igname Plaine/Plateau 13313.84313
HAUT BASSIN mais Bas-fonds 1765.39400
HAUT BASSIN mais Plaine/Plateau 1801.50633
HAUT BASSIN mais Versant 1758.54457
HAUT BASSIN mil Bas-fonds 744.00000
HAUT BASSIN mil Plaine/Plateau 702.28175
HAUT BASSIN mil Versant 804.60737
HAUT BASSIN niébé Bas-fonds 901.50685
HAUT BASSIN niébé Plaine/Plateau 692.06017
HAUT BASSIN niébé Versant 651.37231
HAUT BASSIN riz Bas-fonds 1643.66386
HAUT BASSIN riz Plaine/Plateau 1509.88282
HAUT BASSIN riz Versant 931.85008
HAUT BASSIN sorgho Bas-fonds 997.25320
HAUT BASSIN sorgho Plaine/Plateau 895.39215
HAUT BASSIN sorgho Versant 766.79355
HAUT BASSIN sorgho NA NaN
HAUT BASSIN sésame Bas-fonds 128.00000
HAUT BASSIN sésame Plaine/Plateau 586.82943
HAUT BASSIN sésame Versant 203.79180
HAUT BASSIN NA Bas-fonds 9073.52170
HAUT BASSIN NA Plaine/Plateau 4995.27618
HAUT BASSIN NA Versant 7518.86530
HAUT BASSIN NA NA NaN
NORD arachide Bas-fonds 610.55348
NORD arachide Plaine/Plateau 699.59026
NORD arachide Versant 430.50722
NORD mais Bas-fonds 674.79921
NORD mais Plaine/Plateau 628.55288
NORD mais Versant 737.98328
NORD mil Bas-fonds 985.79957
NORD mil Plaine/Plateau 418.19980
NORD mil Versant 251.07004
NORD niébé Bas-fonds 720.54476
NORD niébé Plaine/Plateau 452.75626
NORD niébé Versant 314.82846
NORD niébé NA NaN
NORD riz Bas-fonds 1175.46663
NORD riz Versant NaN
NORD sorgho Bas-fonds 878.87617
NORD sorgho Plaine/Plateau 770.99908
NORD sorgho Versant 481.49516
NORD sésame Bas-fonds 480.00000
NORD sésame Plaine/Plateau 398.54872
NORD sésame Versant 70.53333
NORD NA Bas-fonds 2290.56305
NORD NA Plaine/Plateau 4762.44734
NORD NA Versant 2297.05588
PLATEAUX CENTRALE arachide Bas-fonds 691.35295
PLATEAUX CENTRALE arachide Plaine/Plateau 775.01112
PLATEAUX CENTRALE arachide Versant 1039.59348
PLATEAUX CENTRALE coton Bas-fonds 1560.00000
PLATEAUX CENTRALE coton Plaine/Plateau 1186.50070
PLATEAUX CENTRALE coton Versant 1325.36232
PLATEAUX CENTRALE mais Bas-fonds 1667.66111
PLATEAUX CENTRALE mais Plaine/Plateau 1050.29759
PLATEAUX CENTRALE mais Versant 1524.12595
PLATEAUX CENTRALE mil Plaine/Plateau 698.15656
PLATEAUX CENTRALE mil Versant 680.72952
PLATEAUX CENTRALE niébé Bas-fonds 652.81359
PLATEAUX CENTRALE niébé Plaine/Plateau 626.93629
PLATEAUX CENTRALE niébé Versant 717.11547
PLATEAUX CENTRALE riz Bas-fonds 911.69782
PLATEAUX CENTRALE riz Plaine/Plateau 1096.00000
PLATEAUX CENTRALE sorgho Bas-fonds 816.82241
PLATEAUX CENTRALE sorgho Plaine/Plateau 934.85103
PLATEAUX CENTRALE sorgho Versant 1034.61432
PLATEAUX CENTRALE sésame Bas-fonds 446.73934
PLATEAUX CENTRALE sésame Plaine/Plateau 373.03209
PLATEAUX CENTRALE sésame Versant 280.65287
PLATEAUX CENTRALE NA Bas-fonds 4388.96704
PLATEAUX CENTRALE NA Plaine/Plateau 3516.96380
PLATEAUX CENTRALE NA Versant 5771.99120
SAHEL arachide Bas-fonds 416.79825
SAHEL arachide Plaine/Plateau 516.70106
SAHEL arachide Versant 250.40021
SAHEL mais Bas-fonds 591.59488
SAHEL mais Plaine/Plateau 726.05535
SAHEL mais Versant 570.61538
SAHEL mil Bas-fonds 551.37255
SAHEL mil Plaine/Plateau 623.61343
SAHEL mil Versant 366.35085
SAHEL niébé Bas-fonds 300.00000
SAHEL niébé Plaine/Plateau 828.93657
SAHEL niébé Versant 120.00000
SAHEL sorgho Bas-fonds 779.20338
SAHEL sorgho Plaine/Plateau 794.15348
SAHEL sorgho Versant 277.24703
SAHEL sésame Bas-fonds 300.22107
SAHEL sésame Plaine/Plateau 359.88590
SAHEL sésame Versant 138.64108
SAHEL NA Bas-fonds 5242.57371
SAHEL NA Plaine/Plateau 4739.21872
SAHEL NA Versant 6755.91837
SAHEL NA NA 5200.00000
SUD OUEST arachide Bas-fonds 280.00000
SUD OUEST arachide Plaine/Plateau 936.03511
SUD OUEST arachide Versant 690.78261
SUD OUEST arachide NA 1200.00000
SUD OUEST coton Plaine/Plateau 1292.32400
SUD OUEST coton Versant 856.99573
SUD OUEST igname Bas-fonds 34224.02065
SUD OUEST igname Plaine/Plateau 9402.77784
SUD OUEST igname Versant 9343.88084
SUD OUEST mais Bas-fonds 1326.87460
SUD OUEST mais Plaine/Plateau 1342.00411
SUD OUEST mais Versant 1491.69473
SUD OUEST mais NA 1200.00000
SUD OUEST mil Bas-fonds 683.91795
SUD OUEST mil Plaine/Plateau 870.27078
SUD OUEST mil Versant 954.47242
SUD OUEST niébé Bas-fonds 452.21111
SUD OUEST niébé Plaine/Plateau 730.85207
SUD OUEST niébé Versant 508.54796
SUD OUEST niébé NA 400.00000
SUD OUEST riz Bas-fonds 1560.39838
SUD OUEST riz Plaine/Plateau 1977.07143
SUD OUEST riz Versant 560.00000
SUD OUEST sorgho Bas-fonds 917.44716
SUD OUEST sorgho Plaine/Plateau 938.93326
SUD OUEST sorgho Versant 795.30677
SUD OUEST sésame Plaine/Plateau 634.39154
SUD OUEST sésame Versant 750.96310
SUD OUEST NA Bas-fonds 7930.76008
SUD OUEST NA Plaine/Plateau 1724.06598
SUD OUEST NA Versant 556.63567
SUD OUEST NA NA NaN
  1. Main d’œuvre et Coûts :

    3.1 • Quelle est la quantité totale de main-d’œuvre (Homme/jour) utilisée par région ?

library(dplyr)

# Calcul de la quantité totale de main-d'œuvre utilisée par région
main_oeuvre_totale <- BASE_TP %>%
  group_by(REG) %>%  # Regrouper par région
  summarise(
    main_oeuvre_totale = sum(QTITE_HOM_JOUR, na.rm = TRUE),  # Somme totale en Homme/Jour
    .groups = "drop"  # Supprimer les regroupements après calcul
  )
# Afficher les résultats
kable(main_oeuvre_totale)
REG main_oeuvre_totale
Boucle du Mouhoun 4315763
CASCADES 201501
CENTRE 2527
CENTRE EST 98616
CENTRE NORD 29581
CENTRE OUEST 1455027
CENTRE SUD 181908
EST 146055
HAUT BASSIN 2528810
NORD 105730
PLATEAUX CENTRALE 38272
SAHEL 36625
SUD OUEST 1472358

visualisation dans l’ordre décroissante de la quantité de main d’oeuvre par région

Les résultats montrent une répartition inégale de la main-d’œuvre utilisée à travers les différentes régions. Les quatre premières régions qui exploitent le plus de main-d’œuvre sont : 1. La Boucle du Mouhoun avec 4315763 hommes/jour, qui se distingue largement par son utilisation massive. 2. Les Hauts-Bassins 2528810hommes/jour. 3. Le Sud-Ouest avec 1472358hommes/jour. 4. Le Centre-Ouest, qui arrive en quatrième position avec une quantité de 1455027 H/j Ces régions sont les principales zones de concentration de la main-d’œuvre, avec une nette domination de la Boucle du Mouhoun, représentant près de deux fois plus que les Hauts-Bassins. À l’opposé, les quatre dernières régions enregistrent une exploitation très faible : - Le Plateau Central : 38272hommes/jour - Le Sahel : 36625hommes/jour, - Le Centre-Nord :29 581 hommes/jour - Le Centre :2 527 hommes/jour, la région la moins active. Ces régions montrent une sous-utilisation marquée de la main-d’œuvre témoignant une moindre activité agricole.

library(dplyr)
library(ggplot2)

# Calcul de la quantité totale de main-d'œuvre utilisée par région
main_oeuvre_totale <- BASE_TP %>%
  group_by(REG) %>%  # Regrouper par région
  summarise(
    main_oeuvre_totale = sum(QTITE_HOM_JOUR, na.rm = TRUE),  # Somme totale en Homme/Jour
    .groups = "drop"  # Supprimer les regroupements après calcul
  ) %>%
  arrange(main_oeuvre_totale)  # Trier par ordre croissant

# Créer un bar plot horizontal avec ggplot2
ggplot(main_oeuvre_totale, aes(x = main_oeuvre_totale, y = reorder(REG, main_oeuvre_totale), fill = REG)) +
  geom_bar(stat = "identity") +  # Barres proportionnelles aux valeurs
  geom_text(
    aes(label = main_oeuvre_totale),  # Afficher les valeurs
    hjust = -0.2,  # Position horizontale légèrement décalée à droite des barres
    size = 2  # Taille des étiquettes
  ) +
  labs(
    x = "Quantité totale de main-d'œuvre (Homme/Jour)",
    y = "Région",
    title = "Quantité totale de main-d'œuvre utilisée par région"
  ) +
  theme_minimal() +  # Style minimal
  theme(legend.position = "none") +  # Masquer la légende
  scale_x_continuous(expand = expansion(mult = c(0, 0.1)))  # Ajouter un espace à droite des barres

3.2 Quel est le coût moyen de la main-d’œuvre par hectare par région ?

library(dplyr)

# Calcul du coût moyen de la main-d'œuvre par hectare par région
cout_mo_par_hectare <- BASE_TP %>%
  group_by(REG) %>%  # Regrouper par région
  summarise(
    cout_total_mo = sum(COUT_MO, na.rm = TRUE),  # Coût total de la main-d'œuvre par région
    superficie_totale = sum(SUPERFICIE_DEF_PESE_TAB2, na.rm = TRUE),  # Superficie totale par région
    cout_moyen_par_hectare = cout_total_mo / superficie_totale,  # Calcul du coût moyen par hectare
    .groups = "drop"  # Supprimer les regroupements après calcul
  )

# Afficher les résultats
kable(cout_mo_par_hectare)
REG cout_total_mo superficie_totale cout_moyen_par_hectare
Boucle du Mouhoun 2851403350 1238067.16 2303.1088
CASCADES 382668600 381892.33 1002.0327
CENTRE 9601000 44956.62 213.5614
CENTRE EST 273923750 482030.90 568.2701
CENTRE NORD 91594250 328169.88 279.1062
CENTRE OUEST 2493532450 985255.77 2530.8479
CENTRE SUD 320655450 282537.85 1134.9115
EST 238235500 617502.56 385.8049
HAUT BASSIN 2468234500 889967.70 2773.3978
NORD 95489600 390043.78 244.8176
PLATEAUX CENTRALE 45325300 282026.16 160.7131
SAHEL 77642500 183505.69 423.1068
SUD OUEST 926854050 429238.70 2159.2975

Les résultats révèlent une répartition inégale du coût moyen de la main-d’œuvre par hectare entre les régions. La région des Hauts-Bassins enregistre le coût moyen le plus élevé, avec 2773.3978 FCFA/hectare, reflétant une main-d’œuvre particulièrement coûteuse. Cette observation contraste avec la Boucle du Mouhoun 2303.1088 f/ha, qui est pourtant la région ayant utilisé la plus grande quantité totale de main-d’œuvre dans l’analyse précédente. Ce décalage indique que, bien que la Boucle du Mouhoun emploie davantage de main-d’œuvre, celle-ci est probablement moins chère ou plus accessible, tandis que la main-d’œuvre dans les Hauts-Bassins est plus onéreuse. • Le Centre-Ouest, avec 2 530,85 FCFA/hectare ; La Boucle du Mouhoun, avec 2303.1088 FCFA/hectare. À l’autre extrémité, le Plateau Central est la région affichant le coût moyen le plus faible, reflétant une main-d’œuvre beaucoup moins chère dans cette région

# visualisation Coût moyen de la main-d'œuvre par hectare par région
library(dplyr)
library(ggplot2)

# Calcul du coût moyen de la main-d'œuvre par hectare par région
cout_mo_par_hectare <- BASE_TP %>%
  group_by(REG) %>%  # Regrouper par région
  summarise(
    cout_total_mo = sum(COUT_MO, na.rm = TRUE),  # Coût total de la main-d'œuvre par région
    superficie_totale = sum(SUPERFICIE_DEF_PESE_TAB2, na.rm = TRUE),  # Superficie totale par région
    cout_moyen_par_hectare = cout_total_mo / superficie_totale,  # Calcul du coût moyen par hectare
    .groups = "drop"  # Supprimer les regroupements après calcul
  ) %>%
  arrange(cout_moyen_par_hectare)  # Trier par ordre croissant du coût moyen

# Créer un diagramme en barres verticales avec ggplot2
ggplot(cout_mo_par_hectare, aes(x = reorder(REG, cout_moyen_par_hectare), y = cout_moyen_par_hectare, fill = REG)) +
  geom_bar(stat = "identity", width = 0.7) +  # Barres proportionnelles aux valeurs
  labs(
    x = "Région",
    y = "Coût moyen par hectare (en FCFA)",
    title = "Coût moyen de la main-d'œuvre par hectare par région"
  ) +
  geom_text(
    aes(label = round(cout_moyen_par_hectare, 2)),  # Ajouter des étiquettes avec 2 décimales
    vjust = -0.5,  # Position des étiquettes au-dessus des barres
    size = 3  # Taille des étiquettes
  ) +
  theme_minimal() +  # Style minimaliste
  theme(
    axis.text.x = element_text(angle = 45, hjust = 1),  # Incliner les noms des régions
    legend.position = "none" ) # Masquer la légende

Calcul du salaire moyen journalier par région

• Les régions avec les salaires moyens les plus élevés : CENTRE (3799.37), CENTRE NORD (3096.39), et CASCADES (1899.09). • Les régions avec les salaires moyens les plus bas : SUD OUEST (629.50), BOUCLE DU MOUHOUN (660.70), et HAUT BASSIN (976.05). Cela pourrait être dû à une main-d’œuvre plus abondante ou des coûts plus faibles dans ces régions.

library(dplyr)
salaire_moyen_journalier <- BASE_TP %>%
  group_by(REG) %>%  # Regrouper par région
  summarise(
    cout_total_mo = sum(COUT_MO, na.rm = TRUE),  # Coût total de la main-d'œuvre par région
    quantite_totale_homme_jour = sum(QTITE_HOM_JOUR, na.rm = TRUE),  # Total Homme/Jour par région
    salaire_moyen_journalier = cout_total_mo / quantite_totale_homme_jour,  # Salaire moyen journalier
    .groups = "drop"  # Supprimer les regroupements après calcul
  )

# Afficher les résultats
kable(salaire_moyen_journalier)
REG cout_total_mo quantite_totale_homme_jour salaire_moyen_journalier
Boucle du Mouhoun 2851403350 4315763 660.6951
CASCADES 382668600 201501 1899.0903
CENTRE 9601000 2527 3799.3668
CENTRE EST 273923750 98616 2777.6806
CENTRE NORD 91594250 29581 3096.3879
CENTRE OUEST 2493532450 1455027 1713.7362
CENTRE SUD 320655450 181908 1762.7342
EST 238235500 146055 1631.1355
HAUT BASSIN 2468234500 2528810 976.0458
NORD 95489600 105730 903.1457
PLATEAUX CENTRALE 45325300 38272 1184.2940
SAHEL 77642500 36625 2119.9317
SUD OUEST 926854050 1472358 629.5032

4.Quelle est la part de superficie couverte par chaque techniques CES/DRS par région ?

# Calcul de la part de superficie couverte par chaque technique CES/DRS par région
part_superficie_ces <- BASE_TP %>%
  filter(!is.na(S12C07), !is.na(SUPERFICIE_DEF_PESE_TAB2)) %>%  # Exclure les valeurs manquantes
  group_by(REG, S12C07) %>%  # Regrouper par région et technique CES/DRS
  summarise(
    superficie_par_technique = sum(SUPERFICIE_DEF_PESE_TAB2, na.rm = TRUE),  # Superficie par technique
    superficie_totale_region = sum(SUPERFICIE_DEF_PESE_TAB2, na.rm = TRUE),  # Superficie totale de la région
    .groups = "drop"  # Supprimer les regroupements
  ) %>%
  mutate(
    part_superficie = superficie_par_technique / superficie_totale_region   # Calcul de la part en pourcentage
  ) %>%
  select(REG, S12C07, superficie_par_technique)  # Sélectionner seulement les colonnes REG, S12C07 et superficie_par_technique

# Afficher les résultats
kable(part_superficie_ces)
REG S12C07 superficie_par_technique
Boucle du Mouhoun 2.082710e+03
Boucle du Mouhoun 0 1.133824e+06
Boucle du Mouhoun A 7.551451e+04
Boucle du Mouhoun AB 1.646804e+02
Boucle du Mouhoun AE 2.903008e+02
Boucle du Mouhoun AEF 5.102208e+00
Boucle du Mouhoun AF 1.361551e+03
Boucle du Mouhoun AG 3.475808e+03
Boucle du Mouhoun AH 3.714391e+01
Boucle du Mouhoun B 1.185004e+02
Boucle du Mouhoun C 7.500000e-02
Boucle du Mouhoun D 9.920423e+03
Boucle du Mouhoun E 2.834396e+03
Boucle du Mouhoun EF 6.766961e+02
Boucle du Mouhoun EFG 1.071322e+02
Boucle du Mouhoun F 8.750000e+01
Boucle du Mouhoun G 7.140813e+03
Boucle du Mouhoun GH 4.629728e+01
Boucle du Mouhoun H 3.350491e+02
Boucle du Mouhoun X 4.430363e+01
CASCADES 0 3.746210e+05
CASCADES A 2.088315e+03
CASCADES E 4.614829e+03
CASCADES G 5.682113e+02
CENTRE 3.211240e+01
CENTRE 0 4.354726e+04
CENTRE A 1.209081e+03
CENTRE B 2.389600e+01
CENTRE E 2.382260e+01
CENTRE F 1.156680e+01
CENTRE G 9.638230e+01
CENTRE X 1.249500e+01
CENTRE EST 0 4.560275e+05
CENTRE EST A 5.914040e+03
CENTRE EST AE 2.406741e+02
CENTRE EST AF 8.649620e+02
CENTRE EST AFG 3.023186e+02
CENTRE EST AG 1.258140e+03
CENTRE EST AGH 1.152287e+01
CENTRE EST AX 1.941847e+02
CENTRE EST B 3.276867e+01
CENTRE EST E 7.296581e+03
CENTRE EST EF 4.281279e+02
CENTRE EST F 7.735838e+03
CENTRE EST FG 1.675070e+02
CENTRE EST G 9.787351e+02
CENTRE EST GX 3.749016e+02
CENTRE EST H 2.146863e+01
CENTRE EST X 1.816117e+02
CENTRE NORD 7.646356e-01
CENTRE NORD 0 1.893526e+05
CENTRE NORD A 5.747162e+04
CENTRE NORD ABC 1.362790e+01
CENTRE NORD ABCD 1.804562e+02
CENTRE NORD AC 1.925797e+02
CENTRE NORD ACD 6.221637e+01
CENTRE NORD AD 1.941897e+04
CENTRE NORD ADF 1.054240e+03
CENTRE NORD ADG 5.567032e+02
CENTRE NORD ADX 2.465983e+01
CENTRE NORD AE 6.378110e+01
CENTRE NORD AF 5.874951e+03
CENTRE NORD AG 3.040105e+03
CENTRE NORD B 9.973341e+02
CENTRE NORD BC 4.736800e+01
CENTRE NORD BD 8.768058e+01
CENTRE NORD C 4.705382e+02
CENTRE NORD CD 7.478400e+01
CENTRE NORD CDG 1.886000e+01
CENTRE NORD CG 3.594900e+01
CENTRE NORD D 1.936667e+04
CENTRE NORD DE 2.225452e+02
CENTRE NORD DF 6.806541e+02
CENTRE NORD DG 1.005752e+03
CENTRE NORD E 3.665002e+02
CENTRE NORD F 1.540630e+04
CENTRE NORD FG 2.344890e+01
CENTRE NORD G 1.143400e+04
CENTRE NORD H 2.316935e+01
CENTRE NORD X 6.010784e+02
CENTRE OUEST 3.345707e+03
CENTRE OUEST 0 8.878089e+05
CENTRE OUEST A 7.506953e+04
CENTRE OUEST AB 2.375929e+03
CENTRE OUEST ABG 3.229434e+02
CENTRE OUEST AD 3.646779e+03
CENTRE OUEST AF 2.180639e+02
CENTRE OUEST AG 1.793601e+02
CENTRE OUEST AX 6.060916e+01
CENTRE OUEST B 4.282715e+02
CENTRE OUEST C 2.765201e+02
CENTRE OUEST D 4.720904e+03
CENTRE OUEST DG 1.363825e+02
CENTRE OUEST E 1.654020e+02
CENTRE OUEST F 1.958334e+03
CENTRE OUEST G 3.680569e+03
CENTRE OUEST H 3.623436e+00
CENTRE OUEST X 8.579104e+02
CENTRE SUD 6.965405e+02
CENTRE SUD 0 2.603044e+05
CENTRE SUD A 7.616872e+03
CENTRE SUD AB 4.411950e+02
CENTRE SUD ABC 1.857348e+02
CENTRE SUD AE 2.141559e+01
CENTRE SUD AF 4.105060e+01
CENTRE SUD AG 7.831105e+01
CENTRE SUD B 4.250263e+03
CENTRE SUD BEF 1.149743e+02
CENTRE SUD C 8.234974e+01
CENTRE SUD CE 4.480000e-01
CENTRE SUD E 2.864300e+03
CENTRE SUD EF 1.128494e+03
CENTRE SUD EFG 8.699853e-01
CENTRE SUD EG 1.848272e+00
CENTRE SUD F 2.294210e+03
CENTRE SUD FG 5.541241e-01
CENTRE SUD G 1.601538e+03
CENTRE SUD H 1.889650e+02
CENTRE SUD X 6.235343e+02
EST 1.455000e+02
EST 0 4.161967e+05
EST A 1.086630e+05
EST AB 7.360812e+02
EST ABDG 1.127803e+03
EST ABE 1.240829e+03
EST ABG 6.675833e+01
EST AE 5.272342e+03
EST AEF 3.271029e+01
EST AEG 1.119917e+02
EST AEH 1.847300e+01
EST AF 5.788457e+03
EST AFG 4.623003e+03
EST AFGH 2.400000e+01
EST AFH 2.501500e+03
EST AG 7.628696e+03
EST AGH 2.000000e+01
EST AH 6.035429e+03
EST B 4.398638e+02
EST BE 4.551104e+02
EST BF 1.199815e+03
EST BG 1.906424e+02
EST C 8.801106e+02
EST CF 9.781833e+01
EST D 7.382662e+02
EST DF 6.079521e+01
EST DG 3.322864e+01
EST E 1.541106e+03
EST EF 2.938455e+03
EST EFG 7.856642e+02
EST EG 5.066016e+02
EST F 9.267799e+03
EST FG 3.347018e+03
EST FH 2.160000e+01
EST G 3.272824e+04
EST H 1.967529e+03
EST X 6.958515e+01
HAUT BASSIN 3.463193e+01
HAUT BASSIN 0 8.530662e+05
HAUT BASSIN A 2.140271e+04
HAUT BASSIN AE 1.139212e+03
HAUT BASSIN AF 3.222556e+02
HAUT BASSIN AG 1.406842e+03
HAUT BASSIN B 2.916494e+03
HAUT BASSIN E 4.851333e+03
HAUT BASSIN F 1.758643e+03
HAUT BASSIN G 3.007882e+03
HAUT BASSIN H 4.192345e+01
HAUT BASSIN X 1.954521e+01
NORD 1.053199e+02
NORD 0 2.112512e+05
NORD A 6.105910e+04
NORD ABFG 1.657034e+02
NORD ABG 1.785974e+02
NORD AC 1.595862e+03
NORD ACD 8.715600e+00
NORD AD 4.350087e+04
NORD ADF 1.099787e+03
NORD ADG 8.084858e+02
NORD AE 1.597760e+02
NORD AF 1.263907e+03
NORD AG 3.843019e+02
NORD AX 7.781057e+01
NORD B 6.414741e+02
NORD BD 1.275912e+02
NORD C 4.775193e+02
NORD CD 9.081343e+02
NORD D 5.297449e+04
NORD DG 3.171079e+02
NORD DX 3.030000e+01
NORD E 1.324867e+03
NORD EFG 8.948240e+01
NORD EG 1.155000e+00
NORD F 8.549129e+03
NORD G 2.732057e+03
NORD H 1.327374e+02
NORD X 7.833114e+01
PLATEAUX CENTRALE 3.102000e+01
PLATEAUX CENTRALE 0 2.405717e+05
PLATEAUX CENTRALE A 2.119680e+04
PLATEAUX CENTRALE AC 7.347627e+02
PLATEAUX CENTRALE ACD 2.303496e+02
PLATEAUX CENTRALE AD 1.908108e+03
PLATEAUX CENTRALE AF 1.790880e+01
PLATEAUX CENTRALE AG 1.482408e+03
PLATEAUX CENTRALE C 7.319100e+01
PLATEAUX CENTRALE D 3.819990e+03
PLATEAUX CENTRALE DF 1.695456e+02
PLATEAUX CENTRALE DG 2.306200e+01
PLATEAUX CENTRALE E 2.575140e+01
PLATEAUX CENTRALE F 4.574983e+03
PLATEAUX CENTRALE G 7.058734e+03
PLATEAUX CENTRALE X 1.078628e+02
SAHEL 4.186607e+01
SAHEL 0 1.059030e+05
SAHEL A 1.605075e+04
SAHEL AD 5.820728e+02
SAHEL ADF 1.395189e+01
SAHEL ADFG 2.343298e+02
SAHEL ADG 1.357971e+03
SAHEL AE 3.667946e+02
SAHEL AF 6.541717e+02
SAHEL AG 5.562332e+03
SAHEL CD 1.287603e+01
SAHEL D 1.081783e+03
SAHEL DG 1.082172e+03
SAHEL E 1.449211e+03
SAHEL EG 2.293285e+02
SAHEL F 5.992585e+03
SAHEL FG 6.643771e+03
SAHEL G 3.569097e+04
SAHEL X 5.557388e+02
SUD OUEST 9.169621e+02
SUD OUEST 0 3.927923e+05
SUD OUEST A 3.217781e+04
SUD OUEST E 8.649426e+02
SUD OUEST G 2.282548e+03
SUD OUEST X 2.041345e+02
library(dplyr)
# Forcer l'encodage des colonnes de texte dans BASE_TP en UTF-8
BASE_TP$S12C12 <- iconv(BASE_TP$S12C12, from = "latin1", to = "UTF-8")

# Recalculez les rendements moyens après la modification
rendements_descriptif <- BASE_TP %>%
  filter(!is.na(S12C12), !is.na(rend11C)) %>%  # Exclusion des valeurs manquantes
  group_by(S12C12) %>%  # Regroupement par niveau de sécurisation foncière
  summarise(
    rendement_moyen = mean(rend11C, na.rm = TRUE),  # Moyenne des rendements
    n = n()  # Nombre d'observations par niveau
  )

# Afficher les résultats
kable(rendements_descriptif)
S12C12 rendement_moyen n
Acte de cession de possession fonciere rurale 1208.2647 10548
Attestation de Possession Fonciere(APF) 1300.5213 36589
Aucun 1421.0483 5538014
Autorisation de mise en valeur temporaire 1286.9256 5011
Bail 1354.6975 2248
Permis d’exploiter 804.6389 3769
Possesseur terrien 1280.7664 7470237
Titre foncier 1351.8524 87837
# Chargement des bibliothèques nécessaires
library(dplyr)
library(ggplot2)
library(plotly)
## 
## Attaching package: 'plotly'
## The following object is masked from 'package:ggplot2':
## 
##     last_plot
## The following object is masked from 'package:stats':
## 
##     filter
## The following object is masked from 'package:graphics':
## 
##     layout
# Exemple de préparation des données (remplacez 'BASE_TP' par votre propre jeu de données)
BASE_TP$S12C12 <- iconv(BASE_TP$S12C12, from = "latin1", to = "UTF-8")

# Calcul des rendements moyens
rendements_descriptif <- BASE_TP %>%
  filter(!is.na(S12C12), !is.na(rend11C)) %>%  # Exclusion des valeurs manquantes
  group_by(S12C12) %>%  # Regroupement par niveau de sécurisation foncière
  summarise(
    rendement_moyen = mean(rend11C, na.rm = TRUE),  # Moyenne des rendements
    n = n()  # Nombre d'observations par niveau
  ) %>%
  arrange(rendement_moyen)  # Tri des données du plus petit au plus grand rendement moyen

# Création du graphique en barre verticale
p <- ggplot(rendements_descriptif, aes(x = reorder(S12C12, rendement_moyen), y = rendement_moyen)) +
  geom_bar(stat = "identity", fill = "steelblue") +
  coord_flip() +  # Pour que les barres soient horizontales
  labs(
    title = "Rendements moyens par niveau de sécurisation foncière",
    x = "Niveau de sécurisation foncière",
    y = "Rendement moyen"
  ) +
  theme_minimal()

# Conversion du graphique ggplot en graphique interactif avec plotly
interactive_plot <- ggplotly(p)

# Affichage du graphique interactif
interactive_plot

5. Impact de la Sécurisation Foncière :

Quel est l’impact du niveau de sécurisation foncière sur les rendements des cultures ?

(Intercept) : L’intercept est estimé à 1421.048, ce qui signifie que lorsque toutes les modalités de sécurisation foncière sont égales à zéro (la catégorie de référence, “Aucun”), le rendement moyen est de 1421.048unités. Acte de cession de possession foncière rurale : Le coefficient est de -212.784, avec une p_value de < 2e-16, ce qui indique que cette forme de sécurisation foncière diminue les rendements agricoles de -212.784 Unités par rapport à la catégorie de référence “Aucun”.

Attestation de Possession Foncière (APF) : Le coefficient est de -120.527, également avec une p_value de < 2e-16, indiquant une diminution de -120.527 unités du rendement agricole par rapport à “Aucun”. Tandis que des formes comme le permis d’exploiter ou le titre foncier et possesseur terrien ont également un impact négatif sur les rendements agricole. La faible valeur de R² indique que la variabilité des rendements agricoles dépend principalement d’autres facteurs non inclus dans ce modèle. Il peut s’agira des facteurs pluviométrique, climatique et la qualité de l’entretien des exploitations agricole.

# Régression simple

#BASE_TP$S12C12 <- relevel(BASE_TP$S12C12, ref = "Aucun") #modalité de référence
library(dplyr)
library(forcats)

# Recréer la variable S12C12 avec la modalité de référence définie comme "Aucun"
BASE_TP <- BASE_TP %>%
  mutate(S12C12 = fct_relevel(S12C12, "Aucun"))
impact_rendement_simple <- lm(rend11C ~ factor(S12C12), data = BASE_TP)
summary(impact_rendement_simple)
## 
## Call:
## lm(formula = rend11C ~ factor(S12C12), data = BASE_TP)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
##   -1381    -801    -481     -41 1305519 
## 
## Coefficients:
##                                                             Estimate Std. Error
## (Intercept)                                                 1421.048      2.946
## factor(S12C12)Acte de cession de possession fonciere rurale -212.784     67.561
## factor(S12C12)Attestation de Possession Fonciere(APF)       -120.527     36.360
## factor(S12C12)Autorisation de mise en valeur temporaire     -134.123     97.971
## factor(S12C12)Bail                                           -66.351    146.236
## factor(S12C12)Permis d'exploiter                            -616.409    112.954
## factor(S12C12)Possesseur terrien                            -140.282      3.887
## factor(S12C12)Titre foncier                                  -69.196     23.575
##                                                             t value Pr(>|t|)
## (Intercept)                                                 482.415  < 2e-16
## factor(S12C12)Acte de cession de possession fonciere rurale  -3.150 0.001635
## factor(S12C12)Attestation de Possession Fonciere(APF)        -3.315 0.000917
## factor(S12C12)Autorisation de mise en valeur temporaire      -1.369 0.171000
## factor(S12C12)Bail                                           -0.454 0.650028
## factor(S12C12)Permis d'exploiter                             -5.457 4.84e-08
## factor(S12C12)Possesseur terrien                            -36.089  < 2e-16
## factor(S12C12)Titre foncier                                  -2.935 0.003333
##                                                                
## (Intercept)                                                 ***
## factor(S12C12)Acte de cession de possession fonciere rurale ** 
## factor(S12C12)Attestation de Possession Fonciere(APF)       ***
## factor(S12C12)Autorisation de mise en valeur temporaire        
## factor(S12C12)Bail                                             
## factor(S12C12)Permis d'exploiter                            ***
## factor(S12C12)Possesseur terrien                            ***
## factor(S12C12)Titre foncier                                 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 6932 on 13154245 degrees of freedom
##   (1190110 observations deleted due to missingness)
## Multiple R-squared:  0.0001011,  Adjusted R-squared:  0.0001006 
## F-statistic: 190.1 on 7 and 13154245 DF,  p-value: < 2.2e-16

L’ANOVA permet de tester l’hypothèse nulle suivante : “Les moyennes des groupes (sécurisation foncière) sont égales.” Si la p-valeur est inférieure au seuil de 0.05, alors on rejette l’hypothèse nulle et on conclut que les moyennes diffèrent significativement pour au moins un groupe (sécurisation foncière). Nous avons une p_value qui est de 156.8 <2e-16 *** qui est inférieur à 0.05 alors nous concluons en rejetant l’hypothèse nulle ainsi, les rendements moyens par sécurisation foncière sont différents.

# Exclure les valeurs manquantes
BASE_TP <- BASE_TP %>%
  filter(!is.na(S12C12), !is.na(rend11C))
# ANOVA à un facteur
anova_test <- aov(rend11C ~ S12C12, data = BASE_TP)

# Résumé des résultats de l'ANOVA
summary(anova_test)
##                   Df    Sum Sq   Mean Sq F value Pr(>F)    
## S12C12             7 6.394e+10 9.134e+09   190.1 <2e-16 ***
## Residuals   13154245 6.321e+14 4.805e+07                   
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1