R Markdown

This is an R Markdown document. Markdown is a simple formatting syntax for authoring HTML, PDF, and MS Word documents. For more details on using R Markdown see http://rmarkdown.rstudio.com.

When you click the Knit button a document will be generated that includes both content as well as the output of any embedded R code chunks within the document. You can embed an R code chunk like this:

R Markdown

data=read.csv("Masur_Dal_2019.csv",header=TRUE)
r=data.frame(data)
head(r)
##   state district   market commodity   variety arrival_date min_price max_price
## 1 Assam Goalpara Goalpara Masur Dal Masur Dal   01/01/2019      5700      6500
## 2 Assam Goalpara Goalpara Masur Dal Masur Dal   02/01/2019      5700      6500
## 3 Assam Goalpara Goalpara Masur Dal Masur Dal   03/01/2019      5600      6500
## 4 Assam Goalpara Goalpara Masur Dal Masur Dal   04/01/2019      5600      6500
## 5 Assam Goalpara Goalpara Masur Dal Masur Dal   06/01/2019      5600      6500
## 6 Assam Goalpara Goalpara Masur Dal Masur Dal   07/01/2019      5600      6500
##   modal_price
## 1        6000
## 2        6000
## 3        6100
## 4        6100
## 5        6100
## 6        6100

#import a data set

summary(data)
##     state             district            market           commodity        
##  Length:1407        Length:1407        Length:1407        Length:1407       
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##    variety          arrival_date         min_price      max_price   
##  Length:1407        Length:1407        Min.   :   0   Min.   :2315  
##  Class :character   Class :character   1st Qu.:4800   1st Qu.:5200  
##  Mode  :character   Mode  :character   Median :5425   Median :5900  
##                                        Mean   :5110   Mean   :5939  
##                                        3rd Qu.:6100   3rd Qu.:6700  
##                                        Max.   :8400   Max.   :9000  
##   modal_price  
##  Min.   :2315  
##  1st Qu.:5050  
##  Median :5700  
##  Mean   :5804  
##  3rd Qu.:6500  
##  Max.   :8500
str(data)
## 'data.frame':    1407 obs. of  9 variables:
##  $ state       : chr  "Assam" "Assam" "Assam" "Assam" ...
##  $ district    : chr  "Goalpara" "Goalpara" "Goalpara" "Goalpara" ...
##  $ market      : chr  "Goalpara" "Goalpara" "Goalpara" "Goalpara" ...
##  $ commodity   : chr  "Masur Dal" "Masur Dal" "Masur Dal" "Masur Dal" ...
##  $ variety     : chr  "Masur Dal" "Masur Dal" "Masur Dal" "Masur Dal" ...
##  $ arrival_date: chr  "01/01/2019" "02/01/2019" "03/01/2019" "04/01/2019" ...
##  $ min_price   : int  5700 5700 5600 5600 5600 5600 5600 5600 5600 5600 ...
##  $ max_price   : int  6500 6500 6500 6500 6500 6500 6500 6500 6500 6500 ...
##  $ modal_price : int  6000 6000 6100 6100 6100 6100 6100 6100 6100 6100 ...

unique value in data set

freq=table(data$district)
head(freq)
## 
##     Agra  Aligarh    Banda  Bankura Bareilly    Bhind 
##       48       49       43       18       20        2
freq1=table(data$state)
head(freq1)
## 
##          Assam        Gujarat      Jharkhand Madhya Pradesh    Maharashtra 
##            148              1              1             71             46 
##        Manipur 
##            139

select

select=select(data,c(1:5))
head(select)
##   state district   market commodity   variety
## 1 Assam Goalpara Goalpara Masur Dal Masur Dal
## 2 Assam Goalpara Goalpara Masur Dal Masur Dal
## 3 Assam Goalpara Goalpara Masur Dal Masur Dal
## 4 Assam Goalpara Goalpara Masur Dal Masur Dal
## 5 Assam Goalpara Goalpara Masur Dal Masur Dal
## 6 Assam Goalpara Goalpara Masur Dal Masur Dal
select1=select(data,-state,-district)
head(select1)
##     market commodity   variety arrival_date min_price max_price modal_price
## 1 Goalpara Masur Dal Masur Dal   01/01/2019      5700      6500        6000
## 2 Goalpara Masur Dal Masur Dal   02/01/2019      5700      6500        6000
## 3 Goalpara Masur Dal Masur Dal   03/01/2019      5600      6500        6100
## 4 Goalpara Masur Dal Masur Dal   04/01/2019      5600      6500        6100
## 5 Goalpara Masur Dal Masur Dal   06/01/2019      5600      6500        6100
## 6 Goalpara Masur Dal Masur Dal   07/01/2019      5600      6500        6100

filter

filtered <- filter(data, min_price=="5700" )
head(filtered,10)
##    state district                 market commodity   variety arrival_date
## 1  Assam Goalpara               Goalpara Masur Dal Masur Dal   01/01/2019
## 2  Assam Goalpara               Goalpara Masur Dal Masur Dal   02/01/2019
## 3  Assam   Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal   01/01/2019
## 4  Assam   Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal   02/01/2019
## 5  Assam   Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal   03/01/2019
## 6  Assam   Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal   04/01/2019
## 7  Assam   Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal   05/01/2019
## 8  Assam   Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal   07/01/2019
## 9  Assam   Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal   10/01/2019
## 10 Assam   Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal   11/01/2019
##    min_price max_price modal_price
## 1       5700      6500        6000
## 2       5700      6500        6000
## 3       5700      6500        6100
## 4       5700      6500        6100
## 5       5700      6700        6500
## 6       5700      6500        6100
## 7       5700      6500        6100
## 8       5700      6500        6100
## 9       5700      6500        6100
## 10      5700      6500        6100

mutate a data set

m1 <- mutate(data, Greater.Half = max_price > 0.5 * modal_price)
tail(m1)
##            state district  market commodity   variety arrival_date min_price
## 1402 West Bengal Puruliya Purulia Masur Dal Masur Dal   19/02/2019      6200
## 1403 West Bengal Puruliya Purulia Masur Dal Masur Dal   21/02/2019      6300
## 1404 West Bengal Puruliya Purulia Masur Dal Masur Dal   22/02/2019      6300
## 1405 West Bengal Puruliya Purulia Masur Dal Masur Dal   23/02/2019      6200
## 1406 West Bengal Puruliya Purulia Masur Dal Masur Dal   25/02/2019      6100
## 1407 West Bengal Puruliya Purulia Masur Dal Masur Dal   26/02/2019      6200
##      max_price modal_price Greater.Half
## 1402      6300        6300         TRUE
## 1403      6400        6400         TRUE
## 1404      6400        6300         TRUE
## 1405      6400        6300         TRUE
## 1406      6300        6200         TRUE
## 1407      6300        6300         TRUE

arrange a data set

To arrange modal price in ascending order

arranged <- arrange(m1,modal_price)
head(arranged)
##            state district  market commodity         variety arrival_date
## 1 Madhya Pradesh   Ujjain  Ujjain Masur Dal     Masoor Gola   09/01/2019
## 2 Madhya Pradesh   Ujjain  Ujjain Masur Dal     Masoor Gola   25/02/2019
## 3 Madhya Pradesh   Ujjain  Ujjain Masur Dal     Masoor Gola   02/01/2019
## 4 Madhya Pradesh   Ujjain  Ujjain Masur Dal     Masoor Gola   18/02/2019
## 5 Madhya Pradesh   Ujjain  Ujjain Masur Dal     Masoor Gola   28/01/2019
## 6 Madhya Pradesh    Bhind Alampur Masur Dal Kala Masoor New   18/01/2019
##   min_price max_price modal_price Greater.Half
## 1      2000      2315        2315         TRUE
## 2      2601      2601        2601         TRUE
## 3      3196      3196        3196         TRUE
## 4      2780      3201        3201         TRUE
## 5      3240      3240        3240         TRUE
## 6      3200      3300        3250         TRUE

To arrange max. price in descending order

arranged <- arrange(m1, desc(max_price))
head(arranged)
##     state      district market commodity         variety arrival_date min_price
## 1 Tripura North Tripura  Dasda Masur Dal Kala Masoor New   01/01/2019      7500
## 2 Tripura North Tripura  Dasda Masur Dal Kala Masoor New   04/01/2019      7000
## 3 Tripura North Tripura  Dasda Masur Dal Kala Masoor New   06/01/2019      7000
## 4 Tripura North Tripura  Dasda Masur Dal Kala Masoor New   09/01/2019      7500
## 5 Tripura North Tripura  Dasda Masur Dal Kala Masoor New   10/01/2019      7500
## 6 Tripura North Tripura  Dasda Masur Dal Kala Masoor New   11/01/2019      7000
##   max_price modal_price Greater.Half
## 1      9000        8000         TRUE
## 2      9000        8000         TRUE
## 3      9000        8000         TRUE
## 4      9000        8000         TRUE
## 5      9000        8000         TRUE
## 6      9000        8000         TRUE

pipe operator

data %>% filter(min_price == "5700",modal_price < 6700)
##            state          district                 market commodity   variety
## 1          Assam          Goalpara               Goalpara Masur Dal Masur Dal
## 2          Assam          Goalpara               Goalpara Masur Dal Masur Dal
## 3          Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 4          Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 5          Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 6          Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 7          Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 8          Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 9          Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 10         Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 11         Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 12         Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 13         Assam            Kamrup P.O. Uparhali Guwahati Masur Dal Masur Dal
## 14 Uttar Pradesh              Agra                   Agra Masur Dal Masur Dal
## 15 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 16 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 17 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 18 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 19 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 20 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 21 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 22 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 23 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 24 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 25 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 26 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 27 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 28 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 29 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 30 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 31 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 32 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 33 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 34 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 35 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 36 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 37 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 38 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 39 Uttar Pradesh Gautam Budh Nagar                  Dadri Masur Dal Masur Dal
## 40 Uttar Pradesh     Muzaffarnagar                 Shamli Masur Dal Masur Dal
## 41 Uttar Pradesh     Muzaffarnagar                 Shamli Masur Dal Masur Dal
## 42 Uttar Pradesh     Muzaffarnagar                 Shamli Masur Dal Masur Dal
## 43 Uttar Pradesh            Rampur               Vilaspur Masur Dal Masur Dal
## 44 Uttar Pradesh            Rampur               Vilaspur Masur Dal Masur Dal
## 45 Uttar Pradesh         Sultanpur              Sultanpur Masur Dal Masur Dal
##    arrival_date min_price max_price modal_price
## 1    01/01/2019      5700      6500        6000
## 2    02/01/2019      5700      6500        6000
## 3    01/01/2019      5700      6500        6100
## 4    02/01/2019      5700      6500        6100
## 5    03/01/2019      5700      6700        6500
## 6    04/01/2019      5700      6500        6100
## 7    05/01/2019      5700      6500        6100
## 8    07/01/2019      5700      6500        6100
## 9    10/01/2019      5700      6500        6100
## 10   11/01/2019      5700      6500        6100
## 11   14/01/2019      5700      6500        6100
## 12   16/01/2019      5700      6500        6100
## 13   17/01/2019      5700      6500        6100
## 14   01/01/2019      5700      6000        5850
## 15   01/01/2019      5700      5900        5800
## 16   05/01/2019      5700      5900        5800
## 17   06/01/2019      5700      5900        5800
## 18   07/01/2019      5700      5900        5800
## 19   08/01/2019      5700      5900        5800
## 20   10/01/2019      5700      5900        5800
## 21   11/01/2019      5700      5900        5800
## 22   12/01/2019      5700      5900        5800
## 23   13/01/2019      5700      5890        5800
## 24   14/01/2019      5700      5900        5800
## 25   15/01/2019      5700      5900        5800
## 26   17/01/2019      5700      5900        5800
## 27   18/01/2019      5700      5900        5800
## 28   19/01/2019      5700      5900        5800
## 29   20/01/2019      5700      5900        5800
## 30   22/01/2019      5700      5900        5800
## 31   24/01/2019      5700      5890        5800
## 32   05/02/2019      5700      5900        5800
## 33   07/02/2019      5700      5900        5800
## 34   15/02/2019      5700      5900        5800
## 35   16/02/2019      5700      5900        5800
## 36   17/02/2019      5700      5900        5800
## 37   18/02/2019      5700      5900        5800
## 38   22/02/2019      5700      5900        5800
## 39   26/02/2019      5700      5900        5800
## 40   16/02/2019      5700      5900        5800
## 41   19/02/2019      5700      5900        5800
## 42   21/02/2019      5700      5900        5800
## 43   21/02/2019      5700      5780        5740
## 44   25/02/2019      5700      5800        5750
## 45   11/01/2019      5700      6000        5800

columns values as vectors

vec=data %>% pull(modal_price)
tail(vec)
## [1] 6300 6400 6300 6300 6200 6300

remove column

rem1=data %>% select(-market)
head(rem1)
##   state district commodity   variety arrival_date min_price max_price
## 1 Assam Goalpara Masur Dal Masur Dal   01/01/2019      5700      6500
## 2 Assam Goalpara Masur Dal Masur Dal   02/01/2019      5700      6500
## 3 Assam Goalpara Masur Dal Masur Dal   03/01/2019      5600      6500
## 4 Assam Goalpara Masur Dal Masur Dal   04/01/2019      5600      6500
## 5 Assam Goalpara Masur Dal Masur Dal   06/01/2019      5600      6500
## 6 Assam Goalpara Masur Dal Masur Dal   07/01/2019      5600      6500
##   modal_price
## 1        6000
## 2        6000
## 3        6100
## 4        6100
## 5        6100
## 6        6100

group by

grp= data %>% group_by(min_price) %>% summarize(n())
grp
## # A tibble: 169 × 2
##    min_price `n()`
##        <int> <int>
##  1         0   104
##  2      2000     1
##  3      2501     1
##  4      2601     1
##  5      2780     1
##  6      3046     1
##  7      3196     1
##  8      3200     7
##  9      3240     1
## 10      3300    17
## # … with 159 more rows