df=data.frame(genero=gl(2,60,120,labels=c("M","F")),
edad=round(rnorm(120,45,10),0),
nivel_edu=sample(x=c("P","S","T","U"),
120,replace = T),
hab_fumar=sample(x=c("R","AV","N"),
120,replace = T),
diabetes=sample(x=c("S","N"),120,
replace = T),
hiperten=sample(x=c("S","N"),120,
replace = T),
alerg=sample(x=c("S","N"),120,
replace = T),
hijos=rbinom(120,3,0.4))
df[3,2] = 10
df[,2]
## [1] 61 50 10 65 46 59 39 36 53 29 55 36 60 43 51 28 52 31 56 44 55 43 42 34 44
## [26] 37 50 23 46 49 43 53 53 27 38 52 36 41 54 51 42 47 48 46 36 56 45 56 50 53
## [51] 42 42 51 41 32 44 48 52 62 36 39 61 50 65 45 48 62 30 30 72 61 33 32 63 50
## [76] 36 27 46 42 46 42 60 37 35 59 51 44 61 30 47 14 43 58 58 31 59 59 41 58 34
## [101] 63 37 58 52 25 42 37 55 58 46 50 50 51 53 56 46 48 30 39 45
df[,c("edad","genero")]
## edad genero
## 1 61 M
## 2 50 M
## 3 10 M
## 4 65 M
## 5 46 M
## 6 59 M
## 7 39 M
## 8 36 M
## 9 53 M
## 10 29 M
## 11 55 M
## 12 36 M
## 13 60 M
## 14 43 M
## 15 51 M
## 16 28 M
## 17 52 M
## 18 31 M
## 19 56 M
## 20 44 M
## 21 55 M
## 22 43 M
## 23 42 M
## 24 34 M
## 25 44 M
## 26 37 M
## 27 50 M
## 28 23 M
## 29 46 M
## 30 49 M
## 31 43 M
## 32 53 M
## 33 53 M
## 34 27 M
## 35 38 M
## 36 52 M
## 37 36 M
## 38 41 M
## 39 54 M
## 40 51 M
## 41 42 M
## 42 47 M
## 43 48 M
## 44 46 M
## 45 36 M
## 46 56 M
## 47 45 M
## 48 56 M
## 49 50 M
## 50 53 M
## 51 42 M
## 52 42 M
## 53 51 M
## 54 41 M
## 55 32 M
## 56 44 M
## 57 48 M
## 58 52 M
## 59 62 M
## 60 36 M
## 61 39 F
## 62 61 F
## 63 50 F
## 64 65 F
## 65 45 F
## 66 48 F
## 67 62 F
## 68 30 F
## 69 30 F
## 70 72 F
## 71 61 F
## 72 33 F
## 73 32 F
## 74 63 F
## 75 50 F
## 76 36 F
## 77 27 F
## 78 46 F
## 79 42 F
## 80 46 F
## 81 42 F
## 82 60 F
## 83 37 F
## 84 35 F
## 85 59 F
## 86 51 F
## 87 44 F
## 88 61 F
## 89 30 F
## 90 47 F
## 91 14 F
## 92 43 F
## 93 58 F
## 94 58 F
## 95 31 F
## 96 59 F
## 97 59 F
## 98 41 F
## 99 58 F
## 100 34 F
## 101 63 F
## 102 37 F
## 103 58 F
## 104 52 F
## 105 25 F
## 106 42 F
## 107 37 F
## 108 55 F
## 109 58 F
## 110 46 F
## 111 50 F
## 112 50 F
## 113 51 F
## 114 53 F
## 115 56 F
## 116 46 F
## 117 48 F
## 118 30 F
## 119 39 F
## 120 45 F
View(df)
new_data=df[,c("edad","hijos")]
dim(df)
## [1] 120 8
xy=expand.grid(x=seq(0,120,20),
y=seq(0,120,20))
View(df)
df$hijos[df$genero=="M"]
## [1] 1 3 1 1 1 0 3 0 2 1 2 0 0 2 2 0 1 1 0 1 2 1 1 1 1 1 1 1 2 0 1 0 1 3 0 0 2 0
## [39] 2 2 0 2 0 1 1 0 1 0 2 1 2 2 2 2 0 2 0 1 1 2
View(df[df$genero=="M",])
View(df[df$genero=="M" & df$hab_fumar=="N",])
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
df1=df %>%
filter(genero=="F") %>%
select(nivel_edu,diabetes)
View(df1)
x<-c(1,2,3,4,5,NA,2,NA)
filter(df, !is.na(edad))
## genero edad nivel_edu hab_fumar diabetes hiperten alerg hijos
## 1 M 61 U R S S S 1
## 2 M 50 S N S N S 3
## 3 M 10 S R N S S 1
## 4 M 65 P R N N N 1
## 5 M 46 P R N N N 1
## 6 M 59 T R N N S 0
## 7 M 39 P AV S S N 3
## 8 M 36 U N S S S 0
## 9 M 53 U R N S S 2
## 10 M 29 P N S S N 1
## 11 M 55 P N S N S 2
## 12 M 36 T N N S N 0
## 13 M 60 U R N N N 0
## 14 M 43 P AV N N N 2
## 15 M 51 T N N S N 2
## 16 M 28 S AV N N N 0
## 17 M 52 U AV S S S 1
## 18 M 31 P R N S N 1
## 19 M 56 U N S N N 0
## 20 M 44 T R N S S 1
## 21 M 55 S R S N N 2
## 22 M 43 T R N N N 1
## 23 M 42 U N N S N 1
## 24 M 34 U R N S S 1
## 25 M 44 U AV N N N 1
## 26 M 37 T N N N N 1
## 27 M 50 P N S N N 1
## 28 M 23 U R S S N 1
## 29 M 46 T N N S S 2
## 30 M 49 P R N S S 0
## 31 M 43 T N N N S 1
## 32 M 53 U AV N S S 0
## 33 M 53 T AV S S N 1
## 34 M 27 S N N N N 3
## 35 M 38 S AV N N S 0
## 36 M 52 U N S S S 0
## 37 M 36 U R N S S 2
## 38 M 41 P AV N S S 0
## 39 M 54 T R N N N 2
## 40 M 51 T R N S N 2
## 41 M 42 S R N N N 0
## 42 M 47 U N N N N 2
## 43 M 48 U R N N N 0
## 44 M 46 T R N N N 1
## 45 M 36 S N S N S 1
## 46 M 56 U N S S S 0
## 47 M 45 T N N N N 1
## 48 M 56 P R S S N 0
## 49 M 50 P AV S N N 2
## 50 M 53 P AV S N N 1
## 51 M 42 U R S N S 2
## 52 M 42 T AV S S N 2
## 53 M 51 T AV S S S 2
## 54 M 41 U R S S N 2
## 55 M 32 P AV N N S 0
## 56 M 44 S AV S S S 2
## 57 M 48 U R N N N 0
## 58 M 52 P R S S S 1
## 59 M 62 T N S N S 1
## 60 M 36 T N S N N 2
## 61 F 39 T AV N S S 2
## 62 F 61 T N N N S 0
## 63 F 50 P R N S S 0
## 64 F 65 U AV N S S 2
## 65 F 45 P R N N S 2
## 66 F 48 U N N S S 1
## 67 F 62 U N S N S 1
## 68 F 30 U N S S S 0
## 69 F 30 T AV S N S 1
## 70 F 72 U R N S S 2
## 71 F 61 P R N S S 2
## 72 F 33 U R N N N 0
## 73 F 32 S R N N N 2
## 74 F 63 U AV S S N 1
## 75 F 50 U AV N S S 2
## 76 F 36 T AV N N S 0
## 77 F 27 S N S S S 1
## 78 F 46 S AV N N N 0
## 79 F 42 S N N S S 1
## 80 F 46 T R S N N 3
## 81 F 42 S R S S S 1
## 82 F 60 P AV N N S 1
## 83 F 37 T AV N N N 1
## 84 F 35 U AV N N S 1
## 85 F 59 U AV S N N 1
## 86 F 51 S N N N S 1
## 87 F 44 U R S S S 2
## 88 F 61 S R N N N 0
## 89 F 30 P N S S S 1
## 90 F 47 P N S N N 1
## 91 F 14 U AV N N S 1
## 92 F 43 P N N S N 0
## 93 F 58 U R S N N 1
## 94 F 58 S AV S N S 1
## 95 F 31 T AV S S S 0
## 96 F 59 S R S N N 2
## 97 F 59 S R N N N 1
## 98 F 41 U N N S S 1
## 99 F 58 U N N N N 2
## 100 F 34 S AV S S N 1
## 101 F 63 S AV N N S 1
## 102 F 37 P N N S N 0
## 103 F 58 T AV N N N 3
## 104 F 52 U N N S S 1
## 105 F 25 P R S S N 2
## 106 F 42 U N S N N 2
## 107 F 37 S N N S S 2
## 108 F 55 U R S S N 1
## 109 F 58 P N N S S 1
## 110 F 46 T AV N S N 2
## 111 F 50 P N S N N 0
## 112 F 50 T AV S N S 1
## 113 F 51 S AV S N N 2
## 114 F 53 P R S N S 0
## 115 F 56 T R N N S 1
## 116 F 46 S N S N N 1
## 117 F 48 U AV N N S 1
## 118 F 30 T AV N S S 1
## 119 F 39 S AV N N N 1
## 120 F 45 U R S N S 1
filter(df,nivel_edu %in% c("P", "S"))
## genero edad nivel_edu hab_fumar diabetes hiperten alerg hijos
## 1 M 50 S N S N S 3
## 2 M 10 S R N S S 1
## 3 M 65 P R N N N 1
## 4 M 46 P R N N N 1
## 5 M 39 P AV S S N 3
## 6 M 29 P N S S N 1
## 7 M 55 P N S N S 2
## 8 M 43 P AV N N N 2
## 9 M 28 S AV N N N 0
## 10 M 31 P R N S N 1
## 11 M 55 S R S N N 2
## 12 M 50 P N S N N 1
## 13 M 49 P R N S S 0
## 14 M 27 S N N N N 3
## 15 M 38 S AV N N S 0
## 16 M 41 P AV N S S 0
## 17 M 42 S R N N N 0
## 18 M 36 S N S N S 1
## 19 M 56 P R S S N 0
## 20 M 50 P AV S N N 2
## 21 M 53 P AV S N N 1
## 22 M 32 P AV N N S 0
## 23 M 44 S AV S S S 2
## 24 M 52 P R S S S 1
## 25 F 50 P R N S S 0
## 26 F 45 P R N N S 2
## 27 F 61 P R N S S 2
## 28 F 32 S R N N N 2
## 29 F 27 S N S S S 1
## 30 F 46 S AV N N N 0
## 31 F 42 S N N S S 1
## 32 F 42 S R S S S 1
## 33 F 60 P AV N N S 1
## 34 F 51 S N N N S 1
## 35 F 61 S R N N N 0
## 36 F 30 P N S S S 1
## 37 F 47 P N S N N 1
## 38 F 43 P N N S N 0
## 39 F 58 S AV S N S 1
## 40 F 59 S R S N N 2
## 41 F 59 S R N N N 1
## 42 F 34 S AV S S N 1
## 43 F 63 S AV N N S 1
## 44 F 37 P N N S N 0
## 45 F 25 P R S S N 2
## 46 F 37 S N N S S 2
## 47 F 58 P N N S S 1
## 48 F 50 P N S N N 0
## 49 F 51 S AV S N N 2
## 50 F 53 P R S N S 0
## 51 F 46 S N S N N 1
## 52 F 39 S AV N N N 1
openxlsx::write.xlsx(df1,"datos_diseno.xlsx")