options (prompt = “Huyen >”)

Dữ liệu mà R hiểu được phải là dữ liệu trong 1 data.frame; cac cach nhap du lieu thong dung: - Nhap du lieu truc tiep - Nhap du lieu trong frame - Doc du lieu tu cac phan mem khac nhu excel

  1. Nhap so lieu truc tiep: c () ; c la viet tat cua chu concatenation - “moc noi vao nhau”) Vd: Chung ta co so lieu ve do tuoi va insulin cho 10 BN
age = c(50, 62, 60, 40, 48, 47, 57, 70, 48, 67)
insulin = c(16.5, 10.8, 32.3, 19.3, 14.2, 11.3, 15.5, 15.8, 16.2, 11.2)
BN = data.frame(age, insulin)
BN

age insulin 1 50 16.5 2 62 10.8 3 60 32.3 4 40 19.3 5 48 14.2 6 47 11.3 7 57 15.5 8 70 15.8 9 48 16.2 10 67 11.2

De luu file du lieu:

save (BN, file= "BN.rda")
  1. NHAP SO LIEU TRUC TIEP: edit(data.frame())

VD1:

ins=edit(data.frame())
  1. NHAP SO LIEU TU MOT TEXT FILE: read.table
setwd("/Volumes/DATA/6. NGHIEN CUU KHOA HOC/R")
Chol = read.table("chol.txt", header =TRUE)

Kiem tra xe R da doc het du lieu hay chua bang cach ra lenh

Chol 
names(Chol)
## [1] "id"

O tren day la dinh dang loi do file word chuyen doi tu docx qua .txt khong con o dang bang. Sau khi co .txt dang bang, ta co file

minh khong biet bi loi gi, de day ban sau nhe

bay gio chung ta co the luu du lieu duoi dang R de xu ly sau nay bang cach ra lenh

save(Chol,file="chol.rda")
  1. NHAP SO LIEU TU EXCEL: read.csv

B1: Dung lenh “Save as” de luu du lieu duoi dang “csv” B2: Dung R (lenh read.csv) de nhap du lieu dang csv

setwd("/Volumes/DATA/6. NGHIEN CUU KHOA HOC/R")
chol3=read.csv("chol3.csv", header=TRUE)

Luu du lieu duoi dang R de xu ly sau nay:

save(chol3, file ="chol3.rda")
  1. NHAP SO LIEU TU 1 SPSS: read.spss phan mem SPSS luu du lieu dang “sav”. De chuyen du lieu nay sang dang R co the hieu duoc, chung ta can sd lenh: read.spss trong package ten la foreign. Gia su minh co file du lieu la “chol4.sav” {r} library(foreign) setwd("/Volumes/DATA/6. NGHIEN CUU KHOA HOC/R") chol4 = read.spss("chol4.sav", to.data.frame=TRUE) save(chol4, file ="chol4.rda")
  1. THONG TIN CO BAN VE DU LIEU

De xem trong du lieu co gi, chung ta co the nhap vao R nhu sau:

1, Dan cho R biet chung ta muon xu ly chol3 bang cach dung lenh "attach(arg) voi arg le ten cua du lieu

attach(chol3)
## The following object is masked _by_ .GlobalEnv:
## 
##     age

2, Chung ta co the kiem tra xem chol3 co phai la 1 data.frame khong bang lenh is.data.frame(arg) voi arg le ten cua du lieu.

is.data.frame(chol3)
## [1] TRUE

R cho biet chol3 qua la 1 data.frame

3, Co bao nhieu cot (variable = bien so) va dong so lieu (observations) trong du lieu nay? Chung ta dung lenh dim (arg) voi arg la ten cua du lieu. dim viet tat chu dimension

dim(chol3)
## [1] 10  8

Nhu vay chung ta co 10 dong va 8 cot (hay Bien so). Vay nhung bien so nay ten gi? Chung ta dung lenh names(arg) voi arg la ten cua du lieu.

names(chol3)
## [1] "id"  "sex" "age" "bmi" "hdl" "ldl" "tc"  "tg"

Trong bien so “sex” chung ta co bao nhieu “nam” va “nu”? Chung ta dung lenh table(arg) voi arg la ten cua bien so.

table(sex)
## sex
## nam  nu 
##   6   4

Chu y R phan biet “nam” va “Nam” nen can lam sach so lieu truoc khi phan tich! :)