第3回 R (Colaboratory) の使い方(2)

2025年度 経済データ分析演習B2

伊藤 翼

2025-10-04

はじめに

出席登録は13:00から14:30まででに登録してください

出席番号

515317585

クラスコード

gsrnanuj

今回の目標

  • R(Colab)で必要な用語を覚える

  • オブジェクトを理解する

  • 簡単なデータセットを作れるようになる

  • 作ったデータをCSVに変換できるようになる

  • 注意:一部画像の日付などは異なっているので注意してください

注意事項

  • 本講義でのRの使用方法は、教科書や他演習コースと多少異なっています

理由

  • 個人的にこちらの方法が(1)わかりやすい、(2)効率的(メモリやディスクへの負担が軽い)と考えているからです
  • もちろん、使用方法が違ったからといって、親科目のレポートができないということはありません


  • 他の使用方法を勉強したい方は、教科書で勉強してみてください

講義準備

第3回講義フォルダ作成

  • Drive→Classroom→2025年年度 経済データ分析演習B2に「第3回」フォルダを作成
  • 「新規」→「その他」→「Google colaboratory」をクリック

Screenshot of code with a light theme on white background

Colabの準備(1)

ファイル名の変更

  • 「第3回_学籍番号_氏名.ipynb」に変更
  • アンダーバー(_)は必ず半角
  • 例)第3回_1220YY0XXX_伊藤翼.ipynb
  • 注意:画像の日付などは異なります。

Rへの変更 - ランタイムのタイプ変更

  • 左上の「ランタイム」から「ランタイムのタイプの変更」を選択
  • ランタイムのタイプをRに変更

Colabの準備(2)

  • 1 テキストセルの挿入
  • 2 テキストセルに「# 第3回講義課題(氏名)」と入力
  • 例)# 第3回講義課題(伊藤翼)
  • 3 不要なコードセルは削除(順番入れ替えでも可)
  • 4 再度テキストセルを挿入して、「## オブジェクトと演算子」と入力

Screenshot of code with a light theme on white background

色々な演算子(1)

算術演算子 - 四則演算などに用いる演算子

  • コードセルを追加して以下を計算してみましょう
  • 以下のCodeをコピペして実行しましょう
## 算術演算子
3+4 # 和
4-1 # 差
4*5 # 積
9/2 # 商
2^4 # 累乗
sqrt(4) # 平方和
exp(2) # 指数
log(5) # 対数(自然対数)
round(10.5) # 四捨五入
[1] 7
[1] 3
[1] 20
[1] 4.5
[1] 16
[1] 2
[1] 7.389056
[1] 1.609438
[1] 10

色々な演算子(2)

代入演算子 - 変数に数値を代入するときに利用する演算子

  • コードセルを追加して以下を計算してみましょう
  • 以下のコードをコピペしましょう
## 代入演算子
x <- 3 #xという変数に3を代入
y <- x #yという変数にxを代入(つまり、x=3なので、y=3)
z <- x * y #xとyの積をzという変数に代入(x=3, y=3なので、z=9)
x <- 10 #xに10を代入(3という情報が消える)

結果の確認

  • 代入演算子を使うと結果は表示されない
  • そこで、
  • 変数(オブジェクト)をコードセルに入力
  • print(変数)をコードセルに入力
  • Codeをコピペして実行しましょう
## 各変数(オブジェクト)を表示させるには改行する
x
y
z

## print()は画面への出力
## 一つのオブジェクトのみ
print(x)
print(y)
print(z)
[1] 10
[1] 3
[1] 9
[1] 10
[1] 3
[1] 9
  • 他にも論理演算子があるが、それはまた次回

オブジェクト(1)

  • Rにおけるオブジェクトとは、変数やデータのかたまりなどのことを指す
  • 以下のコードでいうと、「name」のことである
  • 数字以外の文字列はダブルクォーテーションで囲む
name <- "tsubasa ito"
  • オブジェクトは日本語でも良い
名前 <- "伊藤翼"
  • 大文字、小文字は区別される
Name <- "Tsubasa Ito"
NAME <- "TSUBASA ITO"
  • ただし、オブジェクトの先頭に半角数字は使えない
  • 中黒(・)は全角であっても使えない
  • 基本的には半角英字が良い

演習問題(1)

  • コードセルを挿入し、name, 名前, Name, NAMEのオブジェクトに
  • 先の要領で自分の名前を代入しましょう
  • 各オブジェクトをprint()で表示させましょう
  • 以下は例です
## 例
### オブジェクトへの代入
name <- "tsubasa ito"
名前 <- "伊藤翼"
Name <- "Tsubasa Ito"
NAME <- "TSUBASA ITO"

### オブジェクトの出力
print(name)
print(名前)
print(Name)
print(NAME)
[1] "tsubasa ito"
[1] "伊藤翼"
[1] "Tsubasa Ito"
[1] "TSUBASA ITO"

オブジェクト(2)

  • オブジェクトには複数の値(数字、文字列)を格納することもできる
  • 複数の値を格納するには、c()とし、括弧内に値を入力します
  • 値は、カンマで区切ります
  • 文字列はそれぞれダブルクォーテーションで囲みます
  • c()で作成された複数の値を持つオブジェクトをベクトルオブジェクトとも呼びます
## ベクトル
height <- c(161, 178, 169, 180, 172)
weight <- c(60, 80, 62, 74, 68)
bloodtype <- c("A", "AB", "O", "A", "O")
  • 連番(等差数列)も作成することができる
con <- c(1:10)
  • 上記をColabにコピペして実行しましょう

オブジェクトの確認

オブジェクトを表示 - objects()で実行時点に存在するオブジェクトを表示

  • 以下のコードをコピペして実行
## 実行時点に存在するオブジェクトの確認
objects()
 [1] "bloodtype" "con"       "height"    "name"      "Name"      "NAME"     
 [7] "weight"    "x"         "y"         "z"         "名前"     

オブジェクトのデータ型 - class()で各オブジェクトのデータ型を表示

  • 以下のコードをコピペして実行
## データ型を表示
class(height) # 身長は数値型(numeric)
class(bloodtype) # 血液型は文字列型(character)
[1] "numeric"
[1] "character"

データ型

数値型(numeric) - 1,2,3,・・・, 0.1, -5, etc..
文字列型(character) - リンゴ、AB、東京都、etc..
因子型(factor) - カテゴリー(経済学科を1、国際経済学科を2、etc..)
論理型(logical) - 真(TURE)か偽(FALSE)

  • 注意:一つのオブジェクトいは一つのデータ型
## すべての文字列型になる
height_bloodtype <- c(161, "A", 178, "AB")
print(height_bloodtype)
[1] "161" "A"   "178" "AB" 
class(height_bloodtype)
[1] "character"
  • 上記はコピペして実行しなくても良い

記述統計量

  • 春学期学んだような記述統計量も算出できる
  • 以下をコピペして実行しましょう
## 身長(height)の記述統計量
mean(height) # 平均
median(height) # 中央値
quantile(height) # 四分位値
max(height) # 最大値
min(height) # 最小値
var(height) # 分散
sd(height) # 標準偏差
length(height) # データの個数
[1] 172
[1] 172
  0%  25%  50%  75% 100% 
 161  169  172  178  180 
[1] 180
[1] 161
[1] 57.5
[1] 7.582875
[1] 5
  • 表示されている統計量は、summary()で一括表示できる
summary(height) # 平均、中央値、標準偏差、最大値、最小値を一括表示
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
    161     169     172     172     178     180 

文字列の集計

  • 以下のCodeをコピペして実行しましょう
## 文字列の集計
table(bloodtype)
bloodtype
 A AB  O 
 2  1  2 


演習問題(2)

  • 体重(weight)の記述統計量(平均、中央値、四分位値、最大値、最小値、分散、標準偏差、データの個数)を出力してください
  • summary()を実行しましょう

データフレームオブジェクト(1)

  • これらのオブジェクトをまとめてデータフレームを作成することもできます

  • つまり、分析するためのデータもオブジェクトに格納

  • 複数のベクトルオブジェクトをdata.frame()で結合

  • 以下のコードをコピペして実行しましょう

## height, weight, bloodtypeの3つのベクトルオブジェクトをデータフレームオブジェクトに格納
df <- data.frame(height, weight, bloodtype)
  • これは、3つのベクトルオブジェクトをdfというオブジェクトにデータフレーム形式で格納することを意味します

データフレームオブジェクト(2)

  • データフレームオブジェクトの中身を確認
## データフレームオブジェクトの中身を確認
df
## 記述統計量を出力
summary(df)
  height weight bloodtype
1    161     60         A
2    178     80        AB
3    169     62         O
4    180     74         A
5    172     68         O
     height        weight      bloodtype        
 Min.   :161   Min.   :60.0   Length:5          
 1st Qu.:169   1st Qu.:62.0   Class :character  
 Median :172   Median :68.0   Mode  :character  
 Mean   :172   Mean   :68.8                     
 3rd Qu.:178   3rd Qu.:74.0                     
 Max.   :180   Max.   :80.0                     

データフレームオブジェクトのCSVへの書き出し

  • データフレームオブジェクトは、write.csv()でCSVに変換することができます
  • 変換したものは、Colabのフォルダに保存(書き出し)されます
  • 以下のコードをコピペして実行しましょう
  • 注意:学籍番号と氏名は書き換えてください
## write.csv(保存したデータフレームオブジェクト, file = "保存したいデータの名前.csv")
## 名前は第〇回_学籍番号_氏名.csvとしてください
write.csv(df, file = "第3回_学籍番号_氏名.csv")

保存先

  • Colabの左のフォルダマークをクリック
  • 「content」内に保存されている
  • 3点リーダーからダウンロードする

Screenshot of code with a light theme on white background

第3回講義課題

作成したColabの.ipynbファイルをClassroomから提出してください

  • すべて変更が保存されたらタブを閉じます
  • Classroomを開き、「講義課題」の「第3回講義課題」を開きます
  • 「課題を表示」し、「追加または作成」をクリックし、Driveを選択
  • 作成したファイルを選択し、「追加」して提出してください
  • 注意:ファイルを必ず確認してください
  • 提出期限:2025年10月4日(土)本日の23:59まで
  • CSVファイルの提出はありません