Rについて

佐藤 慧

2019/11/23

RとRStudioってなんだ

Rとは

  • Rは,パソコン内のデータファイルを読み込んで計算できるソフト

    • データの構造については後述

    • ポピュラーな計算は記述統計や相関,回帰分析など

RStudioとは

  • Rの機能を拡張してわかりやすく操作できるソフト

    • 大半のRユーザーはR本体のほかにRStudioもダウンロードして使っている

    • RStudioを起動するとRも自動的に起動される

イメージ図

  • Rとデータの関係

  • ライブラリデータの説明

RStudioの使い方

ペインのみかた

  • デフォルトでは以下のようになっている

    • 左上がScript

    • 左下がConsole

    • 右上がEnvironmentやFiles

    • 右下がPlots

      • 描画結果などが出る

ペインの例

Rスクリプトの書き方

スクリプトとは

データ処理の実行書

Rスクリプトの三つの要素

  • オブジェクト

  • 関数

  • アルゴリズム

オブジェクト

関数

アルゴリズム

  • スクリプトの実行順序に関する特別な関数のこと

  • スクリプトは基本的に上から下に実行されるが,for()if()で繰り返しや条件分岐させることができる

    • 中高で習ったのでは

    • Rではあまり使わない

パッケージとライブラリ

パッケージ

  • Rのデフォルトの関数はそれほど多くないので,パッケージとよばれる拡張機能をダウンロードして使うのが一般的(要ネット環境)

    • 「こんな拡張機能ないかな」と思って探すとたいていある

    • 詳細は公式サイトなどを探検してほしい

代表的なパッケージ

  • ggplot2は描画に欠かせない

  • dplyrはデータの変形に欠かせない

ライブラリ

  • 一度インストールしたパッケージはscript or consoleに次のように書いて読み込ませると使えるようになる.下の例はggplot2
library(ggplot2)

デフォルトのデータセット

  • ネットにつながっていれば,Rに標準搭載のデータセットを簡単に使える.

    • 有名なのは野鳥観察データセットのiris.コンソールにirisと打ち込んでみましょう.
  • 練習にもってこい

データの見え方

  • 先ほどから言っている「データ」とか「データセット」というのはどういうものなのか

  • イメージとしては,ものすごく縦幅・横幅の広いエクセルファイル

    • PCから読み込む場合,実際には.csvファイルが多い
  • RStudio上でも開ける.以下のいずれかの方法で.

    • 右上ペインの“Environment”から“iris”をクリック

    • 左下ペインの“Console”でView(iris)と打ってEnter

    • 左上ペインのスクリプトでView(iris)と打ってCmd + Enter

  • どんな複雑な分析もこれらの四則演算がもとになっている

実践的アドバイス

  1. コマンドラインに親しみましょう

  2. 英語の勉強だと思いましょう

  3. 基本的な関数を少し覚えればよい

  4. Cheatsheets読もう

コマンドラインに親しみましょう

  • コマンドラインに最初は面食らうはず

    • しかし,一昔前まではあらゆるソフトがコマンドライン入力だった

    • GUIを使えるのは現代に生きていることの恩恵にすぎないッ

    • とはいえ,RStudioではGUIで使える機能も多いので,どんどん使うべき

      • さっきのView()とか

英語の勉強だと思いましょう

  • プログラミングは数学というより語学にちかい

    • ほとんどすべてのプログラミング言語は英語なので,プログラミングは英語の勉強

    • 略語とか

  • とくにRStudioはソフトそのものがすべて英語表記なので,その意味でも

基本的な関数を少し覚えればよい

  • スクリプトの三要素のうち,覚えなければいけないのは関数のみ

  • それも基本的な

    • c()とか,[]とか,summary()とか
  • いうなれば英検5級(あるのか?)レベルの勉強でOK

Cheatsheets読もう

  • 関数を覚えるおすすめの方法は,Cheatsheets(カンニングペーパー,関数一覧)のpdfを読むこと

    • 画面上部のメニューバーの“Help”からダウンロード可能

    • スクリプトやコンソールで実際に入力しつつ“base-r.pdf”を一周するのがたぶん一番早い

  • ほかにもいろいろなパッケージについてのCheatsheetが用意されているので,使う際はチェックしてみてください

その他の耳寄り情報

  • Rはフリーソフトなので,一度使い方を覚えれば(Rがあるかぎり)効率的に作業したり遊んだりすることができる

    • SPSSやStataは個人で買うのは難しい
  • Rでレポートやスライドをつくることができる

    • RStudioが提供するR Markdownを使う(このスライドも)

    • MS Officeなど操作に時間がかかるWYSIWYGソフトなしでの大学生活も可能