Rは,パソコン内のデータファイルを読み込んで計算できるソフト
データの構造については後述
ポピュラーな計算は記述統計や相関,回帰分析など
Rの機能を拡張してわかりやすく操作できるソフト
大半のRユーザーはR本体のほかにRStudioもダウンロードして使っている
RStudioを起動するとRも自動的に起動される
Rとデータの関係
ライブラリデータの説明
デフォルトでは以下のようになっている
左上がScript
左下がConsole
右上がEnvironmentやFiles
右下がPlots
データ処理の実行書
オブジェクト
関数
アルゴリズム
スクリプトの実行順序に関する特別な関数のこと
スクリプトは基本的に上から下に実行されるが,for()やif()で繰り返しや条件分岐させることができる
中高で習ったのでは
Rではあまり使わない
Rのデフォルトの関数はそれほど多くないので,パッケージとよばれる拡張機能をダウンロードして使うのが一般的(要ネット環境)
「こんな拡張機能ないかな」と思って探すとたいていある
詳細は公式サイトなどを探検してほしい
ggplot2は描画に欠かせない
dplyrはデータの変形に欠かせない
ggplot2ネットにつながっていれば,Rに標準搭載のデータセットを簡単に使える.
iris.コンソールにirisと打ち込んでみましょう.練習にもってこい
先ほどから言っている「データ」とか「データセット」というのはどういうものなのか
イメージとしては,ものすごく縦幅・横幅の広いエクセルファイル
RStudio上でも開ける.以下のいずれかの方法で.
右上ペインの“Environment”から“iris”をクリック
左下ペインの“Console”でView(iris)と打ってEnter
左上ペインのスクリプトでView(iris)と打ってCmd + Enter
コマンドラインに親しみましょう
英語の勉強だと思いましょう
基本的な関数を少し覚えればよい
Cheatsheets読もう
コマンドラインに最初は面食らうはず
しかし,一昔前まではあらゆるソフトがコマンドライン入力だった
GUIを使えるのは現代に生きていることの恩恵にすぎないッ
とはいえ,RStudioではGUIで使える機能も多いので,どんどん使うべき
View()とかプログラミングは数学というより語学にちかい
ほとんどすべてのプログラミング言語は英語なので,プログラミングは英語の勉強
略語とか
とくにRStudioはソフトそのものがすべて英語表記なので,その意味でも
スクリプトの三要素のうち,覚えなければいけないのは関数のみ
それも基本的な
c()とか,[]とか,summary()とかいうなれば英検5級(あるのか?)レベルの勉強でOK
関数を覚えるおすすめの方法は,Cheatsheets(カンニングペーパー,関数一覧)のpdfを読むこと
画面上部のメニューバーの“Help”からダウンロード可能
スクリプトやコンソールで実際に入力しつつ“base-r.pdf”を一周するのがたぶん一番早い
ほかにもいろいろなパッケージについてのCheatsheetが用意されているので,使う際はチェックしてみてください
Rはフリーソフトなので,一度使い方を覚えれば(Rがあるかぎり)効率的に作業したり遊んだりすることができる
Rでレポートやスライドをつくることができる
RStudioが提供するR Markdownを使う(このスライドも)
MS Officeなど操作に時間がかかるWYSIWYGソフトなしでの大学生活も可能