R Конспект

Введение

  • Как получить справку в Rstudio?
help()
?rm #(только для некоторых стандартных функций)

Сменить язык на английский на время сессии

Sys.setenv(LANG = "en")

Создать переменную и записать в нее значение:

cats <- 2
dogs <- 3

Как написать функцию с вводом 2 переменных?

divide <- function(x, y) {
return(x/y)
}

Как написать функцию с вводом 1 переменной?

returntwo <- function(x) {
X <- 2
x
}
returntwo(4)
[1] 4

Ничего не вышло! Почему не перезаписалась пременная x?
Так ничего не получится, потому что присваиваю значение в локальном окружении функции - на глобальное окружение переменных это никак не повлияет и при применении функции ничего нового не выведется. Если хочешь повлиять на глобальное окружение из локального применяй << (но это плохая практика - нагружается код, считается плохой практикой, можно запутаться во всевозможных влияниях внутреннего окружения функций на глобальное окружение R)

returntwo <- function(x) {
return(x <- 2)
}

ПЕРЕМЕННЫЕ

Глобальное окружение

  • Созданные из консоли переменные обитают здесь
    *Окружение - это пространство, где сидит переменная
  • Переменные, созданные в консоли, сидят в глобальном окружении
  • Вывести все переменные и функции в глобальном окружении ls()

Функция нормального распределения:

rnorm #где n - число генерируемых чисел
function (n, mean = 0, sd = 1) 
.Call(C_rnorm, n, mean, sd)
<bytecode: 0x0000027e30125690>
<environment: namespace:stats>
rnorm(30, mean = 25, sd = 5) #где mean - среднее, sd - стандартное отклонение
 [1] 26.78104 29.37611 24.49029 21.48213 19.55770 32.49970 20.63234 23.92941
 [9] 30.16567 17.86763 30.24234 17.42370 30.59605 29.14559 21.18170 28.83171
[17] 29.76755 24.59607 22.92615 22.74490 19.51892 28.10343 30.71289 17.54392
[25] 23.91796 33.93699 26.21738 32.18606 17.34835 28.25054

Но не всегда придется обращаться к стандартным функциям, надо уметь писать свои

УДАЛИТЬ ВСЕ ПЕРЕМЕННЫЕ из глобального окружения*

 rm(list = ls())

Общий глоссарий для этого урока:

# При необходимости всегда можно получить справку по нужной функции
# Запомнить все аргументы каждой функции нереально - научиться пользоваться справкой жизненно необходимо в R
help()
?help
?help.search
?"<-"
?ls
?"function" # нек
?rm
?rnorm
# Если не помнишь название функции, то можно сделать поиск по ближайшим совпадениям через ??. Например:
??top

РЕЖИМЫ РАБОТЫ R

В Rstudio есть два режима:
* Batch - режим - чистый R
В Batch режиме все переменные, которые мы хотим вывести в печать надо заключать в функцию print
* Интерактивный режим в консоли Rstudio Консоль это делает автоматически

ВАЖНАЯ ОСОБЕННОСТЬ ХРАНЕНИЯ ЧИСЕЛ ТИПА DOUBLE (float)

Для демонстрации будем проверять логические утверждения равенства значений (“==” - это знак равенства) Пример 1:

0.1 + 0.1 == 0.2
[1] TRUE

Что совпадает с нашим ожиданием

Пример 2

0.1 + 0.15 == 0.25
[1] TRUE

Что совпадает с нашим ожиданием

Пример 3

0.1 + 0.05 == 0.15
[1] FALSE

Получаем что-то странное

Эта особенность очень хорошо задокументирована в оф документации R и в Stackoverflow https://stackoverflow.com/questions/9508518/why-are-these-numbers-not-equal Есть стандартная автоматическая функция, которая позволяет преодолеть эту проблему - all.equal - она сравнивает “приблизительные” значения

В свое время была опубликована одна из веховых статей David Goldberg “What every computer scientist should know about floating-point arythmetic”
https://www.itu.dk/~sestoft/bachelor/IEEE754_article.pdf

---
title: "Конспект по R. Курс Stepik "
output: html_notebook
---

# R Конспект  
* R - интерпретируемый язык  
* Каждую строку интерпретирует построчно


### Короткий справочник по функциям  
https://cran.r-project.org/doc/contrib/Short-refcard.pdf
https://aakinshin.net/ru/posts/r-functions/

https://www.r-bloggers.com/an-absolute-beginners-guide-to-creating-data-frames-for-a-stack-overflow-r-question/

BOOK  
https://www.r-bloggers.com/in-depth-introduction-to-machine-learning-in-15-hours-of-expert-videos/


## Введение  
* Как получить справку в Rstudio?  

```{r}
help()
?rm #(только для некоторых стандартных функций)
```


### Сменить язык на английский на время сессии
```{r}
Sys.setenv(LANG = "en")
```

### Создать переменную и записать в нее значение:
```{r}
cats <- 2
dogs <- 3
```

### Как написать функцию с вводом 2 переменных?
```{r}
divide <- function(x, y) {
return(x/y)
}
```

### Как написать функцию с вводом 1 переменной?
```{r}
returntwo <- function(x) {
X <- 2
x
}
returntwo(4)
```
**Ничего не вышло!** Почему не перезаписалась пременная *x*?  
Так ничего не получится, потому что присваиваю значение в локальном окружении функции - на глобальное окружение переменных это никак не повлияет и при применении функции ничего нового не выведется. Если хочешь повлиять на глобальное окружение из локального применяй *<<* (но это плохая практика - нагружается код, считается плохой практикой, можно запутаться во всевозможных влияниях внутреннего окружения функций на глобальное окружение R)
```{r}
returntwo <- function(x) {
return(x <- 2)
}
```


# ПЕРЕМЕННЫЕ
## Глобальное окружение
* Созданные из консоли переменные обитают здесь  
*Окружение - это пространство, где сидит переменная  
* Переменные, созданные в консоли, сидят в глобальном окружении  
* Вывести все переменные и функции в глобальном окружении ls()

**Функция нормального распределения:**
```{r}
rnorm #где n - число генерируемых чисел
# вводя функцию без скобок, мы получаем справку по функции и ее аргументам
```
```{r}
rnorm(30, mean = 25, sd = 5) #где mean - среднее, sd - стандартное отклонение
```

Но не всегда придется обращаться к стандартным функциям, надо уметь писать свои
 

**УДАЛИТЬ ВСЕ ПЕРЕМЕННЫЕ из глобального окружения***
```{r}
 rm(list = ls())
```

## Общий глоссарий для этого урока:
```{r}
# При необходимости всегда можно получить справку по нужной функции
# Запомнить все аргументы каждой функции нереально - научиться пользоваться справкой жизненно необходимо в R
help()
?help
?help.search
?"<-"
?ls
?"function" 
?rm
?rnorm
# Если не помнишь название функции, то можно сделать поиск по ближайшим совпадениям через ??. Например:
??top
```


## РЕЖИМЫ РАБОТЫ R
В Rstudio есть два режима:  
* **Batch** - режим - чистый R  
*В Batch режиме все переменные, которые мы хотим вывести в печать надо заключать в функцию print*  
* **Интерактивный режим** в консоли Rstudio
*Консоль это делает автоматически*

## ВАЖНАЯ ОСОБЕННОСТЬ ХРАНЕНИЯ ЧИСЕЛ ТИПА DOUBLE (float)
Для демонстрации будем проверять логические утверждения равенства значений (*"=="* - это знак равенства)
**Пример 1:**
```{r}
0.1 + 0.1 == 0.2
```
Что совпадает с нашим ожиданием  
  
  
**Пример 2**
```{r}
0.1 + 0.15 == 0.25
```
Что совпадает с нашим ожиданием  
  
  
**Пример 3**
```{r}
0.1 + 0.05 == 0.15
```
Получаем что-то странное  

Эта особенность очень хорошо задокументирована в оф документации R и в Stackoverflow
https://stackoverflow.com/questions/9508518/why-are-these-numbers-not-equal
Есть стандартная автоматическая функция, которая позволяет преодолеть эту проблему - all.equal - она сравнивает “приблизительные” значения    

В свое время была опубликована одна из веховых статей David Goldberg "What every computer scientist should know about floating-point arythmetic"  
https://www.itu.dk/~sestoft/bachelor/IEEE754_article.pdf




