Dies ist ein kurzer Beispielbericht mit RMarkdown.
Hier kann normaler Text stehen. Man kann Wörter fett oder kursiv schreiben.
Eine einfache Liste:
Eine nummerierte Liste:
x <- 10
y <- 5
x + y
## [1] 15
# Dieser Code wird NICHT ausgeführt,
# aber im Dokument angezeigt
install.packages("tidyverse")
library(tidyverse)
| Option | Wirkung |
|---|---|
echo=FALSE |
Code ausblenden |
eval=FALSE |
Code nicht ausführen |
message=FALSE |
Meldungen ausblenden |
warning=FALSE |
Warnungen ausblenden |
In diesem Beispiel wird eine Excel-Tabelle zu Hochschulen in Deutschland eingelesen, bereinigt und ausgewertet.
Ziel ist es, eine erste Übersicht über die Verteilung der verschiedenen Hochschularten zu erstellen.
Quelle: Statistisches Bundesamt (Destatis), Hochschulen in Deutschland, Tabelle 2.5.1.
Zunächst werden die benötigten Pakete geladen.
# install.packages("tidyr")
library(readxl)
library(readr)
library(dplyr)
library(tidyr)
library(ggplot2)
Die Excel-Datei enthält zu Beginn mehrere Kopfzeilen, die für die Analyse nicht benötigt werden. Deshalb wird die Datei mit skip = 4 eingelesen.
data_raw <- read_excel("C:/Users/Marlene/Desktop/R_DS_26/Tabelle-2.5.1.xlsx", skip = 4)
## New names:
## • `` -> `...1`
## • `` -> `...2`
head(data_raw)
## # A tibble: 6 × 9
## ...1 ...2 Hochschulen insgesam…¹ `Universität 2)` Pädagogische Hochsch…²
## <chr> <chr> <chr> <dbl> <chr>
## 1 Land Wint… Anzahl NA <NA>
## 2 Baden-Wü… 1994… 63 10 6
## 3 <NA> 1995… 61 10 6
## 4 <NA> 1996… 62 10 6
## 5 <NA> 1997… 62 10 6
## 6 <NA> 1998… 63 11 6
## # ℹ abbreviated names: ¹`Hochschulen insgesamt`, ²`Pädagogische Hochschule`
## # ℹ 4 more variables: `Theologische Hochschule` <chr>,
## # `Kunst-\r\nhochschule` <chr>, `Allgemeine \r\nFach-\r\nhochschule` <dbl>,
## # `Verwaltungs-\r\nfach-\r\nhochschule` <chr>
Die ursprünglichen Spaltennamen sind teilweise schwer lesbar oder enthalten Zeilenumbrüche. Deshalb werden sie in kurze und einheitliche Namen umbenannt.
data_clean <- data_raw %>%
rename(
land = ...1,
wintersemester = ...2,
insgesamt = `Hochschulen insgesamt`,
universitaet = `Universität 2)`,
paedagogische_hochschule = `Pädagogische Hochschule`,
theologische_hochschule = `Theologische Hochschule`,
kunsthochschule = `Kunst-\r\nhochschule`,
allgemeine_fachhochschule = `Allgemeine \r\nFach-\r\nhochschule`,
verwaltungsfachhochschule = `Verwaltungs-\r\nfach-\r\nhochschule`
)
head(data_clean)
## # A tibble: 6 × 9
## land wintersemester insgesamt universitaet paedagogische_hochsc…¹
## <chr> <chr> <chr> <dbl> <chr>
## 1 Land Winter-semest… Anzahl NA <NA>
## 2 Baden-Württemberg 1994/1995 63 10 6
## 3 <NA> 1995/1996 61 10 6
## 4 <NA> 1996/1997 62 10 6
## 5 <NA> 1997/1998 62 10 6
## 6 <NA> 1998/1999 63 11 6
## # ℹ abbreviated name: ¹paedagogische_hochschule
## # ℹ 4 more variables: theologische_hochschule <chr>, kunsthochschule <chr>,
## # allgemeine_fachhochschule <dbl>, verwaltungsfachhochschule <chr>