Dasar-dasar Bahasa Pemrograman Statistika R
Materi Tentang Dasar Pemrograman R
| Author | : statisticmathlabs |
| date | : “2025-12-02” |
1 Sejarah & Pengertian Bahasa Pemrograman R
Analisis data statistik merupakan bagian penting dalam proses analisis data. Hasilnya merupakan interpretasi data dalam pola maupun tren. Analisis ini dapat digunakan untuk mengumpulkan interpretasi riset, statistik model, dan sebagai bagian dari survei yang dilakukan oleh perusahaan.
\[ \begin{tikzpicture}[x={(0.86cm,0.5cm)}, y={(-0.86cm,0.5cm)}, z={(0cm,1cm)}] \draw[very thick, blue] (-2,-2,0) -- (-2,2,0) -- (2,2,0) -- (2,-2,0) -- cycle; \draw[->] (0,0,0) -- (2.5, 0, 0) node [right] {x}; \draw[->] (0,0,0) -- (0, 2.5, 0) node [left] {y}; \draw[->,dashed] (0,0,0) -- (0, 0, 2.5) node [above] {z}; \draw circle (2); \end{tikzpicture} \]
| Nama: John Alice Bob
| Umur: 25 30 28
| //
| nama umur
| 1 John 25
| 2 Alice 30
| 3 Bob 28
| left | right | center | default |
|---|---|---|---|
| 12 | 13 | 13 | 14 |
| 23 | 56 | 78 | 90 |
| 90 | 87 | 67 | 45 |
Analisis statistik menggunakan data dalam bentuk kuantitatif. Dalam artian, data tersebut berupa angka maupun data lain yang dapat dijadikan angka. Hasilnya pun juga berupa angka. Dalam konteks business intelligence (BI), analisis statistik mengumpulkan setiap sampel data, misalnya total populasi.
code block
Tujuan akhir dari analisis statistik adalah untuk mengidentifikasi tren. Misalnya saja pada sektor retail yang digunakan untuk menentukan pola data unstructured maupun semi-structured konsumen guna meningkatkan kepuasan konsumen. Adapun langkah-langkah yang perlu diperhatikan dalam menganalisis statistik adalah:
- Menggambarkan kemurnian data untuk dianalisis;
- Data didasarkan pada populasi dan keterhubungannya;
- Validitas model;
- Menyediakan analisis prediktif. Adapun beberapa software bisa Anda gunakan untuk analisis statistik, di antaranya IBM SPSS Statistic, RMP, dan Stata.
Perbedaan mengenai analisis statistik dan analisis non statistik dapat dilihat dari beberapa kriteria tertentu, baik itu dari keberadaan data yang digunakan dalam proses analisis, fokus, model data, distribusi data, dan pembatasan model data. Jika merujuk dari laman ResearchGate, berikut perbedaan di antara kedua tipe analisis berdasarkan lima indikator yang ada.
1.1 Fokus
Perbedaan yang pertama terletak pada fokus yang ada. Untuk analisis statistik, berfokus pada verifikasi dari informasi yang didapatkan. Dengan kata lain, ini tentu harus menguji hipotesis yang ada dengan baik. Termasuk juga tingkatan-tingkatan yang signifikan. Beda halnya dengan analisis non statistik yang menitikberatkan pada pengumpulan dan menemukan data atau dikenal knowledge discovery. Tentu, ini akan mengesampingkan hipotesis terlebih dahulu. Pada tingkat tertentu, biasanya menggunakan teknik black box untuk memecahkan permasalahan.
1.2 Ukuran data set
Kedua, mengenai ukuran data set yang akan diamati. Analisis statistik dapat menampung data sebanyak mungkin sebagai variabel yang akan diamati dan diteliti, misalnya jumlah data ada ribuan dan hanya terbatas pada data dengan atribusi angka saja. Kemudian, analisis non statistik bisa lebih dari jumlah analisis statistik. Bahkan, Anda bisa mendapatkan data dalam jumlah jutaan, termasuk juga atribusinya yang beragam. Jadi, tidak terbatas hanya data berupa angka saja, tetapi juga data dalam bentuk lain \(\left (\frac {a}{b} \right)^2\).
1.3 Kemurnian data
Indikator yang ketiga bisa dilihat dari segi kemurnian data yang dimiliki. Data pada analisis statistik terdistribusikan dengan normal. Adapun strukturnya haruslah merepresentasikan dengan model yang linear. Sedangkan pada analisis non statistik, datanya tidaklah linear. Data tersebut terdiri dari banyak informasi. Hal itu karena data-data yang terkumpul bukan berbentuk angka. Dengan kata lain, jumlahnya pun sangat banyak.
1.4 Model data
Keempat, selain mengenai kemurnian data dan distribusinya, perbedaan analisis statistik dan analisis non statistik juga dilihat dari model data. Pada umumnya, analisis yang bersifat statistik cenderung memiliki data yang linear, yakni data dipengaruhi oleh berapa banyak outliers yang ada. Analisis dengan sifat non statistik tidaklah linear. Selain itu, model data yang ada pun tidak dipengaruhi oleh banyaknya outliers.
1.5 Batasan model data
Perbedaan terakhir atau kelima ialah terkait dengan batasan model data. Metode analisis statistik cenderung bergantung pada konsiderasi dan biasanya tidak linear, multicollinearity, dan sebagainya. Sedangkan data di analisis non statistik dihitung berdasarkan informasi, yakni mana yang menjadi bagian penting dan tidak saat dianalisis.
2 Contoh line smoothing mortality table
2.1 contoh lain
\[ \begin{aligned} Rumus\\ Matematika\\ LaTeX \end{aligned} \] \(e^x, e^{xy}, y_i , y_{ij}, e^{x^{y+1}}, y_{i_{jk}}\)
\(\int \limits_{-\infty}^{\infty} {f(x)} \, dx\)
\[ \sqrt {\sqrt {\sqrt {\sqrt {x}}}} \]
\[\sqrt[x]{y}\] \(\left (\frac {a}{b} \right)^2\)
\[A=\left \{ x | x=2n, n \in \text {bilangan asli} <5 \right \}\] \[\left (\frac {x}{y} \right )^2\] \[(\sum \limits_{i=1}^{n} {x_i}) , dan, (\prod\limits_{i=1}^n{x_i})\] \[\boxed {\bar x = \frac{1}{n} \sum \limits_{i=1}^{n} {x_i}}\] \[ \begin{aligned} \lim_{x \to \infty} \left(1+ \frac{1}{x} \right )^x &= e \\ \lim_{x \to 0 } \left(1+x \right)^{\frac {1}{x}} &= e \\ \lim_{x \to \infty} \left(1+ \frac{a}{x} \right )^{bx} &= e^{ab} \\ \lim_{x \to 0 } \left(1+ax \right)^{\frac {b}{x}} &= e^{ab} \end{aligned} \]
\[ f(x;\lambda,k)= \begin{cases} \frac{k}{\lambda} \left(\frac{x}{\lambda}\right)^{k-1}e^{-(x/\lambda)^{k}} &; x\geq 0 ,\\ 0 &; x<0, \end{cases} \]
\[ \lim_{x \to 0}f(x)=1 \]
\[ \mathbf{y}= \left(\begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \\ \end{matrix} \right) \]
\[ \mathbf{X}=\left( \begin{matrix} 1 & x_{11} & x_{12} & \dots & x_{1p} \\ 1 & x_{21} & x_{22} & \dots & x_{2p} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & x_{n1} & x_{n2} & \dots & x_{np} \\ \end{matrix} \right) \]
\[\begin{aligned} \log_b (x) &= \log _b \left( c \right)\log _c \left( x \right) \\ &= \frac{{\log _c \left( x \right)}}{{\log _c \left( b \right)}} \end{aligned}\]\[massa jenis = \frac{kecepatan}{waktu}\]
\[x+y, x-y, x \times y\]
\[\int \limits_{-\infty }^{\infty }{f(x)} \, dx\]
\[F(x) \Bigr|_{-\infty}^{\infty}\]
3 A sample observation table with exposures and raw probabilities
3.1 contoh lain
4 Effect of the different parameters
4.1 contoh lain
5 Missing values are interpolated from the Whittaker Henderson
5.1 contoh lain
| Sepal.Length | Sepal.Width | Petal.Length | Petal.Width | Species |
|---|---|---|---|---|
| 5.1 | 3.5 | 1.4 | 0.2 | setosa |
| 4.9 | 3.0 | 1.4 | 0.2 | setosa |
| 4.7 | 3.2 | 1.3 | 0.2 | setosa |
| 4.6 | 3.1 | 1.5 | 0.2 | setosa |
| 5.0 | 3.6 | 1.4 | 0.2 | setosa |
| 5.4 | 3.9 | 1.7 | 0.4 | setosa |
| 4.6 | 3.4 | 1.4 | 0.3 | setosa |
| 5.0 | 3.4 | 1.5 | 0.2 | setosa |
| 4.4 | 2.9 | 1.4 | 0.2 | setosa |
| 4.9 | 3.1 | 1.5 | 0.1 | setosa |
| 5.4 | 3.7 | 1.5 | 0.2 | setosa |
| 4.8 | 3.4 | 1.6 | 0.2 | setosa |
| 4.8 | 3.0 | 1.4 | 0.1 | setosa |
| 4.3 | 3.0 | 1.1 | 0.1 | setosa |
| 5.8 | 4.0 | 1.2 | 0.2 | setosa |
| 5.7 | 4.4 | 1.5 | 0.4 | setosa |
| 5.4 | 3.9 | 1.3 | 0.4 | setosa |
| 5.1 | 3.5 | 1.4 | 0.3 | setosa |
| 5.7 | 3.8 | 1.7 | 0.3 | setosa |
| 5.1 | 3.8 | 1.5 | 0.3 | setosa |
| 5.4 | 3.4 | 1.7 | 0.2 | setosa |
| 5.1 | 3.7 | 1.5 | 0.4 | setosa |
| 4.6 | 3.6 | 1.0 | 0.2 | setosa |
| 5.1 | 3.3 | 1.7 | 0.5 | setosa |
| 4.8 | 3.4 | 1.9 | 0.2 | setosa |
Sepal.Length Sepal.Width Petal.Length Petal.Width
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
Median :5.800 Median :3.000 Median :4.350 Median :1.300
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
Species
setosa :50
versicolor:50
virginica :50
contoh ini adalah sebagai ilustrasi dalam menampilkan suatu tabel data yang ingin ditampilkan.