Dasar-dasar Bahasa Pemrograman Statistika R

Materi Tentang Dasar Pemrograman R

Author	: statisticmathlabs
date	: “2025-12-02”

1 Sejarah & Pengertian Bahasa Pemrograman R

Analisis data statistik merupakan bagian penting dalam proses analisis data. Hasilnya merupakan interpretasi data dalam pola maupun tren. Analisis ini dapat digunakan untuk mengumpulkan interpretasi riset, statistik model, dan sebagai bagian dari survei yang dilakukan oleh perusahaan.

\[ \begin{tikzpicture}[x={(0.86cm,0.5cm)}, y={(-0.86cm,0.5cm)}, z={(0cm,1cm)}] \draw[very thick, blue] (-2,-2,0) -- (-2,2,0) -- (2,2,0) -- (2,-2,0) -- cycle; \draw[->] (0,0,0) -- (2.5, 0, 0) node [right] {x}; \draw[->] (0,0,0) -- (0, 2.5, 0) node [left] {y}; \draw[->,dashed] (0,0,0) -- (0, 0, 2.5) node [above] {z}; \draw circle (2); \end{tikzpicture} \]

| Nama:  John Alice Bob 
|  Umur:  25 30 28 
|  //

|    nama umur
| 1  John   25
| 2 Alice   30
| 3   Bob   28

left	right	center	default
12	13	13	14
23	56	78	90
90	87	67	45

Analisis statistik menggunakan data dalam bentuk kuantitatif. Dalam artian, data tersebut berupa angka maupun data lain yang dapat dijadikan angka. Hasilnya pun juga berupa angka. Dalam konteks business intelligence (BI), analisis statistik mengumpulkan setiap sampel data, misalnya total populasi.

code block

Tujuan akhir dari analisis statistik adalah untuk mengidentifikasi tren. Misalnya saja pada sektor retail yang digunakan untuk menentukan pola data unstructured maupun semi-structured konsumen guna meningkatkan kepuasan konsumen. Adapun langkah-langkah yang perlu diperhatikan dalam menganalisis statistik adalah:

Menggambarkan kemurnian data untuk dianalisis;
Data didasarkan pada populasi dan keterhubungannya;
Validitas model;
Menyediakan analisis prediktif. Adapun beberapa software bisa Anda gunakan untuk analisis statistik, di antaranya IBM SPSS Statistic, RMP, dan Stata.

Perbedaan mengenai analisis statistik dan analisis non statistik dapat dilihat dari beberapa kriteria tertentu, baik itu dari keberadaan data yang digunakan dalam proses analisis, fokus, model data, distribusi data, dan pembatasan model data. Jika merujuk dari laman ResearchGate, berikut perbedaan di antara kedua tipe analisis berdasarkan lima indikator yang ada.

link belajar ekonometriks

1.1 Fokus

Perbedaan yang pertama terletak pada fokus yang ada. Untuk analisis statistik, berfokus pada verifikasi dari informasi yang didapatkan. Dengan kata lain, ini tentu harus menguji hipotesis yang ada dengan baik. Termasuk juga tingkatan-tingkatan yang signifikan. Beda halnya dengan analisis non statistik yang menitikberatkan pada pengumpulan dan menemukan data atau dikenal knowledge discovery. Tentu, ini akan mengesampingkan hipotesis terlebih dahulu. Pada tingkat tertentu, biasanya menggunakan teknik black box untuk memecahkan permasalahan.

1.2 Ukuran data set

Kedua, mengenai ukuran data set yang akan diamati. Analisis statistik dapat menampung data sebanyak mungkin sebagai variabel yang akan diamati dan diteliti, misalnya jumlah data ada ribuan dan hanya terbatas pada data dengan atribusi angka saja. Kemudian, analisis non statistik bisa lebih dari jumlah analisis statistik. Bahkan, Anda bisa mendapatkan data dalam jumlah jutaan, termasuk juga atribusinya yang beragam. Jadi, tidak terbatas hanya data berupa angka saja, tetapi juga data dalam bentuk lain \(\left (\frac {a}{b} \right)^2\).

1.3 Kemurnian data

Indikator yang ketiga bisa dilihat dari segi kemurnian data yang dimiliki. Data pada analisis statistik terdistribusikan dengan normal. Adapun strukturnya haruslah merepresentasikan dengan model yang linear. Sedangkan pada analisis non statistik, datanya tidaklah linear. Data tersebut terdiri dari banyak informasi. Hal itu karena data-data yang terkumpul bukan berbentuk angka. Dengan kata lain, jumlahnya pun sangat banyak.

1.4 Model data

Keempat, selain mengenai kemurnian data dan distribusinya, perbedaan analisis statistik dan analisis non statistik juga dilihat dari model data. Pada umumnya, analisis yang bersifat statistik cenderung memiliki data yang linear, yakni data dipengaruhi oleh berapa banyak outliers yang ada. Analisis dengan sifat non statistik tidaklah linear. Selain itu, model data yang ada pun tidak dipengaruhi oleh banyaknya outliers.

1.5 Batasan model data

Perbedaan terakhir atau kelima ialah terkait dengan batasan model data. Metode analisis statistik cenderung bergantung pada konsiderasi dan biasanya tidak linear, multicollinearity, dan sebagainya. Sedangkan data di analisis non statistik dihitung berdasarkan informasi, yakni mana yang menjadi bagian penting dan tidak saat dianalisis.

2 Contoh line smoothing mortality table

2.1 contoh lain

\[ \begin{aligned} Rumus\\ Matematika\\ LaTeX \end{aligned} \] \(e^x, e^{xy}, y_i , y_{ij}, e^{x^{y+1}}, y_{i_{jk}}\)

\(\int \limits_{-\infty}^{\infty} {f(x)} \, dx\)

\[ \sqrt {\sqrt {\sqrt {\sqrt {x}}}} \]

\[\sqrt[x]{y}\] \(\left (\frac {a}{b} \right)^2\)

\[A=\left \{ x | x=2n, n \in \text {bilangan asli} <5 \right \}\] \[\left (\frac {x}{y} \right )^2\] \[(\sum \limits_{i=1}^{n} {x_i}) , dan, (\prod\limits_{i=1}^n{x_i})\] \[\boxed {\bar x = \frac{1}{n} \sum \limits_{i=1}^{n} {x_i}}\] \[ \begin{aligned} \lim_{x \to \infty} \left(1+ \frac{1}{x} \right )^x &= e \\ \lim_{x \to 0 } \left(1+x \right)^{\frac {1}{x}} &= e \\ \lim_{x \to \infty} \left(1+ \frac{a}{x} \right )^{bx} &= e^{ab} \\ \lim_{x \to 0 } \left(1+ax \right)^{\frac {b}{x}} &= e^{ab} \end{aligned} \]

\[ f(x;\lambda,k)= \begin{cases} \frac{k}{\lambda} \left(\frac{x}{\lambda}\right)^{k-1}e^{-(x/\lambda)^{k}} &; x\geq 0 ,\\ 0 &; x<0, \end{cases} \]

\[ \lim_{x \to 0}f(x)=1 \]

\[ \mathbf{y}= \left(\begin{matrix} y_1 \\ y_2 \\ \vdots \\ y_n \\ \end{matrix} \right) \]

\[ \mathbf{X}=\left( \begin{matrix} 1 & x_{11} & x_{12} & \dots & x_{1p} \\ 1 & x_{21} & x_{22} & \dots & x_{2p} \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 1 & x_{n1} & x_{n2} & \dots & x_{np} \\ \end{matrix} \right) \]

\[\begin{aligned} \log_b (x) &= \log _b \left( c \right)\log _c \left( x \right) \\ &= \frac{{\log _c \left( x \right)}}{{\log _c \left( b \right)}} \end{aligned}\]

\[massa jenis = \frac{kecepatan}{waktu}\]

\[x+y, x-y, x \times y\]

\[\int \limits_{-\infty }^{\infty }{f(x)} \, dx\]

\[F(x) \Bigr|_{-\infty}^{\infty}\]

3 A sample observation table with exposures and raw probabilities

3.1 contoh lain

4 Effect of the different parameters

4.1 contoh lain

5 Missing values are interpolated from the Whittaker Henderson

5.1 contoh lain

Sepal.Length	Sepal.Width	Petal.Length	Petal.Width	Species
5.1	3.5	1.4	0.2	setosa
4.9	3.0	1.4	0.2	setosa
4.7	3.2	1.3	0.2	setosa
4.6	3.1	1.5	0.2	setosa
5.0	3.6	1.4	0.2	setosa
5.4	3.9	1.7	0.4	setosa
4.6	3.4	1.4	0.3	setosa
5.0	3.4	1.5	0.2	setosa
4.4	2.9	1.4	0.2	setosa
4.9	3.1	1.5	0.1	setosa
5.4	3.7	1.5	0.2	setosa
4.8	3.4	1.6	0.2	setosa
4.8	3.0	1.4	0.1	setosa
4.3	3.0	1.1	0.1	setosa
5.8	4.0	1.2	0.2	setosa
5.7	4.4	1.5	0.4	setosa
5.4	3.9	1.3	0.4	setosa
5.1	3.5	1.4	0.3	setosa
5.7	3.8	1.7	0.3	setosa
5.1	3.8	1.5	0.3	setosa
5.4	3.4	1.7	0.2	setosa
5.1	3.7	1.5	0.4	setosa
4.6	3.6	1.0	0.2	setosa
5.1	3.3	1.7	0.5	setosa
4.8	3.4	1.9	0.2	setosa

  Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
 Median :5.800   Median :3.000   Median :4.350   Median :1.300  
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
       Species  
 setosa    :50  
 versicolor:50  
 virginica :50

contoh ini adalah sebagai ilustrasi dalam menampilkan suatu tabel data yang ingin ditampilkan.