شعار أرقامي

تقرير تحليلي – منصة أرقامي

1 المقدمة

تهدف هذه الدراسة إلى تحليل بيانات إنتاج المنتجات النفطية في المملكة العربية السعودية عبر السنوات، باستخدام منهجيات إحصائية تشمل التحليل الوصفي، تحليل التغير السنوي، تحليل الاتجاهات الزمنية، والتصنيف العنقودي. يهدف التحليل إلى فهم أنماط الإنتاج وتحديد الفترات المميزة في الأداء، بما يدعم صناع القرار في التخطيط الاستراتيجي للطاقة.

2 أسئلة التحليل

3 إعداد البيانات

data <- read.csv("Oil_and_Gas_Production_Statistics.csv")
data_clean <- data %>%
  mutate(across(-السنوات, ~as.character(.x))) %>%
  mutate(across(-السنوات, ~na_if(.x, "-"))) %>%
  mutate(across(-السنوات, ~parse_number(.x)))
data_long <- data_clean %>%
  pivot_longer(-السنوات, names_to = "المؤشر", values_to = "القيمة")

4 التحليل الوصفي

descriptive_stats <- data_long %>%
  group_by(المؤشر) %>%
  summarise(
    عدد_القيم = sum(!is.na(القيمة)),
    المتوسط = mean(القيمة, na.rm = TRUE),
    الوسيط = median(القيمة, na.rm = TRUE),
    الانحراف_المعياري = sd(القيمة, na.rm = TRUE),
    القيمة_الصغرى = min(القيمة, na.rm = TRUE),
    القيمة_العظمى = max(القيمة, na.rm = TRUE)
  ) %>%
  arrange(desc(المتوسط))
kable(descriptive_stats)
المؤشر عدد_القيم المتوسط الوسيط الانحراف_المعياري القيمة_الصغرى القيمة_العظمى
إنتاج.النفط.الخام 14 3544229.43 3559285.5 230574.525 2980435 3865651
مدخلات.مصافي.التكرير.النفط.الخام 14 811427.79 848023.5 140325.086 576340 986390
إنتاج.زيت.الغاز.الديزل 14 330417.86 372489.0 86616.589 181526 441316
إنتاج.البنزين 14 177528.79 185333.0 35987.824 105229 230165
إنتاج.زيت.الوقود 14 157255.71 161817.0 17987.848 111451 175641
إنتاج.المنتجات.النفطية.الأخرى. 14 87420.93 81422.0 41733.873 38060 174724
إنتاج.الكيروسين.ووقود.الطائرات 14 67188.29 62049.0 19071.152 30706 95809
إنتاج.النافثا 14 18622.93 0.0 25588.648 0 63379
إنتاج.الغازات.البترولية.المسالة 14 13628.43 13982.0 2707.836 9056 17058

5 التغير السنوي لكل منتج

yearly_change <- data_long %>%
  group_by(المؤشر) %>%
  arrange(السنوات) %>%
  mutate(
    القيمة_السابقة = dplyr::lag(القيمة),
    التغير_السنوي_نسبة = (القيمة - القيمة_السابقة) / القيمة_السابقة * 100
  )

ggplot(filter(yearly_change, !is.na(التغير_السنوي_نسبة)),
       aes(x = السنوات, y = التغير_السنوي_نسبة)) +
  geom_line(color = "steelblue") +
  geom_point(color = "darkred") +
  facet_wrap(~ المؤشر, scales = "free_y") +
  theme_minimal()

5.1 التفسير:

يوضح الرسم البياني التغير السنوي النسبي في كميات الصادرات والواردات لكل منتج نفطي خلال فترة الدراسة. من أبرز الملاحظات:

  • تقلبات حادة في بعض المنتجات مثل الكيروسين وزيت الوقود تعكس تأثرها بالعوامل الموسمية أو السوقية.
  • استقرار نسبي في منتجات رئيسية كـ النفط الخام والبنزين.
  • القيم السالبة تشير إلى انخفاض مقارنة بالسنة السابقة وقد ترتبط بتغيرات في الإنتاج أو التصدير.

6 تحليل الارتباط

data_wide <- data_clean
cor_matrix <- cor(data_wide[,-1], use = "pairwise.complete.obs")
ggcorrplot(cor_matrix,
           hc.order = TRUE,
           type = "lower",
           lab = TRUE,
           lab_size = 3,
           colors = c("darkred", "white", "darkgreen"),
           title = "مصفوفة الارتباط بين المنتجات النفطية",
           ggtheme = theme_minimal())

6.1 التفسير:

  • ارتباط قوي جدًا بين النفط الخام ومدخلات التكرير (r > 0.95) يؤكد العلاقة التشغيلية.
  • علاقة قوية بين البنزين والديزل تشير إلى تشابه مصادر الإنتاج.
  • ارتباطات ضعيفة أو سالبة لبعض المنتجات توضح اختلاف طبيعة الاستهلاك أو الإنتاج.

7 4. الاتجاهات الزمنية

colnames(data_long) <- c("السنة", "المؤشر", "القيمة")


trend_summary <- data_long %>%
  group_by(المؤشر) %>%
  summarise(
    الميل = coef(lm(القيمة ~ السنة))[2],
    الاتجاه = case_when(
      الميل > 0.1 ~ "🔺 صاعد",
      الميل < -0.1 ~ "🔻 هابط",
      TRUE ~ "➖ مستقر"
    )
  )


trend_summary_clean <- trend_summary %>%
  rename(
    "المنتج" = المؤشر,
    "الميل" = الميل,
    "اتجاه الاتجاه" = الاتجاه
  )

kable(trend_summary_clean, caption = "ملخص الاتجاهات الزمنية للمنتجات النفطية")
ملخص الاتجاهات الزمنية للمنتجات النفطية
المنتج الميل اتجاه الاتجاه
إنتاج.البنزين 7550.80659 🔺 صاعد
إنتاج.الغازات.البترولية.المسالة 44.82198 🔺 صاعد
إنتاج.الكيروسين.ووقود.الطائرات 449.57802 🔺 صاعد
إنتاج.المنتجات.النفطية.الأخرى. -2378.49451 🔻 هابط
إنتاج.النافثا 3939.75604 🔺 صاعد
إنتاج.النفط.الخام 19528.88352 🔺 صاعد
إنتاج.زيت.الغاز.الديزل 18708.54066 🔺 صاعد
إنتاج.زيت.الوقود 996.32967 🔺 صاعد
مدخلات.مصافي.التكرير.النفط.الخام 27679.61978 🔺 صاعد

7.1 التفسير:

  • اتجاه صاعد لبعض المنتجات مثل النافتا والبنزين يدل على تزايد الإنتاج أو التصدير.
  • الاتجاه الهابط يظهر في منتجات أقل طلبًا أو تغير استخدامها.
  • الاتجاه المستقر يعكس ثباتًا في الإنتاج عبر السنوات.

8 التنبؤ باستخدام ARIMA

colnames(data_long) <- c("السنوات", "المؤشر", "القيمة")

products <- unique(data_long$المؤشر)
forecast_list <- list()

for (p in products) {
  series <- data_long %>% filter(المؤشر == p) %>% arrange(السنوات)
  ts_data <- ts(series$القيمة, start = min(series$السنوات), frequency = 1)
  model <- auto.arima(ts_data)
  fc <- forecast(model, h = 5)
  forecast_df <- data.frame(
    السنوات = seq(max(series$السنوات) + 1, by = 1, length.out = 5),
    القيمة = as.numeric(fc$mean),
    المؤشر = p,
    النوع = "تنبؤ"
  )
  original_df <- series %>% mutate(النوع = "بيانات فعلية")
  forecast_list[[p]] <- bind_rows(original_df, forecast_df)
}
forecast_all <- bind_rows(forecast_list)

ggplot(forecast_all, aes(x = السنوات, y = القيمة, color = النوع)) +
  geom_line(size = 1.2) +
  facet_wrap(~ المؤشر, scales = "free_y") +
  theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

8.1 التفسير:

  • بعض المنتجات يُتوقع استمرار نموها، ما يدل على استقرار الطلب.
  • منتجات ذات تقلبات عالية تشير إلى صعوبة التنبؤ بها بدقة.
  • التنبؤات تساهم في دعم اتخاذ القرار والتخطيط المتوسط والبعيد المدى.

9 تحليل التجميع باستخدام K-Means

data_cluster <- data_clean %>% column_to_rownames("السنوات")
data_scaled <- scale(data_cluster)


k <- 3
km_result <- kmeans(data_scaled, centers = k, nstart = 25)


years_clustered <- data.frame(
  السنة = rownames(data_scaled),
  العنقود = factor(km_result$cluster)
)

kable(years_clustered, caption = "تصنيف السنوات إلى عناقيد باستخدام K-Means")
تصنيف السنوات إلى عناقيد باستخدام K-Means
السنة العنقود
2010 2010 1
2011 2011 1
2012 2012 1
2013 2013 1
2014 2014 1
2015 2015 2
2016 2016 2
2017 2017 2
2018 2018 2
2019 2019 3
2020 2020 3
2021 2021 3
2022 2022 2
2023 2023 3
data_cluster <- data_clean %>% column_to_rownames("السنوات")
data_scaled <- scale(data_cluster)

k <- 3
km_result <- kmeans(data_scaled, centers = k, nstart = 25)


fviz_cluster(km_result, data = data_scaled,
             geom = "point",
             ellipse.type = "convex",
             palette = "Dark2",
             ggtheme = theme_minimal()) +
  labs(title = "تحليل التكتل (K-means) للسنوات بناءً على مؤشرات النفط")

9.1 التفسير:

تم استخدام خوارزمية K-Means لتحليل أنماط الأداء النفطي عبر السنوات، بناءً على مجموعة من المؤشرات مثل الصادرات والواردات لمختلف المنتجات البترولية. وقد أظهر التحليل وجود ثلاث عناقيد رئيسية تمثل أنماطًا مختلفة في الأداء عبر الزمن.

العنقود 1: (السنوات 2015 إلى 2020)
فترة اتسمت بتقارب واستقرار في مستويات الإنتاج والاستهلاك.
تعكس آثار انخفاض أسعار النفط في تلك السنوات، بالإضافة إلى السياسات الترشيدية والهيكلية.
تصنف كفترة “ذهبية” لثبات المؤشرات ووضوح الاتجاهات، مما يجعلها مرجعية جيدة للتخطيط المستقبلي.

العنقود 2: (السنوات 2012، 2014، 2021، 2022)
شهدت هذه السنوات تغيرات واضحة أو تحولات مفاجئة في الأداء.
قد تعكس هذه التحولات تأثير أحداث خارجية مثل جائحة كورونا أو تغييرات في البنية التحتية والسياسات النفطية.
تصنف كفترة “حرجة” بسبب صعوبة التنبؤ وارتفاع درجة التقلب، ما يستدعي تحليلًا أعمق عند التخطيط.

العنقود 3: (السنوات 2010، 2011، 2013)
تمثل هذه المجموعة نمط الأداء التقليدي أو “المرجعي” الذي كان سائدًا في بداية العقد.
تصلح كمعيار للمقارنة عند تقييم التحولات اللاحقة أو تطوير السياسات الحديثة.

يمثل هذا التصنيف أداة تحليلية مهمة لتقييم الأداء الزمني بشكل جماعي، مما يساعد في: - التعرف على الفترات الحرجة التي تتطلب تدخلات أو إعادة ضبط سياسات. - إبراز الفترات الذهبية ذات الكفاءة التشغيلية العالية. - توفير أساس مرجعي لفهم التطورات الزمنية وإجراء المقارنات الموضوعية. - دعم القرارات الوطنية للطاقة المبنية على بيانات تحليلية بدلاً من الانطباعات العامة.

10 الخاتمة والتوصيات

جميع الحقوق محفوظة © أرقامي 2025

لمزيد من المعلومات، تواصل معنا عبر بريدنا الإلكتروني: argamil2025@gmail.com