تقرير تحليلي – منصة أرقامي |
تهدف هذه الدراسة إلى تحليل بيانات إنتاج المنتجات النفطية في المملكة العربية السعودية عبر السنوات، باستخدام منهجيات إحصائية تشمل التحليل الوصفي، تحليل التغير السنوي، تحليل الاتجاهات الزمنية، والتصنيف العنقودي. يهدف التحليل إلى فهم أنماط الإنتاج وتحديد الفترات المميزة في الأداء، بما يدعم صناع القرار في التخطيط الاستراتيجي للطاقة.
data <- read.csv("Oil_and_Gas_Production_Statistics.csv")
data_clean <- data %>%
mutate(across(-السنوات, ~as.character(.x))) %>%
mutate(across(-السنوات, ~na_if(.x, "-"))) %>%
mutate(across(-السنوات, ~parse_number(.x)))
data_long <- data_clean %>%
pivot_longer(-السنوات, names_to = "المؤشر", values_to = "القيمة")
descriptive_stats <- data_long %>%
group_by(المؤشر) %>%
summarise(
عدد_القيم = sum(!is.na(القيمة)),
المتوسط = mean(القيمة, na.rm = TRUE),
الوسيط = median(القيمة, na.rm = TRUE),
الانحراف_المعياري = sd(القيمة, na.rm = TRUE),
القيمة_الصغرى = min(القيمة, na.rm = TRUE),
القيمة_العظمى = max(القيمة, na.rm = TRUE)
) %>%
arrange(desc(المتوسط))
kable(descriptive_stats)
المؤشر | عدد_القيم | المتوسط | الوسيط | الانحراف_المعياري | القيمة_الصغرى | القيمة_العظمى |
---|---|---|---|---|---|---|
إنتاج.النفط.الخام | 14 | 3544229.43 | 3559285.5 | 230574.525 | 2980435 | 3865651 |
مدخلات.مصافي.التكرير.النفط.الخام | 14 | 811427.79 | 848023.5 | 140325.086 | 576340 | 986390 |
إنتاج.زيت.الغاز.الديزل | 14 | 330417.86 | 372489.0 | 86616.589 | 181526 | 441316 |
إنتاج.البنزين | 14 | 177528.79 | 185333.0 | 35987.824 | 105229 | 230165 |
إنتاج.زيت.الوقود | 14 | 157255.71 | 161817.0 | 17987.848 | 111451 | 175641 |
إنتاج.المنتجات.النفطية.الأخرى. | 14 | 87420.93 | 81422.0 | 41733.873 | 38060 | 174724 |
إنتاج.الكيروسين.ووقود.الطائرات | 14 | 67188.29 | 62049.0 | 19071.152 | 30706 | 95809 |
إنتاج.النافثا | 14 | 18622.93 | 0.0 | 25588.648 | 0 | 63379 |
إنتاج.الغازات.البترولية.المسالة | 14 | 13628.43 | 13982.0 | 2707.836 | 9056 | 17058 |
yearly_change <- data_long %>%
group_by(المؤشر) %>%
arrange(السنوات) %>%
mutate(
القيمة_السابقة = dplyr::lag(القيمة),
التغير_السنوي_نسبة = (القيمة - القيمة_السابقة) / القيمة_السابقة * 100
)
ggplot(filter(yearly_change, !is.na(التغير_السنوي_نسبة)),
aes(x = السنوات, y = التغير_السنوي_نسبة)) +
geom_line(color = "steelblue") +
geom_point(color = "darkred") +
facet_wrap(~ المؤشر, scales = "free_y") +
theme_minimal()
يوضح الرسم البياني التغير السنوي النسبي في كميات الصادرات والواردات لكل منتج نفطي خلال فترة الدراسة. من أبرز الملاحظات:
data_wide <- data_clean
cor_matrix <- cor(data_wide[,-1], use = "pairwise.complete.obs")
ggcorrplot(cor_matrix,
hc.order = TRUE,
type = "lower",
lab = TRUE,
lab_size = 3,
colors = c("darkred", "white", "darkgreen"),
title = "مصفوفة الارتباط بين المنتجات النفطية",
ggtheme = theme_minimal())
colnames(data_long) <- c("السنة", "المؤشر", "القيمة")
trend_summary <- data_long %>%
group_by(المؤشر) %>%
summarise(
الميل = coef(lm(القيمة ~ السنة))[2],
الاتجاه = case_when(
الميل > 0.1 ~ "🔺 صاعد",
الميل < -0.1 ~ "🔻 هابط",
TRUE ~ "➖ مستقر"
)
)
trend_summary_clean <- trend_summary %>%
rename(
"المنتج" = المؤشر,
"الميل" = الميل,
"اتجاه الاتجاه" = الاتجاه
)
kable(trend_summary_clean, caption = "ملخص الاتجاهات الزمنية للمنتجات النفطية")
المنتج | الميل | اتجاه الاتجاه |
---|---|---|
إنتاج.البنزين | 7550.80659 | 🔺 صاعد |
إنتاج.الغازات.البترولية.المسالة | 44.82198 | 🔺 صاعد |
إنتاج.الكيروسين.ووقود.الطائرات | 449.57802 | 🔺 صاعد |
إنتاج.المنتجات.النفطية.الأخرى. | -2378.49451 | 🔻 هابط |
إنتاج.النافثا | 3939.75604 | 🔺 صاعد |
إنتاج.النفط.الخام | 19528.88352 | 🔺 صاعد |
إنتاج.زيت.الغاز.الديزل | 18708.54066 | 🔺 صاعد |
إنتاج.زيت.الوقود | 996.32967 | 🔺 صاعد |
مدخلات.مصافي.التكرير.النفط.الخام | 27679.61978 | 🔺 صاعد |
colnames(data_long) <- c("السنوات", "المؤشر", "القيمة")
products <- unique(data_long$المؤشر)
forecast_list <- list()
for (p in products) {
series <- data_long %>% filter(المؤشر == p) %>% arrange(السنوات)
ts_data <- ts(series$القيمة, start = min(series$السنوات), frequency = 1)
model <- auto.arima(ts_data)
fc <- forecast(model, h = 5)
forecast_df <- data.frame(
السنوات = seq(max(series$السنوات) + 1, by = 1, length.out = 5),
القيمة = as.numeric(fc$mean),
المؤشر = p,
النوع = "تنبؤ"
)
original_df <- series %>% mutate(النوع = "بيانات فعلية")
forecast_list[[p]] <- bind_rows(original_df, forecast_df)
}
forecast_all <- bind_rows(forecast_list)
ggplot(forecast_all, aes(x = السنوات, y = القيمة, color = النوع)) +
geom_line(size = 1.2) +
facet_wrap(~ المؤشر, scales = "free_y") +
theme_minimal()
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
data_cluster <- data_clean %>% column_to_rownames("السنوات")
data_scaled <- scale(data_cluster)
k <- 3
km_result <- kmeans(data_scaled, centers = k, nstart = 25)
years_clustered <- data.frame(
السنة = rownames(data_scaled),
العنقود = factor(km_result$cluster)
)
kable(years_clustered, caption = "تصنيف السنوات إلى عناقيد باستخدام K-Means")
السنة | العنقود | |
---|---|---|
2010 | 2010 | 1 |
2011 | 2011 | 1 |
2012 | 2012 | 1 |
2013 | 2013 | 1 |
2014 | 2014 | 1 |
2015 | 2015 | 2 |
2016 | 2016 | 2 |
2017 | 2017 | 2 |
2018 | 2018 | 2 |
2019 | 2019 | 3 |
2020 | 2020 | 3 |
2021 | 2021 | 3 |
2022 | 2022 | 2 |
2023 | 2023 | 3 |
data_cluster <- data_clean %>% column_to_rownames("السنوات")
data_scaled <- scale(data_cluster)
k <- 3
km_result <- kmeans(data_scaled, centers = k, nstart = 25)
fviz_cluster(km_result, data = data_scaled,
geom = "point",
ellipse.type = "convex",
palette = "Dark2",
ggtheme = theme_minimal()) +
labs(title = "تحليل التكتل (K-means) للسنوات بناءً على مؤشرات النفط")
تم استخدام خوارزمية K-Means لتحليل أنماط الأداء النفطي عبر السنوات، بناءً على مجموعة من المؤشرات مثل الصادرات والواردات لمختلف المنتجات البترولية. وقد أظهر التحليل وجود ثلاث عناقيد رئيسية تمثل أنماطًا مختلفة في الأداء عبر الزمن.
العنقود 1: (السنوات 2015 إلى 2020)
فترة اتسمت بتقارب واستقرار في مستويات الإنتاج والاستهلاك.
تعكس آثار انخفاض أسعار النفط في تلك السنوات، بالإضافة إلى السياسات
الترشيدية والهيكلية.
تصنف كفترة “ذهبية” لثبات المؤشرات ووضوح الاتجاهات، مما
يجعلها مرجعية جيدة للتخطيط المستقبلي.
العنقود 2: (السنوات 2012، 2014، 2021، 2022)
شهدت هذه السنوات تغيرات واضحة أو تحولات مفاجئة في الأداء.
قد تعكس هذه التحولات تأثير أحداث خارجية مثل جائحة كورونا أو تغييرات في
البنية التحتية والسياسات النفطية.
تصنف كفترة “حرجة” بسبب صعوبة التنبؤ وارتفاع درجة
التقلب، ما يستدعي تحليلًا أعمق عند التخطيط.
العنقود 3: (السنوات 2010، 2011، 2013)
تمثل هذه المجموعة نمط الأداء التقليدي أو “المرجعي” الذي كان سائدًا في
بداية العقد.
تصلح كمعيار للمقارنة عند تقييم التحولات اللاحقة أو تطوير السياسات
الحديثة.
يمثل هذا التصنيف أداة تحليلية مهمة لتقييم الأداء الزمني بشكل جماعي، مما يساعد في: - التعرف على الفترات الحرجة التي تتطلب تدخلات أو إعادة ضبط سياسات. - إبراز الفترات الذهبية ذات الكفاءة التشغيلية العالية. - توفير أساس مرجعي لفهم التطورات الزمنية وإجراء المقارنات الموضوعية. - دعم القرارات الوطنية للطاقة المبنية على بيانات تحليلية بدلاً من الانطباعات العامة.
جميع الحقوق محفوظة © أرقامي 2025
لمزيد من المعلومات، تواصل معنا عبر بريدنا الإلكتروني: argamil2025@gmail.com