شعار أرقامي

تقرير تحليلي – منصة أرقامي

1 المقدمة

يهدف هذا التقرير إلى تحليل سلوك وأداء المعتمرين خلال الربع الأول من عام 2025، اعتمادًا على بيانات الهيئة العامة للإحصاء. يركّز التحليل على الجوانب الديموغرافية والمكانية والزمانية، إضافة إلى خصائص معتمري الخارج ومنافذ القدوم. ويُنفَّذ التحليل على مستويين:

يشمل التقرير أربع مجموعات بيانات رئيسية: 1. التركيبة السكانية للمعتمرين من الداخل (العمر × الجنسية × الجنس). 2. التوزيع المكاني والزماني للمعتمرين (المنطقة الإدارية × الشهر × الجنس). 3. التوزيع النسبي لمعتمري الخارج حسب الفئات العمرية والشهر. 4. منافذ القدوم للمعتمرين القادمين من الخارج.

2 أسئلة التحليل

3 قراءة وتنظيف البيانات

f_demog  ="C:/Users/abdrh/Downloads/umrah_q1_2025_demographics.csv"
f_region ="C:/Users/abdrh/Downloads/umrah_q1_2025_region_month.csv"
f_ageshare<- "C:/Users/abdrh/Downloads/umrah_q1_2025_outbound_age_share.csv"
f_port   ="C:/Users/abdrh/Downloads/umrah_q1_2025_port_share.csv"

demog=read_csv(f_demog, locale = locale(encoding = "UTF-8"),
                  skip = 1, col_names = c("age_group", "nationality", "sex", "count"))
regmn=read_csv(f_region, locale = locale(encoding = "UTF-8"),
                  skip = 1, col_names = c("region", "month", "sex", "count"))
agesh=read_csv(f_ageshare, locale = locale(encoding = "UTF-8"),
                  skip = 1, col_names = c("age_group", "month", "share_percent"))
ports=read_csv(f_port, locale = locale(encoding = "UTF-8"),
                  skip = 1, col_names = c("port_type", "share_percent"))

demog=demog %>%
  mutate(
    count = as.numeric(count),
    nationality = as.factor(nationality),
    sex = as.factor(sex),
    age_group = factor(age_group, levels = c("0-14","15-24","25-34","35-44","45-54","55-64","65+"), ordered = TRUE)
  )

regmn=regmn %>%
  mutate(
    count = as.numeric(count),
    month = factor(month, levels = c("يناير","فبراير","مارس"), ordered = TRUE),
    region = as.factor(region),
    sex = as.factor(sex)
  )

agesh=agesh %>%
  mutate(
    share_percent = as.numeric(share_percent),
    age_group = factor(age_group, levels = c("0-14","15-24","25-34","35-44","45-54","55-64","65+"), ordered = TRUE),
    month = factor(month, levels = c("يناير","فبراير","مارس"), ordered = TRUE)
  )

ports=ports %>%
  mutate(
    share_percent = as.numeric(share_percent),
    port_type = as.factor(port_type)
  )

4 التحليل الوصفي

demog %>%
  group_by(age_group, nationality, sex) %>%
  summarise(total = sum(count), .groups = "drop") %>%
  ggplot(aes(x = age_group, y = total, fill = interaction(nationality, sex))) +
  geom_col(position = "dodge") +
  labs(title = "توزيع المعتمرين بالداخل حسب العمر والجنسية والجنس",
       x = "الفئة العمرية", y = "العدد") +
  guides(fill = guide_legend(title = "الجنسية × الجنس")) +
  theme_minimal(base_size = 13)

تفسير: يتضح أن الفئتين 25–34 و 35–44 تمثلان الشريحة الأكبر من المعتمرين، خصوصًا من الذكور غير السعوديين، ما يعكس ارتفاع الطلب على العمرة بين الفئات الشابة العاملة.

demog %>%
  group_by(age_group, nationality) %>%
  summarise(total = sum(count), .groups = "drop") %>%
  ggplot(aes(x = age_group, y = total, fill = nationality)) +
  geom_col(position = "fill") +
  scale_y_continuous(labels = scales::percent) +
  labs(title = "النسبة التركيبية حسب العمر والجنسية (Stacked 100%)",
       x = "الفئة العمرية", y = "النسبة") +
  theme_minimal(base_size = 13)

تفسير: تظهر النسب أن غير السعوديين يشكّلون الغالبية في معظم الفئات العمرية، بينما ترتفع نسبة السعوديين في الفئات الصغيرة والكبيرة، ما يشير إلى اختلاف أنماط المشاركة حسب العمر والجنسية.

4.1 التوزيع حسب المناطق الإدارية

top_regions=regmn %>%
  group_by(region) %>%
  summarise(total = sum(count), .groups = "drop") %>%
  arrange(desc(total)) %>%
  slice_head(n = 10)

ggplot(top_regions, aes(x = fct_reorder(region, total), y = total)) +
  geom_col() +
  coord_flip() +
  labs(title = "أعلى 10 مناطق من حيث إجمالي عدد المعتمرين",
       x = "المنطقة", y = "الإجمالي") +
  theme_minimal(base_size = 13)

تفسير: يتضح أن منطقة مكة المكرمة تتصدر إجمالي عدد المعتمرين بفارق كبير، تليها منطقة الرياض، ثم المدينة المنورة والمنطقة الشرقية.

4.2 التوزيع الزمني (يناير–فبراير–مارس)

regmn %>%
  group_by(month) %>%
  summarise(total = sum(count), .groups = "drop") %>%
  ggplot(aes(x = month, y = total, group = 1)) +
  geom_line(linewidth = 1) + geom_point(size = 3) +
  labs(title = "إجمالي المعتمرين حسب الشهر",
       x = "الشهر", y = "الإجمالي") +
  theme_minimal(base_size = 13)

تفسير: يُظهر الرسم تصاعدًا واضحًا في أعداد المعتمرين من يناير إلى مارس، حيث بلغ الذروة في شهر مارس.

4.3 خريطة حرارة بسيطة (منطقة × شهر)

regmn %>%
  group_by(region, month) %>%
  summarise(total = sum(count), .groups = "drop") %>%
  ggplot(aes(x = month, y = region, fill = total)) +
  geom_tile() +
  labs(title = "خريطة حرارة: إجمالي المعتمرين حسب المنطقة والشهر",
       x = "الشهر", y = "المنطقة") +
  theme_minimal(base_size = 12)

تفسير: تُظهر الخريطة تركّز النشاط العمري بوضوح في منطقة مكة المكرمة خلال شهر مارس، تليها الرياض والمدينة المنورة بنسب أقل.

4.4 توزيع أعمار معتمري الخارج (بالنِسَب)

ggplot(agesh, aes(x = age_group, y = share_percent, fill = month)) +
  geom_col(position = "dodge") +
  labs(title = "التوزيع النسبي لمعتمري الخارج حسب الفئات العمرية والشهر",
       x = "الفئة العمرية", y = "النسبة (%)") +
  theme_minimal(base_size = 13)

تفسير: يتضح أن الفئات 35–44 و45–54 تمثّل النسبة الأكبر من معتمري الخارج، مع استقرار نسبي عبر الأشهر الثلاثة الأولى. كما يُلاحظ ارتفاع المشاركة في فئة 55–64 خلال فبراير، ما يعكس تنوّع الفئات العمرية المشاركة في العمرة الدولية مع ميل واضح نحو الفئات المتوسطة عمريًا.

4.5 منافذ القدوم (Pie)

ports2=ports %>% mutate(label = paste0(port_type, " (", round(share_percent,1), "%)"))

ggplot(ports2, aes(x = "", y = share_percent, fill = port_type)) +
  geom_col(width = 1) +
  coord_polar(theta = "y") +
  labs(title = "التوزيع النسبي لمنافذ القدوم") +
  theme_void(base_size = 13) +
  guides(fill = guide_legend(title = "نوع المنفذ"))

5 التحليل الإحصائي الاستدلالي

ملاحظات منهجية سريعة:

5.1 اختبار t: الفروق بين الجنسين (إجماليًا)

demog_sex=demog %>% group_by(sex) %>% summarise(total = sum(count), .groups="drop")
demog_sex
sex total
إناث 2721618
ذكور 5977249
t_test_res=t.test(count ~ sex, data = demog)
t_test_res
## 
##  Welch Two Sample t-test
## 
## data:  count by sex
## t = -2.1088, df = 15.163, p-value = 0.05199
## alternative hypothesis: true difference in means between group إناث and group ذكور is not equal to 0
## 95 percent confidence interval:
##  -467364.1    2274.0
## sample estimates:
## mean in group إناث mean in group ذكور 
##           194401.3           426946.4

تفسير: تشير نتائج الاختبار إلى أن متوسط عدد المعتمرين الذكور أعلى من الإناث، حيث بلغ مجموع الذكور حوالي 5.98 مليون مقابل 2.72 مليون للإناث. ورغم أن قيمة p = 0.051 تقترب من مستوى الدلالة الإحصائية (0.05)، إلا أنها لا تشير إلى فرق معنوي قوي إحصائيًا، لكنها تعكس اتجاهًا واضحًا لتفوّق مشاركة الذكور في أداء العمرة خلال الربع الأول من 2025.

5.2 كاي-تربيع: ارتباط المنطقة بالشهر

tab_rm=regmn %>%
  group_by(region, month) %>%
  summarise(total = sum(count), .groups="drop") %>%
  pivot_wider(names_from = month, values_from = total, values_fill = 0)

m=as.matrix(tab_rm[,-1])
rownames(m)=tab_rm$region

chisq_res=chisq.test(m)
chisq_res
## 
##  Pearson's Chi-squared test
## 
## data:  m
## X-squared = 795760, df = 24, p-value < 2.2e-16

تفسير: أظهرت نتائج اختبار كاي-تربيع قيمة p < 0.001 مما يدل على وجود ارتباط معنوي قوي بين المنطقة الإدارية والشهر. بمعنى أن توزيع أعداد المعتمرين يختلف باختلاف المنطقة والشهر، وهو ما يعكس النمط الموسمي والمكاني لحركة العمرة، خصوصًا مع تزايد الأعداد في مكة المكرمة والمدينة المنورة خلال الأشهر الأخيرة من الربع الأول.

5.3 ارتباط العمر بالنسبة (معتمري الخارج)

agesh_num=agesh %>% mutate(age_rank = as.numeric(age_group))
cor_res=cor.test(agesh_num$share_percent, agesh_num$age_rank, method = "pearson")
cor_res
## 
##  Pearson's product-moment correlation
## 
## data:  agesh_num$share_percent and agesh_num$age_rank
## t = 4.9194, df = 26, p-value = 4.157e-05
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
##  0.4335424 0.8477883
## sample estimates:
##       cor 
## 0.6943172

تفسير: تشير نتائج معامل ارتباط بيرسون إلى وجود ارتباط موجب قوي (r ≈ 0.69) بين العمر ونسبة المشاركة في العمرة. بمعنى أن كلما ارتفع العمر زادت نسبة أداء العمرة بين معتمري الخارج، وهو ما يعكس ميول الفئات الأكبر سنًا إلى أداء العمرة بوتيرة أعلى خلال الربع الأول من عام 2025.

6 الخلاصة — رؤية أرقامي

تعكس نتائج التحليل أن العمرة خلال الربع الأول من عام 2025 شهدت نموًا متسارعًا واتجاهًا موسميًا واضحًا بلغ ذروته في شهر مارس، مدفوعًا بارتفاع أعداد المعتمرين في منطقة مكة المكرمة تليها الرياض والمدينة المنورة.

تؤكد بيانات الهيئة أن الفئات الشابة (25–44 عامًا) تمثل المحرك الرئيسي للنشاط العمري، مع تفوق واضح لغير السعوديين من الذكور، ما يشير إلى استمرار الطلب المرتفع على أداء العمرة بين القوى العاملة الشابة.

أما معتمرو الخارج، فيتجه معظمهم نحو العمرة عبر المنافذ الجوية، بينما تُظهر التحليلات الإحصائية وجود ارتباط قوي بين الشهر والمنطقة، وعلاقة موجبة بين العمر ونسبة المشاركة، مما يعكس نمطًا موسميًا وتوزيعًا ديموغرافيًا متوازنًا.

جميع الحقوق محفوظة © أرقامي 2025

لمزيد من المعلومات، تواصل معنا عبر بريدنا الإلكتروني: argamil2025@gmail.com