tarekamr.com — امتى نستخدم التوزيع البينومي ضد توزيع بيتا؟

امتى نستخدم التوزيع البينومي ضد توزيع بيتا؟

وإيه فايدة توزيعات الاحتمالات أصلاً؟

تخيل معايا: لاعب كورة مشهور (خلينا نقول محمد صلاح مثلاً) معروف إنه بيسجل 70% من ضربات الجزاء اللي بيشوطها.

السؤال: في الموسم الجاي، هايشوط 10 بلنتيات - كام واحدة منهم هيسجلها؟

"سهلة! هيسجل 7 من الـ 10 - واضحة!"

استنى شوية! 10 ركلات جزاء رقم صغير جداً صعب نستنتج منه إجابة أكيدة!

اللي ممكن يحصل:

✅ مع شوية حظ: يسجل 8 أو حتى 9 ركلات
❌ يوم وحش: يضيع كام ركلة غير متوقعة ويسجل 5 بس
🤷 الـ 7 المتوقعة: واحدة من احتمالات كتير!

يعني إيه؟ مع عدد صغير زي ده، مفيش إجابة واحدة "أكيدة" - لازم نعبر عن توقعنا في شكل توزيع احتمالي!

وفي الحالة دي: محتاجين التوزيع البينومي (Binomial Distribution)!

التوزيع البينومي لـ 10 ركلات جزاء مع p=0.7

الرسم البياني ده بيقول إيه بالضبط؟

تخيل التجربة دي:

التجربة

صلاح يشوط 10 بلنتيات → نكتب كام واحدة سجّلها
بيشوط 10 تانيين → نقيدهم كمان
نكرر ده 1,000 مرة (يعني 1,000 مجموعة × 10 ركلات)
نرسم هستوجرام (رسم بياني) لعدد الأهداف في كل مجموعة

النتيجة: الرسم البياني اللي فوق!

ملاحظة مهمة

صلاح مش ممكن يسجل:

❌ 7.5 ركلة جزاء
❌ 3.8 ركلة جزاء
✅ أرقام صحيحة بس: 0، 1، 2، ..., 10

عشان كده:

التوزيع البينومي = توزيع منفصل (Discrete Distribution)
الرسم البياني = دالة كتلة احتمالية (Probability Mass Function)

إزاي نستخدم التوزيع البينومي؟

بدل المصطلحات المعقدة (تجربة، حدث، نجاح، فشل...)، خلينا نستخدم مثال صلاح!

المعطيات اللي عندنا

p = 0.7: احتمال تسجيل بلنتي واحد (70%)
k = 10: عدد البلنتيات اللي هيشوطها

اللي عايزين نعرفه

x: احتمال إنه يسجل x ركلة من الـ 10 ركلات

مثلاً:

احتمال يسجل 7 ركلات = حوالي 27% (أعلى احتمال)
احتمال يسجل 5 ركلات فقط = حوالي 10%
احتمال يسجل 10 من 10 = حوالي 3% (صعب بس مش مستحيل!)

الخلاصة: لما العدد صغير (10 ركلات)، مش ممكن نكون واثقين من النتيجة!

طب لو العدد كبير؟ الصورة بتتغير!

تخيل صلاح هيشوط:

🟢 100 بلنتي في الموسم
🔵 1,000 بلنتي في مسيرته
🟣 10,000 بلنتي (افتراضي طبعاً!)

التوزيعات البينومية لأعداد مختلفة من الركلات

لاحظ الفرق:

مع 10 ركلات (عدد صغير)

الاحتمالات متوزعة على نطاق واسع
ممكن يسجل من 4 لـ 10 ركلات
مش متأكدين من النتيجة

مع 10,000 ركلة (عدد كبير)

الاحتمالات متركزة جداً حوالين 7,000
شبه مستحيل يسجل 5,000 بس (50%)
متأكدين تقريباً إنه هيسجل حوالي 7,000 ركلة (±100)

إيه فايدة الإحصاء أصلاً؟

السؤال المهم: لو العدد كبير والنتيجة واضحة - ليه نتعلم إحصاء؟!

الإجابة: الإحصاء بيفيد لما البيانات قليلة!

مثال من الواقع

شركة ناشئة (Startup) عايزة تختبر منتج جديد:

عندها ميزانية تختبر على 100 عميل بس
مش 10,000 عميل - مكلف جداً!

السؤال: نسبة الشراء (conversion rate) كام؟

لو 70 عميل اشتروا من 100 → هل الـ conversion rate بتاعتنا 70% فعلاً؟
الإحصاء بيقولك: ممكن تكون 65%-75% مع هامش خطأ!

يعني: الإحصاء أداة للتعامل مع عدم اليقين لما البيانات قليلة!

التوزيع التاني: توزيع بيتا (Beta Distribution)

دلوقتي السؤال معكوس!

السيناريو الجديد

المعطيات:

صلاح شاط 10 بلنتيات
سجّل 7 منهم

السؤال: إيه نسبة دقته الحقيقية؟

"سهلة! دقته 70% - واضحة!"

تعالى بقى! مش لسه متفقين إن 10 رقم صغير جداً؟! مش المفروض ما نقفزش للاستنتاجات؟!

الحل: محتاجين توزيع يعبر عن اعتقادنا في دقة صلاح الحقيقية!

التوزيع المناسب: توزيع بيتا (Beta Distribution)!

معاملات توزيع بيتا

التوزيع ده بياخد معاملين:

a = 7: عدد النجاحات (الأهداف المسجلة)
b = 3: عدد الفشل (البلنتيات الضايعة)

توزيع بيتا يوضح احتمالية دقة اللاعب

الفرق الكبير: مستمر مش منفصل!

في التوزيع البينومي:

المحور الأفقي = أرقام صحيحة بس: 0، 1، 2، ..., 10
منفصل (Discrete)
دالة كتلة احتمالية (Probability Mass Function)

في توزيع بيتا:

المحور الأفقي = أي رقم بين 0 و 1
مثلاً: 0.65، 0.7، 0.723، 0.8
مستمر (Continuous)
دالة كثافة احتمالية (Probability Density Function)

ليه؟ لأن الاحتمال (نسبة الدقة) ممكن يكون أي رقم بين 0% و 100%!

الخلاصة: امتى نستخدم مين؟

التوزيعان دول زي وجهين لعملة واحدة!

استخدم التوزيع البينومي (Binomial) لما:

المعطيات:

✅ عارف نسبة النجاح (p)
✅ عارف عدد المحاولات (k)

السؤال:

❓ كام مرة هينجح من الـ k محاولة؟

أمثلة من الحياة:

لاعب كورة دقته 70% - هيسجل كام هدف من 10 بلنتيات؟
موقع conversion rate بتاعه 5% - كام عميل هيشتري من 100 زائر؟
دواء فعاليته 80% - كام مريض هيتعافى من 50 مريض؟

استخدم توزيع بيتا (Beta) لما:

المعطيات:

✅ عارف عدد النجاحات (a)
✅ عارف عدد الفشل (b)

السؤال:

❓ إيه نسبة النجاح الحقيقية؟

أمثلة من الحياة:

لاعب سجّل 7 من 10 بلنتيات - إيه دقته الحقيقية؟
5 عملاء اشتروا من 100 زائر - إيه الـ conversion rate الحقيقي؟
40 مريض اتعافوا من 50 - إيه فعالية الدواء الحقيقية؟

العلاقة بينهم: تكاملية!

في الإحصاء البايزي (Bayesian Inference):

توزيع بيتا بيستخدم كـ prior (توقع مبدئي)
التوزيع البينومي بيستخدم كـ likelihood (احتمالية البيانات)
النتيجة = posterior (توقع محدّث)

يعني: الاتنين بيشتغلوا مع بعض - هنشرح ده بالتفصيل في مقال مستقبلي!

الدرس المستفاد

الإحصاء مش أرقام معقدة - ده لغة للتعبير عن عدم اليقين!

لما البيانات قليلة:

❌ لا تقفز للاستنتاجات - "واضح" مش دايماً صح
✅ استخدم توزيعات احتمالية - عبّر عن عدم اليقين
✅ اختار التوزيع المناسب - بينومي ولا بيتا؟

الخلاصة: الإحصاء أداة لاتخاذ قرارات ذكية في ظل بيانات محدودة!

طارق عمرو، 2 فبراير 2023

الترجمات: [EN] [NL] [↓ .md]