tarekamr.com — امتى نستخدم التوزيع البينومي ضد توزيع بيتا؟
~ / pages / امتى نستخدم التوزيع البينومي ضد توزيع بيتا؟

امتى نستخدم التوزيع البينومي ضد توزيع بيتا؟

وإيه فايدة توزيعات الاحتمالات أصلاً؟

تخيل معايا: لاعب كورة مشهور (خلينا نقول محمد صلاح مثلاً) معروف إنه بيسجل 70% من ضربات الجزاء اللي بيشوطها.

السؤال: في الموسم الجاي، هايشوط 10 بلنتيات - كام واحدة منهم هيسجلها؟

"سهلة! هيسجل 7 من الـ 10 - واضحة!"

استنى شوية! 10 ركلات جزاء رقم صغير جداً صعب نستنتج منه إجابة أكيدة!

اللي ممكن يحصل:

  • مع شوية حظ: يسجل 8 أو حتى 9 ركلات
  • يوم وحش: يضيع كام ركلة غير متوقعة ويسجل 5 بس
  • 🤷 الـ 7 المتوقعة: واحدة من احتمالات كتير!

يعني إيه؟ مع عدد صغير زي ده، مفيش إجابة واحدة "أكيدة" - لازم نعبر عن توقعنا في شكل توزيع احتمالي!

وفي الحالة دي: محتاجين التوزيع البينومي (Binomial Distribution)!

التوزيع البينومي لـ 10 ركلات جزاء مع p=0.7

الرسم البياني ده بيقول إيه بالضبط؟

تخيل التجربة دي:

التجربة

  1. صلاح يشوط 10 بلنتيات → نكتب كام واحدة سجّلها
  2. بيشوط 10 تانيين → نقيدهم كمان
  3. نكرر ده 1,000 مرة (يعني 1,000 مجموعة × 10 ركلات)
  4. نرسم هستوجرام (رسم بياني) لعدد الأهداف في كل مجموعة

النتيجة: الرسم البياني اللي فوق!

ملاحظة مهمة

صلاح مش ممكن يسجل:

  • ❌ 7.5 ركلة جزاء
  • ❌ 3.8 ركلة جزاء
  • ✅ أرقام صحيحة بس: 0، 1، 2، ..., 10

عشان كده:

  • التوزيع البينومي = توزيع منفصل (Discrete Distribution)
  • الرسم البياني = دالة كتلة احتمالية (Probability Mass Function)

إزاي نستخدم التوزيع البينومي؟

بدل المصطلحات المعقدة (تجربة، حدث، نجاح، فشل...)، خلينا نستخدم مثال صلاح!

المعطيات اللي عندنا

  1. p = 0.7: احتمال تسجيل بلنتي واحد (70%)
  2. k = 10: عدد البلنتيات اللي هيشوطها

اللي عايزين نعرفه

x: احتمال إنه يسجل x ركلة من الـ 10 ركلات

مثلاً:

  • احتمال يسجل 7 ركلات = حوالي 27% (أعلى احتمال)
  • احتمال يسجل 5 ركلات فقط = حوالي 10%
  • احتمال يسجل 10 من 10 = حوالي 3% (صعب بس مش مستحيل!)

الخلاصة: لما العدد صغير (10 ركلات)، مش ممكن نكون واثقين من النتيجة!

طب لو العدد كبير؟ الصورة بتتغير!

تخيل صلاح هيشوط:

  • 🟢 100 بلنتي في الموسم
  • 🔵 1,000 بلنتي في مسيرته
  • 🟣 10,000 بلنتي (افتراضي طبعاً!)

التوزيعات البينومية لأعداد مختلفة من الركلات

لاحظ الفرق:

مع 10 ركلات (عدد صغير)

  • الاحتمالات متوزعة على نطاق واسع
  • ممكن يسجل من 4 لـ 10 ركلات
  • مش متأكدين من النتيجة

مع 10,000 ركلة (عدد كبير)

  • الاحتمالات متركزة جداً حوالين 7,000
  • شبه مستحيل يسجل 5,000 بس (50%)
  • متأكدين تقريباً إنه هيسجل حوالي 7,000 ركلة (±100)

إيه فايدة الإحصاء أصلاً؟

السؤال المهم: لو العدد كبير والنتيجة واضحة - ليه نتعلم إحصاء؟!

الإجابة: الإحصاء بيفيد لما البيانات قليلة!

مثال من الواقع

شركة ناشئة (Startup) عايزة تختبر منتج جديد:

  • عندها ميزانية تختبر على 100 عميل بس
  • مش 10,000 عميل - مكلف جداً!

السؤال: نسبة الشراء (conversion rate) كام؟

  • لو 70 عميل اشتروا من 100 → هل الـ conversion rate بتاعتنا 70% فعلاً؟
  • الإحصاء بيقولك: ممكن تكون 65%-75% مع هامش خطأ!

يعني: الإحصاء أداة للتعامل مع عدم اليقين لما البيانات قليلة!

التوزيع التاني: توزيع بيتا (Beta Distribution)

دلوقتي السؤال معكوس!

السيناريو الجديد

المعطيات:

  • صلاح شاط 10 بلنتيات
  • سجّل 7 منهم

السؤال: إيه نسبة دقته الحقيقية؟

"سهلة! دقته 70% - واضحة!"

تعالى بقى! مش لسه متفقين إن 10 رقم صغير جداً؟! مش المفروض ما نقفزش للاستنتاجات؟!

الحل: محتاجين توزيع يعبر عن اعتقادنا في دقة صلاح الحقيقية!

التوزيع المناسب: توزيع بيتا (Beta Distribution)!

معاملات توزيع بيتا

التوزيع ده بياخد معاملين:

  • a = 7: عدد النجاحات (الأهداف المسجلة)
  • b = 3: عدد الفشل (البلنتيات الضايعة)

توزيع بيتا يوضح احتمالية دقة اللاعب

الفرق الكبير: مستمر مش منفصل!

في التوزيع البينومي:

  • المحور الأفقي = أرقام صحيحة بس: 0، 1، 2، ..., 10
  • منفصل (Discrete)
  • دالة كتلة احتمالية (Probability Mass Function)

في توزيع بيتا:

  • المحور الأفقي = أي رقم بين 0 و 1
  • مثلاً: 0.65، 0.7، 0.723، 0.8
  • مستمر (Continuous)
  • دالة كثافة احتمالية (Probability Density Function)

ليه؟ لأن الاحتمال (نسبة الدقة) ممكن يكون أي رقم بين 0% و 100%!

الخلاصة: امتى نستخدم مين؟

التوزيعان دول زي وجهين لعملة واحدة!

استخدم التوزيع البينومي (Binomial) لما:

المعطيات:

  • ✅ عارف نسبة النجاح (p)
  • ✅ عارف عدد المحاولات (k)

السؤال:

  • كام مرة هينجح من الـ k محاولة؟

أمثلة من الحياة:

  • لاعب كورة دقته 70% - هيسجل كام هدف من 10 بلنتيات؟
  • موقع conversion rate بتاعه 5% - كام عميل هيشتري من 100 زائر؟
  • دواء فعاليته 80% - كام مريض هيتعافى من 50 مريض؟

استخدم توزيع بيتا (Beta) لما:

المعطيات:

  • ✅ عارف عدد النجاحات (a)
  • ✅ عارف عدد الفشل (b)

السؤال:

  • إيه نسبة النجاح الحقيقية؟

أمثلة من الحياة:

  • لاعب سجّل 7 من 10 بلنتيات - إيه دقته الحقيقية؟
  • 5 عملاء اشتروا من 100 زائر - إيه الـ conversion rate الحقيقي؟
  • 40 مريض اتعافوا من 50 - إيه فعالية الدواء الحقيقية؟

العلاقة بينهم: تكاملية!

في الإحصاء البايزي (Bayesian Inference):

  • توزيع بيتا بيستخدم كـ prior (توقع مبدئي)
  • التوزيع البينومي بيستخدم كـ likelihood (احتمالية البيانات)
  • النتيجة = posterior (توقع محدّث)

يعني: الاتنين بيشتغلوا مع بعض - هنشرح ده بالتفصيل في مقال مستقبلي!

الدرس المستفاد

الإحصاء مش أرقام معقدة - ده لغة للتعبير عن عدم اليقين!

لما البيانات قليلة:

  • لا تقفز للاستنتاجات - "واضح" مش دايماً صح
  • استخدم توزيعات احتمالية - عبّر عن عدم اليقين
  • اختار التوزيع المناسب - بينومي ولا بيتا؟

الخلاصة: الإحصاء أداة لاتخاذ قرارات ذكية في ظل بيانات محدودة!


طارق عمرو، 2 فبراير 2023

الترجمات: [EN] [NL]   [↓ .md]
~ / pages / امتى نستخدم التوزيع البينومي ضد توزيع بيتا؟
>