# امتى نستخدم التوزيع البينومي ضد توزيع بيتا؟ ## وإيه فايدة توزيعات الاحتمالات أصلاً؟ **تخيل معايا**: لاعب كورة مشهور (خلينا نقول **محمد صلاح** مثلاً) معروف إنه بيسجل **70% من ضربات الجزاء** اللي بيشوطها. **السؤال**: في الموسم الجاي، هايشوط **10 بلنتيات** - **كام واحدة منهم هيسجلها؟** > **"سهلة! هيسجل 7 من الـ 10 - واضحة!"** **استنى شوية!** 10 ركلات جزاء **رقم صغير جداً** صعب نستنتج منه إجابة أكيدة! **اللي ممكن يحصل**: - ✅ **مع شوية حظ**: يسجل 8 أو حتى 9 ركلات - ❌ **يوم وحش**: يضيع كام ركلة غير متوقعة ويسجل 5 بس - 🤷 **الـ 7 المتوقعة**: واحدة من احتمالات كتير! **يعني إيه؟** مع عدد صغير زي ده، **مفيش إجابة واحدة "أكيدة"** - لازم نعبر عن توقعنا في شكل **توزيع احتمالي**! **وفي الحالة دي**: محتاجين **التوزيع البينومي** (Binomial Distribution)! ![التوزيع البينومي لـ 10 ركلات جزاء مع p=0.7](/static/img/binomial-beta-1.png) ## الرسم البياني ده بيقول إيه بالضبط؟ **تخيل التجربة دي**: ### التجربة 1. صلاح يشوط **10 بلنتيات** → نكتب كام واحدة سجّلها 2. بيشوط **10 تانيين** → نقيدهم كمان 3. نكرر ده **1,000 مرة** (يعني 1,000 مجموعة × 10 ركلات) 4. نرسم **هستوجرام** (رسم بياني) لعدد الأهداف في كل مجموعة **النتيجة**: الرسم البياني اللي فوق! ### ملاحظة مهمة **صلاح مش ممكن يسجل**: - ❌ 7.5 ركلة جزاء - ❌ 3.8 ركلة جزاء - ✅ أرقام صحيحة **بس**: 0، 1، 2، ..., 10 **عشان كده**: - التوزيع البينومي = **توزيع منفصل** (Discrete Distribution) - الرسم البياني = **دالة كتلة احتمالية** (Probability Mass Function) ## إزاي نستخدم التوزيع البينومي؟ **بدل المصطلحات المعقدة** (تجربة، حدث، نجاح، فشل...)، خلينا نستخدم **مثال صلاح**! ### المعطيات اللي عندنا 1. **p = 0.7**: احتمال تسجيل بلنتي واحد (70%) 2. **k = 10**: عدد البلنتيات اللي هيشوطها ### اللي عايزين نعرفه **x**: احتمال إنه يسجل **x** ركلة من الـ 10 ركلات **مثلاً**: - احتمال يسجل **7 ركلات** = حوالي **27%** (أعلى احتمال) - احتمال يسجل **5 ركلات فقط** = حوالي **10%** - احتمال يسجل **10 من 10** = حوالي **3%** (صعب بس مش مستحيل!) **الخلاصة**: لما العدد **صغير** (10 ركلات)، **مش ممكن نكون واثقين** من النتيجة! ## طب لو العدد كبير؟ الصورة بتتغير! **تخيل صلاح هيشوط**: - 🟢 **100 بلنتي** في الموسم - 🔵 **1,000 بلنتي** في مسيرته - 🟣 **10,000 بلنتي** (افتراضي طبعاً!) ![التوزيعات البينومية لأعداد مختلفة من الركلات](/static/img/binomial-beta-2.png) **لاحظ الفرق**: ### مع 10 ركلات (عدد صغير) - الاحتمالات **متوزعة على نطاق واسع** - ممكن يسجل من 4 لـ 10 ركلات - **مش متأكدين** من النتيجة ### مع 10,000 ركلة (عدد كبير) - الاحتمالات **متركزة جداً** حوالين 7,000 - شبه **مستحيل** يسجل 5,000 بس (50%) - **متأكدين تقريباً** إنه هيسجل حوالي 7,000 ركلة (±100) ## إيه فايدة الإحصاء أصلاً؟ **السؤال المهم**: لو العدد كبير والنتيجة واضحة - **ليه نتعلم إحصاء؟!** **الإجابة**: الإحصاء **بيفيد** لما البيانات **قليلة**! ### مثال من الواقع **شركة ناشئة** (Startup) عايزة تختبر منتج جديد: - عندها **ميزانية** تختبر على **100 عميل بس** - **مش 10,000 عميل** - مكلف جداً! **السؤال**: نسبة الشراء (conversion rate) كام؟ - لو 70 عميل اشتروا من 100 → **هل الـ conversion rate بتاعتنا 70% فعلاً؟** - **الإحصاء بيقولك**: ممكن تكون **65%-75%** مع هامش خطأ! **يعني**: الإحصاء **أداة للتعامل مع عدم اليقين** لما البيانات قليلة! ## التوزيع التاني: توزيع بيتا (Beta Distribution) **دلوقتي السؤال معكوس!** ### السيناريو الجديد **المعطيات**: - صلاح شاط **10 بلنتيات** - سجّل **7 منهم** **السؤال**: **إيه نسبة دقته الحقيقية؟** > **"سهلة! دقته 70% - واضحة!"** **تعالى بقى!** مش **لسه متفقين** إن 10 رقم صغير جداً؟! مش المفروض **ما نقفزش للاستنتاجات؟!** **الحل**: محتاجين **توزيع** يعبر عن اعتقادنا في دقة صلاح الحقيقية! **التوزيع المناسب**: **توزيع بيتا** (Beta Distribution)! ### معاملات توزيع بيتا التوزيع ده بياخد **معاملين**: - **a = 7**: عدد **النجاحات** (الأهداف المسجلة) - **b = 3**: عدد **الفشل** (البلنتيات الضايعة) ![توزيع بيتا يوضح احتمالية دقة اللاعب](/static/img/binomial-beta-3.png) ### الفرق الكبير: مستمر مش منفصل! **في التوزيع البينومي**: - المحور الأفقي = **أرقام صحيحة بس**: 0، 1، 2، ..., 10 - **منفصل** (Discrete) - دالة **كتلة** احتمالية (Probability Mass Function) **في توزيع بيتا**: - المحور الأفقي = **أي رقم** بين 0 و 1 - مثلاً: 0.65، 0.7، 0.723، 0.8 - **مستمر** (Continuous) - دالة **كثافة** احتمالية (Probability Density Function) **ليه؟** لأن **الاحتمال** (نسبة الدقة) **ممكن يكون أي رقم** بين 0% و 100%! ## الخلاصة: امتى نستخدم مين؟ **التوزيعان دول زي وجهين لعملة واحدة!** ### استخدم التوزيع البينومي (Binomial) لما: **المعطيات**: - ✅ عارف **نسبة النجاح** (p) - ✅ عارف **عدد المحاولات** (k) **السؤال**: - ❓ **كام مرة هينجح** من الـ k محاولة؟ **أمثلة من الحياة**: - لاعب كورة دقته 70% - **هيسجل كام هدف** من 10 بلنتيات؟ - موقع conversion rate بتاعه 5% - **كام عميل هيشتري** من 100 زائر؟ - دواء فعاليته 80% - **كام مريض هيتعافى** من 50 مريض؟ ### استخدم توزيع بيتا (Beta) لما: **المعطيات**: - ✅ عارف **عدد النجاحات** (a) - ✅ عارف **عدد الفشل** (b) **السؤال**: - ❓ **إيه نسبة النجاح الحقيقية؟** **أمثلة من الحياة**: - لاعب سجّل 7 من 10 بلنتيات - **إيه دقته الحقيقية؟** - 5 عملاء اشتروا من 100 زائر - **إيه الـ conversion rate الحقيقي؟** - 40 مريض اتعافوا من 50 - **إيه فعالية الدواء الحقيقية؟** ### العلاقة بينهم: تكاملية! **في الإحصاء البايزي** (Bayesian Inference): - توزيع بيتا بيستخدم كـ **prior** (توقع مبدئي) - التوزيع البينومي بيستخدم كـ **likelihood** (احتمالية البيانات) - النتيجة = **posterior** (توقع محدّث) **يعني**: الاتنين **بيشتغلوا مع بعض** - هنشرح ده بالتفصيل في مقال مستقبلي! ## الدرس المستفاد **الإحصاء مش أرقام معقدة** - ده **لغة للتعبير عن عدم اليقين**! **لما البيانات قليلة**: - ❌ **لا تقفز للاستنتاجات** - "واضح" مش دايماً صح - ✅ **استخدم توزيعات احتمالية** - عبّر عن عدم اليقين - ✅ **اختار التوزيع المناسب** - بينومي ولا بيتا؟ **الخلاصة**: الإحصاء **أداة لاتخاذ قرارات ذكية** في ظل بيانات محدودة! --- طارق عمرو، 2 فبراير 2023