تمكّنك الإحصائيات
الاستدلالية من التوصل إلى استنتاجات وإجراء تنبؤات بناءً على بياناتك، بينما تلخص
الإحصائيات الوصفية خصائص مجموعة البيانات. عندما يتم جمع البيانات من عينة، يمكن
استخدام الإحصائيات الاستنتاجية لفهم المجتمع الأوسع الذي تم سحب العينة منه.
هناك غرضان لاستخدام
الإحصائيات الاستدلالية:
• عمل تقديرات حول السكان
(على سبيل المثال، متوسط درجة SAT لجميع طلبة الصف الحادي عشر في الولايات
المتحدة).
• اختبار الفرضيات من أجل
إجراء استنتاجات أو تعميمات حول السكان (مثل الارتباط بين درجات اختبار SAT ودخل الأسرة).
الإحصاء الوصفي مقابل الإحصاء الاستدلالي
في حين تسمح لك الإحصائيات
الاستدلالية باستخلاص استنتاجات من مجموعة البيانات، فإن الإحصائيات الوصفية تسمح
لك بوصف مجموعة بيانات.
الإحصاء
الوصفي
يمكنك سرد الخصائص التالية
لبياناتك باستخدام الإحصائيات الوصفية:
• التوزيع يتعلق بعدد مرات
تكرار كل قيمة.
• يرتبط الاتجاه المركزي
بمتوسطات القيم.
• يشير التباين إلى كيفية
انتشار القيم.
في الإحصاء الوصفي، لا يوجد
عدم يقين - لأن الإحصائيات تمثل بدقة البيانات التي جمعتها. يمكنك مقارنة هذه
الإحصائيات الوصفية مباشرة مع تلك الخاصة بالمجموعات السكانية الأخرى، إذا قمت
بجمع البيانات من مجموعة سكانية بأكملها.
مثال
على الإحصاء الوصفي
على مدار ثلاث سنوات، تم
جمع بيانات حول درجات اختبار SAT لجميع طلبة الصف الحادي عشر في المدرسة. يمكنك
استخدام الإحصاء الوصفي، لإلقاء نظرة عامة سريعة على أداء المدرسة خلال تلك
السنوات. يمكنك بعد ذلك مقارنة متوسط درجات اختبار SAT مباشرة بمتوسط درجات المدارس الأخرى.
الإحصاء
الاستدلالي
في معظم الأحيان، يكون من
الصعب جدًا أو المكلف جمع البيانات من جميع السكان الذين تهتم بهم، وبالتالي يمكنك
فقط الحصول على البيانات من العينات. تستخدم الإحصائيات الاستدلالية عينتك لعمل
افتراضات مستنيرة حول عدد أكبر من السكان، بينما يمكن للإحصاءات الوصفية أن تلخص
ببساطة خصائص العينة.
عند استخدام الإحصائيات
الاستدلالية، فمن الضروري استخدام طرق أخذ العينات العشوائية وغير المتحيزة. لا
يمكنك التعميم أو استخلاص استنتاجات إحصائية موثوقة، إذا كانت عينتك لا تمثل مجتمع
البحث.
مثال
على الإحصاء الاستدلالي
تختار عينة من طلاب الصف
الحادي عشر عشوائيًا من منطقتك، وتجمع بيانات عن درجاتهم في اختبار SAT بالإضافة إلى الخصائص الأخرى. استنادًا إلى
بيانات العينة الخاصة بك، يمكنك استخدام الإحصائيات الاستدلالية لعمل تقديرات
واختبار الفرضيات حول إجمالي عدد طلبة الصف الحادي عشر في المنطقة.
خطأ
أخذ العينات في الإحصاء الاستدلالي
نظرًا لأن حجم العينة عادةً
ما تكون أصغر من حجم مجتمع البحث، فإن بعض جوانب المجتمع لا يتم تمثيلها في بيانات
العينة. الفرق بين قيم السكان الحقيقية (يشار إليها باسم المعلمات) وقيم العينة المقاسة
(يشار إليها بالإحصاءات) هو ما يعرف باسم خطأ أخذ العينات.
حتى عند استخدام عينة
عشوائية غير متحيزة، لا يزال من الممكن حدوث خطأ في أخذ العينات في أي وقت. لهذا
السبب، فإن الإحصائيات الاستدلالية ليست مؤكدة تمامًا. ومع ذلك، يتم تقليل عدم
اليقين هذا باستخدام طرق أخذ العينات الاحتمالية.
استخدام إحصائيات العينة لتقدير خصائص السكان
تُستخدم الأرقام المعروفة
باسم الإحصائيات والمعلمات لوصف خصائص العينات والسكان. الإحصاء هو مقياس يستخدم
لوصف العينة، على سبيل المثال متوسط العينة، في حين أن المعلمة هي مقياس يصف المجتمع
بأكمله، على سبيل المثال متوسط السكان.
يُعرف التناقض بين المعلمة
والإحصاء المرتبط بها باسم خطأ أخذ العينات. نظرًا لأن معلمة السكان الحقيقية غير
معروفة في معظم الحالات، فيمكنك استخدام الإحصائيات الاستدلالية، لتقدير هذه
المعلمات أثناء حساب خطأ أخذ العينات.
تقديرات النقاط وتقديرات
الفاصل الزمني هما الفئتان الرئيسيتان لتقديرات السكان التي يمكنك استخدامها.
تقدير النقطة: هو تقدير
قيمة واحدة للمعلمة. على سبيل المثال، متوسط العينة هو تقدير نقطي لمتوسط المجتمع.
تقدير الفاصل الزمني: يتم
من خلاله توفير نطاق القيم المتوقع للمعلمة. إن فاصل الثقة هو النوع الأكثر شيوعًا
لتقدير الفاصل.
من أجل فهم دقيق للمكان
الذي من المحتمل أن تكمن فيه المعلمة، فمن الضروري النظر في كلا النوعين من
التقديرات.
فاصل الثقة
ينشئ فاصل الثقة تقديرًا
للفاصل الزمني لمعلمة باستخدام التباين المحيط بالإحصاء. نظرًا لحقيقة أنها تمثل
خطأ أخذ العينات، فإن فترات الثقة مفيدة لتقدير المعلمات. يصف فاصل الثقة درجة عدم
اليقين المرتبطة بتقدير النقطة، والذي يوفر قيمة دقيقة للمعلمة التي تهتم بها. من
الأفضل استخدامها مع بعضها البعض.
يرتبط مستوى الثقة بكل فترة ثقة. إذا كررت
الدراسة مرة أخرى، سيخبرك مستوى الثقة باحتمالية احتواء الفاصل الزمني (بالنسبة
المئوية) على تقدير المعلمة. مع فاصل ثقة 95٪، يمكنك أن تتوقع أن يندرج تقديرك
داخل النطاق المحدد للقيم 95 من 100 مرة؛ إذا كررت دراستك بعينة جديدة بنفس
الطريقة بالضبط.
لا يمكنك ضمان أن معلمة
السكان الفعلية ستقع ضمن الفترة الزمنية، على الرغم من أنه يمكنك القول بأن تقديرك
سيفعل ذلك في نسبة معينة من الوقت. هذا حتى تتمكن من تحديد القيمة الفعلية لمعلمة
السكان، دون الحصول على البيانات من السكان بالكامل.
ومع ذلك، يمكنك التوقع بشكل
منطقي احتواء فاصل الثقة الخاص بك على المعلمة نسبة معينة من الوقت، بالنظر إلى
أخذ العينات العشوائية وحجم العينة المناسب.
مثال
على تقدير النقطة وفاصل الثقة
أنت مهتم بمعرفة متوسط عدد
أيام الإجازة المدفوعة، التي يحصل عليها الموظفون في شركة عالمية. يتم حساب تقدير
النقطة وفاصل الثقة، بمجرد تجميع عينة عشوائية من استجابات الاستطلاع. يمثل متوسط
العينة البالغ 19 يومًا إجازة مدفوعة الأجر، بمثابة تقدير نقطي لعدد السكان يعني
أيام الإجازة مدفوعة الأجر. يتراوح متوسط عدد أيام الإجازة بين 16 و 22، وفقًا
لعينة عشوائية بفاصل ثقة 95٪ [16 22].
اختبار الفرضيات
إن اختبار الفرضيات هو
طريقة رسمية للتحليل الإحصائي باستخدام الإحصائيات الاستدلالية. إن الغرض من
اختبار الفرضيات هو تقييم الارتباطات بين المتغيرات أو مقارنة المجموعات السكانية
باستخدام العينات. يتم فحص الفرضيات أو التنبؤات باستخدام الاختبارات الإحصائية.
يمكن استخلاص استنتاجات صحيحة باستخدام الاختبارات الإحصائية، التي تقيم أيضًا
أخطاء أخذ العينات.
يمكن أن تكون الاختبارات
الإحصائية معلمية أو غير معلمية. تعتبر الاختبارات البارامترية أكثر قوة من
الناحية الإحصائية، حيث من المرجح أن تكتشف التأثير في حالة وجوده. يتم وضع
الافتراضات التالية عن طريق الاختبارات البارامترية:
• يحتوي مجتمع العينة على
درجات يتم توزيعها بشكل طبيعي.
• حجم العينة كافٍ ليعكس
السكان بشكل مناسب.
• توجد فروق مماثلة، وهي
مقياس للتباين، في كل مجموعة قيد المقارنة.
تعتبر الاختبارات غير
المعلمية أكثر ملاءمة؛ عندما لا تنطبق على بياناتك أيًا من هذه الافتراضات. يشير
مصطلح "الاختبارات الخالية من التوزيع" إلى الاختبارات غير المعلمية،
التي لا تضع أي افتراضات فيما يتعلق بتوزيع بيانات السكان.
هناك ثلاثة أنواع من
الاختبارات الإحصائية: اختبارات المقارنة - اختبارات الارتباط - واختبارات
الانحدار.
اختبارات
المقارنة
تحدد اختبارات المقارنة ما
إذا كانت هناك اختلافات في الوسائل أو المتوسطات أو ترتيب الدرجات لمجموعتين أو
أكثر. عند اختيار الاختبار الذي يخدم أهدافك على أفضل وجه، ضع في اعتبارك عدد
العينات، ومستويات قياس المتغيرات الخاصة بك، وما إذا كانت بياناتك تفي بمتطلبات
الاختبارات البارامترية.
في حين أن المتوسطات والرتب
هي مقاييس أكثر ملاءمة للبيانات الترتيبية، لا يمكن العثور على الوسائل إلا
لبيانات الفاصل الزمني أو النسبة.
اختبارات
الارتباط
تقيّم اختبارات الارتباط
مدى ارتباط متغيرين. يعد معامل سبيرمان Spearman's r مناسبًا لمتغيرات الفاصل الزمني والنسب عندما لا تتبع البيانات
التوزيع الطبيعي، حتى لو كان معامل بيرسون Pearson r هو الاختبار الأكثر فعالية من الناحية الإحصائية. يمكن تطبيق
اختبار استقلالية كاي فقط على المتغيرات الاسمية.
اختبارات
الانحدار
تظهر اختبارات الانحدار ما
إذا كانت التعديلات على متغيرات التوقع تؤدي إلى تغييرات في متغير النتيجة. بناءً
على عدد وأنواع المتغيرات التي تعمل في التنبؤ والنتائج، يمكنك اختيار اختبار الانحدار
الذي يجب استخدامه.
غالبية اختبارات الانحدار المستخدمة بشكل متكرر هي اختبارات حدودية. يمكنك إجراء عمليات تحويلات البيانات، إذا لم يتم توزيع بياناتك بشكل طبيعي. تمكّنك علمية تحويلات البيانات من توزيع بياناتك بشكل طبيعي، من خلال استخدام الإجراءات الحسابية، مثل حساب الجذر التربيعي لكل قيمة.