ما هو التحليل الإحصائي ؟ أنواع وماحل تحليل البيانات الاحصائية

ما هو التحليل الإحصائي ؟
ما هو التحليل الإحصائي ؟

يعني التحليل الإحصائي التحقيق في الاتجاهات والأنماط والعلاقات باستخدام البيانات الكمية. إنها أداة بحث مهمة يستخدمها العلماء والحكومات والشركات والمنظمات الأخرى.

لاستخلاص استنتاجات صحيحة ، يتطلب التحليل الإحصائي تخطيطًا دقيقًا منذ بداية عملية البحث. تحتاج إلى تحديد فرضياتك واتخاذ قرارات بشأن تصميم البحث وحجم العينة وإجراءات أخذ العينات.

بعد جمع البيانات من عينتك ، يمكنك تنظيم البيانات وتلخيصها باستخدام الإحصائيات الوصفية. بعد ذلك ، يمكنك استخدام الإحصائيات الاستدلالية لاختبار الفرضيات رسميًا وإجراء تقديرات حول السكان. أخيرًا ، يمكنك تفسير نتائجك وتعميمها.

هذه المقالة مقدمة عملية للتحليل الإحصائي للطلاب والباحثين. سنرشدك خلال الخطوات باستخدام مثالين بحثيين. يبحث الأول في علاقة السبب والنتيجة المحتملة ، بينما يبحث الثاني في العلاقة المحتملة بين المتغيرات.

ما هو التحليل الإحصائي؟

التحليل الإحصائي علم جمع كميات كبيرة من البيانات واستكشافها وتقديمها لاكتشاف الأنماط والاتجاهات الأساسية. يتم تطبيق الإحصائيات كل يوم – في البحث والصناعة والحكومة – لتصبح أكثر علمية حول القرارات التي يجب اتخاذها. على سبيل المثال:

  • يستخدم المصنعون الإحصائيات لنسج الجودة في الأقمشة الجميلة ، لرفع مستوى صناعة الطيران ومساعدة عازفي الجيتار في صنع موسيقى جميلة.
  • يحافظ الباحثون على صحة الأطفال باستخدام الإحصائيات لتحليل البيانات من إنتاج اللقاحات الفيروسية ، مما يضمن الاتساق والسلامة.
  • تستخدم شركات الاتصالات الإحصائيات لتحسين موارد الشبكة وتحسين الخدمة وتقليل زخم العملاء من خلال اكتساب نظرة ثاقبة على متطلبات المشتركين.
  • تعتمد الوكالات الحكومية في جميع أنحاء العالم على الإحصاءات من أجل فهم واضح لبلدانهم وأعمالهم وشعوبهم.

انظر حولك. من أنبوب معجون الأسنان في حمامك إلى الطائرات التي تحلق في السماء ، ترى مئات المنتجات والعمليات كل يوم التي تم تحسينها من خلال استخدام الإحصائيات.

أنواع التحليل الإحصائي

هناك نوعان رئيسيان من التحليل الإحصائي: الوصفي والاستدلال ، المعروف أيضًا باسم النمذجة.

الإحصاء الوصفي

يمكننا تعريف الإحصاءات الوصفية بما تستخدمه المؤسسات لتلخيص بياناتها.

تهدف الإحصائيات الوصفية وإلى صف كتلة كبيرة من البيانات مع مخططات وجداول موجزة ، لكن لا تحاول استخلاص استنتاجات حول السكان الذين تم أخذ العينة منهم. أنت ببساطة تلخص البيانات التي لديك بمخططات ورسوم بيانية جميلة – نوعًا ما مثل إخبار شخص ما بالنقاط الرئيسية في كتاب (ملخص تنفيذي) بدلاً من مجرد تسليمه كتابًا سميكًا (بيانات خام).

نظرًا لأن المخططات والرسوم البيانية والجداول هي مكونات أساسية ، فإن الإحصائيات الوصفية تجعل من السهل فهم البيانات الأولية وتصورها. تشير إحصائيات ليرد ، التي تساعد الطلاب في عملهم الإحصائي ، إلى أن الإحصاء الوصفي هو مجرد وسيلة لوصف البيانات ولا يتم استخدامه للتوصل إلى استنتاجات تتجاوز البيانات التي تم تحليلها أو الوصول إلى استنتاجات بشأن أي فرضيات تم إجراؤها.

أيضاً، تمكننا الإحصائيات الوصفية من تقديم البيانات بطريقة أكثر جدوى ، مما يسمح بتفسير أبسط للبيانات.

من بين بعض البيانات المفيدة التي تأتي من الإحصائيات الوصفية تشمل الوضع والوسيط والمتوسط ​​، بالإضافة إلى النطاق والتباين والانحراف المعياري.

واصل القراءة حول الإحصاء الوصفي.

الإحصاء الإستدلالي

النوع الثاني من التحليل الإحصائي هو الاستدلال. الإحصائيات الاستدلالية هي طريقة لدراسة البيانات بشكل أكبر.

تسمح إحصائيات الاستدلالية للمؤسسات باختبار فرضية واستخلاص استنتاجات حول البيانات. في هذه الحالات ، عادةً ما يتم فحص عينة من البيانات بأكملها ، مع تطبيق النتائج على المجموعة ككل.

واصل القراءة حول الإحصاء الإستدلالي.

عملية التحليل الإحصائي

استنتاجات الاستدلال الإحصائي هي اقتراح إحصائي. بعض الأشكال الشائعة للافتراض الإحصائي يشيرون إلى أنها تشمل:

  • التقديرات: تسمى القيمة المحددة التي تقترب بشكل أفضل من معلمات الفائدة بالتقدير.
  • فاصل الثقة: الفاصل الزمني الذي تم إنشاؤه باستخدام مجموعة بيانات مأخوذة من المجتمع بحيث تحتوي هذه الفواصل الزمنية ، في ظل أخذ العينات المتكرر لمجموعات البيانات هذه ، على قيمة المعلمة الحقيقية مع الاحتمال عند مستوى الثقة المحدد باعتباره فاصل الثقة. بمعنى آخر ، فاصل الثقة هو مقياس لمدى جودة توقع النموذج للبيانات التي تم تسجيلها بالفعل.
  • الفواصل الزمنية الموثوقة: مجموعة من القيم التي تحتوي ، على سبيل المثال ، على 95٪ من الاعتقاد اللاحق يشار إليها على أنها فترة ذات مصداقية. إنها طريقة لتوحيد فترات الثقة. عندما تقرأ عن دراسة بثقة 95٪ ، فإنهم يشيرون إلى فترة زمنية موثوقة.


في النهاية ، تُستخدم الإحصائيات الوصفية لوصف البيانات ، بينما تُستخدم الإحصائيات الاستدلالية لاستنتاج الاستنتاجات والفرضيات حول نفس المعلومات.

مراحل التحليل الإحصائي

المرحلة 1: اكتب فرضياتك وخطط لتصميم بحثك

لجمع بيانات صحيحة للتحليل الإحصائي ، تحتاج أولاً إلى تحديد فرضياتك وتخطيط تصميم البحث الخاص بك.

كتابة الفرضيات الإحصائية

غالبًا ما يكون الهدف من البحث هو التحقيق في العلاقة بين المتغيرات داخل السكان. تبدأ بالتنبؤ ، وتستخدم التحليل الإحصائي لاختبار هذا التوقع.

الفرضية الإحصائية هي طريقة رسمية لكتابة تنبؤ حول مجموعة سكانية. يتم إعادة صياغة كل توقع بحثي إلى فرضيات لاغية وبديلة يمكن اختبارها باستخدام بيانات العينة.

بينما تتنبأ الفرضية الصفرية دائمًا بعدم وجود تأثير أو عدم وجود علاقة بين المتغيرات ، فإن الفرضية البديلة تنص على تنبؤ بحثك عن تأثير أو علاقة.

مثال: فرضيات إحصائية لاختبار تأثير
فرضية لاغية: لن يكون لممارسة التأمل لمدة 5 دقائق أي تأثير على درجات اختبار الرياضيات لدى المراهقين.
الفرضية البديلة: سيؤدي تمرين التأمل لمدة 5 دقائق إلى تحسين درجات اختبار الرياضيات لدى المراهقين.

مثال: فرضيات إحصائية لاختبار الارتباط
فرضية لاغية:
لا علاقة بين دخل الوالدين والمعدل التراكمي في طلاب الجامعات.
الفرضية البديلة: دخل الوالدين والمعدل التراكمي مرتبطان إيجابياً في طلاب الجامعات.

التخطيط لتصميم البحث الخاص بك

تصميم البحث هو استراتيجيتك العامة لجمع البيانات وتحليلها. يحدد الاختبارات الإحصائية التي يمكنك استخدامها لاختبار فرضيتك لاحقًا.

أولاً ، قرر ما إذا كان البحث الخاص بك سيستخدم تصميمًا وصفيًا أو ارتباطًا أو تجريبيًا. التجارب تؤثر بشكل مباشر على المتغيرات ، في حين أن الدراسات الوصفية والارتباطية تقيس المتغيرات فقط.

  • في التصميم التجريبي ، يمكنك تقييم علاقة السبب والنتيجة (على سبيل المثال ، تأثير التأمل على درجات الاختبار) باستخدام الاختبارات الإحصائية للمقارنة أو الانحدار.
  • أما في التصميم الترابطي ، يمكنك استكشاف العلاقات بين المتغيرات (على سبيل المثال ، دخل الوالدين والمعدل التراكمي) دون أي افتراض للسببية باستخدام معاملات الارتباط واختبارات الأهمية.
  • في التصميم الوصفي ، يمكنك دراسة خصائص السكان أو الظاهرة (على سبيل المثال ، انتشار القلق لدى طلاب الجامعات ) باستخدام الاختبارات الإحصائية لاستخلاص الاستنتاجات من عينة البيانات.


يهتم تصميم البحث أيضًا بما إذا كنت ستقارن المشاركين على مستوى المجموعة أو المستوى الفردي ، أو كلاهما.

  • في التصميم بين المواضيع ، تقارن النتائج على مستوى المجموعة للمشاركين الذين تعرضوا لعلاجات مختلفة (على سبيل المثال ، أولئك الذين أجروا تمرينًا للتأمل مقابل أولئك الذين لم يفعلوا ذلك).
  • في التصميم الداخلي للموضوعات ، تقارن المقاييس المتكررة من المشاركين الذين شاركوا في جميع علاجات الدراسة (على سبيل المثال ، الدرجات من قبل وبعد أداء تمرين التأمل).

تجريبي


مثال: تصميم البحث التجريبي
أنت تصمم تجربة داخل الموضوعات لدراسة ما إذا كان تمرين التأمل لمدة 5 دقائق يمكن أن يحسن نتائج اختبار الرياضيات. تأخذ دراستك إجراءات متكررة من مجموعة واحدة من المشاركين.
أولاً ، ستحصل على نتائج الاختبار الأساسي من المشاركين. بعد ذلك ، سيخضع المشاركون لتمرين تأمل مدته 5 دقائق. أخيرًا ، ستسجل نتائج المشاركين من اختبار الرياضيات الثاني.

في هذه التجربة ، المتغير المستقل هو تمرين التأمل لمدة 5 دقائق ، والمتغير التابع هو التغيير في درجات اختبار الرياضيات من قبل التدخل وبعده.

الارتباط


مثال: تصميم البحث الترابطي
في دراسة ارتباطية ، تختبر ما إذا كانت هناك علاقة بين دخل الوالدين والمعدل التراكمي في طلاب الجامعات المتخرجين. لجمع بياناتك ، ستطلب من المشاركين ملء استبيان وتقديم تقرير ذاتي عن دخل آبائهم ومعدلهم التراكمي.

لا توجد متغيرات تابعة أو مستقلة في هذه الدراسة ، لأنك تريد فقط قياس المتغيرات دون التأثير عليها بأي شكل من الأشكال.

قياس المتغيرات

عند التخطيط لتصميم بحث ، يجب عليك تفعيل متغيراتك وتحديد كيفية قياسها بالضبط.

بالنسبة للتحليل الإحصائي ، من المهم مراعاة مستوى قياس المتغيرات الخاصة بك ، والتي تخبرك بنوع البيانات التي تحتوي عليها:

  • البيانات الفئوية تمثل التجمعات. قد تكون هذه اسمية (على سبيل المثال ، الجنس) أو ترتيبية (على سبيل المثال ، مستوى القدرة اللغوية).
  • البيانات الكمية تمثل المبالغ. قد تكون هذه على مقياس فاصل (مثل درجة الاختبار) أو مقياس نسبة (مثل العمر).


يمكن قياس العديد من المتغيرات بمستويات مختلفة من الدقة. على سبيل المثال ، يمكن أن تكون بيانات العمر كمية (8 سنوات) أو فئوية (صغيرة). إذا تم ترميز المتغير رقميًا (على سبيل المثال ، مستوى الاتفاق من 1-5) ، فهذا لا يعني تلقائيًا أنه كمي وليس فئويًا.

تحديد مستوى القياس مهم لاختيار الإحصائيات المناسبة واختبارات الفرضيات. على سبيل المثال ، يمكنك حساب متوسط ​​الدرجة باستخدام البيانات الكمية ، ولكن ليس باستخدام البيانات الفئوية.

في دراسة بحثية ، جنبًا إلى جنب مع مقاييس المتغيرات التي تهمك ، ستجمع غالبًا بيانات حول خصائص المشاركين ذات الصلة.

تجريبي

مثال: المتغيرات (تجربة)
يمكنك إجراء العديد من العمليات الحسابية باستخدام بيانات العمر الكمي أو بيانات درجات الاختبار ، بينما يمكن استخدام المتغيرات الفئوية لتحديد المجموعات لاختبارات المقارنة.

المتغيرنوع البيانات
السنالكمية (النسبة)
الجنسفئوية (اسمية)
العرقفئوية (اسمية)
درجات اختبار خط الأساسالكمي (الفاصل)
درجات الاختبار النهائيالكمي (الفاصل)

الارتباط

مثال: المتغيرات (دراسة ارتباطية)
تحدد أنواع المتغيرات في الدراسة الارتباطية الاختبار الذي ستستخدمه لمعامل الارتباط. يمكن استخدام اختبار الارتباط البارامترى للبيانات الكمية ، بينما يجب استخدام اختبار الارتباط غير البارامترى إذا كان أحد المتغيرات ترتيبيًا.

المتغيرنوع البيانات
دخل الوالدينالكمية (النسبة)
المعدل التراكمي GPA الكمي (الفاصل)

الخطوة 2: جمع البيانات من عينة

التحليل الإحصائي - جمع البيانات

في معظم الحالات ، يكون جمع البيانات من كل فرد من السكان الذين تهتم بدراستهم أمرًا صعبًا للغاية أو مكلفًا للغاية. بدلاً من ذلك ، ستجمع البيانات من عينة.

يسمح لك التحليل الإحصائي بتطبيق نتائجك خارج عينتك طالما أنك تستخدم إجراءات أخذ العينات المناسبة. يجب أن تستهدف عينة تمثل السكان.

أخذ العينات من أجل التحليل الإحصائي

هناك طريقتان رئيسيتان لاختيار عينة.

  • أخذ العينات الاحتمالية: يتمتع كل فرد من السكان بفرصة اختياره للدراسة من خلال الاختيار العشوائي.
  • أخذ العينات غير الاحتمالية: من المرجح أن يتم اختيار بعض الأفراد للدراسة أكثر من غيرهم بسبب معايير مثل الراحة أو الاختيار الذاتي الطوعي.

من الناحية النظرية ، للنتائج القابلة للتعميم بشكل كبير ، يجب عليك استخدام طريقة أخذ العينات الاحتمالية. يقلل الاختيار العشوائي من تحيز العينة ويضمن أن البيانات من عينتك هي في الواقع نموذجية للسكان. يمكن استخدام الاختبارات البارامترية لعمل استنتاجات إحصائية قوية عندما يتم جمع البيانات باستخدام أخذ العينات الاحتمالية.

ولكن من الناحية العملية ، نادرًا ما يكون من الممكن جمع العينة المثالية. بينما من المرجح أن تكون العينات غير الاحتمالية متحيزة ، إلا أنه من الأسهل تجنيد وجمع البيانات منها. تعتبر الاختبارات غير المعيارية أكثر ملاءمة للعينات غير الاحتمالية ، ولكنها تؤدي إلى استنتاجات أضعف حول السكان.

إذا كنت تريد استخدام الاختبارات البارامترية للعينات غير الاحتمالية ، فعليك إثبات الحالة التالية:

  • تمثل عينتك السكان الذين تعمم نتائجك عليهم.
  • عينتك تفتقر إلى التحيز المنهجي.

ضع في اعتبارك أن الصلاحية الخارجية تعني أنه يمكنك فقط تعميم استنتاجاتك على الآخرين الذين يشاركونك خصائص عينتك. على سبيل المثال ، النتائج من العينات الغربية والمتعلمة والصناعية والثرية والديموقراطية (على سبيل المثال ، طلاب الجامعات ) لا تنطبق تلقائيًا على جميع السكان.

إذا قمت بتطبيق الاختبارات البارامترية على البيانات المأخوذة من العينات غير الاحتمالية ، فتأكد من توضيح حدود مدى تعميم نتائجك في قسم المناقشة.

إنشاء إجراء أخذ العينات المناسب

بناءً على الموارد المتاحة لبحثك ، حدد كيفية تجنيد المشاركين.

  • هل سيكون لديك موارد للإعلان عن دراستك على نطاق واسع ، بما في ذلك خارج محيط جامعتك؟
  • وهل ستكون لديك الوسائل لتجنيد عينة متنوعة تمثل عددًا كبيرًا من السكان؟
  • هل لديك الوقت للاتصال والمتابعة مع أعضاء المجموعات التي يصعب الوصول إليها؟

تجريبي

مثال: أخذ العينات (تجربة)
السكان الذين تهتم بهم هم طلاب المدارس الثانوية في مدينتك. يمكنك الاتصال بثلاث مدارس خاصة وسبع مدارس عامة في مناطق مختلفة من المدينة لمعرفة ما إذا كان بإمكانك إدارة تجربتك للطلاب في الصف الحادي عشر.

يتم اختيار المشاركين بأنفسهم من قبل مدارسهم. على الرغم من أنك تستخدم عينة غير احتمالية ، إلا أنك تهدف إلى عينة متنوعة وتمثيلية.

إرتباطي

مثال: أخذ العينات (دراسة ارتباطية)
السكان الذين تهتم بهم هم طلاب الجامعات الذكور في القرويين. باستخدام إعلانات وسائل التواصل الاجتماعي ، يمكنك تجنيد طلاب جامعيين ذكور في السنة الأولى من فئة سكانية فرعية أصغر: سبع جامعات في منطقة بوسطن.

يتطوع المشاركون في الاستطلاع ، مما يجعل هذه العينة غير احتمالية.

احسب حجم العينة الكافي

قبل تجنيد المشاركين ، حدد حجم عينتك إما من خلال النظر في دراسات أخرى في مجالك أو باستخدام الإحصائيات. قد لا تكون العينة الصغيرة جدًا ممثلة للعينة ، في حين أن العينة الكبيرة جدًا ستكون أكثر تكلفة من اللازم.

هناك العديد من حاسبات حجم العينة على الإنترنت. يتم استخدام صيغ مختلفة اعتمادًا على ما إذا كان لديك مجموعات فرعية أو مدى صرامة دراستك (على سبيل المثال ، في البحث السريري). كقاعدة عامة ، من الضروري وجود 30 وحدة على الأقل أو أكثر لكل مجموعة فرعية.

لاستخدام هذه الآلات الحاسبة ، يجب أن تفهم وتدخل المكونات الأساسية التالية:

  • مستوى الأهمية (ألفا): خطر رفض فرضية صفرية حقيقية تكون على استعداد لاتخاذها ، وعادة ما يتم تحديدها بنسبة 5٪.
  • القوة الإحصائية: احتمالية اكتشاف دراستك لتأثير بحجم معين إذا كان هناك تأثير ، عادةً 80٪ أو أعلى.
  • حجم التأثير المتوقع: مؤشر قياسي لمدى حجم النتيجة المتوقعة لدراستك ، وعادةً ما يعتمد على دراسات أخرى مماثلة.
  • الانحراف المعياري للسكان: تقدير لمعلمة السكان بناءً على دراسة سابقة أو دراسة تجريبية خاصة بك.

الخطوة 3: لخص بياناتك بالإحصاءات الوصفية

بمجرد جمع كل البيانات الخاصة بك ، يمكنك فحصها وحساب الإحصائيات الوصفية التي تلخصها.

افحص بياناتك

هناك طرق مختلفة لفحص بياناتك ، بما في ذلك ما يلي:

  • تنظيم البيانات من كل متغير في جداول التوزيع التكراري.
  • عرض البيانات من متغير رئيسي في مخطط شريطي لعرض توزيع الاستجابات.
  • تصور العلاقة بين متغيرين باستخدام مخطط مبعثر.

من خلال تصور بياناتك في جداول ورسوم بيانية ، يمكنك تقييم ما إذا كانت بياناتك تتبع توزيعًا منحرفًا أو عاديًا وما إذا كانت هناك أي قيم متطرفة أو بيانات مفقودة.

يعني التوزيع الطبيعي أن بياناتك موزعة بشكل متماثل حول مركز تكمن فيه معظم القيم ، مع تناقص القيم عند نهايات الذيل.

في المقابل ، يكون التوزيع المنحرف غير متماثل وله قيم في أحد الطرفين أكثر من الآخر. من المهم أن نأخذ في الاعتبار شكل التوزيع لأنه يجب استخدام بعض الإحصائيات الوصفية فقط مع توزيعات منحرفة.

يمكن أن تنتج القيم المتطرفة أيضًا إحصاءات مضللة ، لذلك قد تحتاج إلى نهج منظم للتعامل مع هذه القيم.

احسب مقاييس الاتجاه المركزي

تصف مقاييس الاتجاه المركزي مكان تكمن معظم القيم في مجموعة البيانات. غالبًا ما يتم الإبلاغ عن ثلاثة مقاييس رئيسية للاتجاه المركزي:

  • الوضع: الاستجابة أو القيمة الأكثر شيوعًا في مجموعة البيانات.
  • الوسيط: القيمة الموجودة في الوسط الدقيق لمجموعة البيانات عند الطلب من الأقل إلى الأعلى.
  • يعني: مجموع كل القيم مقسومًا على عدد القيم.

ومع ذلك ، اعتمادًا على شكل التوزيع ومستوى القياس ، قد يكون واحدًا أو اثنين فقط من هذه المقاييس مناسبًا. على سبيل المثال ، لا يمكن وصف العديد من الخصائص الديموغرافية إلا باستخدام الوضع أو النسب ، في حين أن متغيرًا مثل وقت رد الفعل قد لا يكون له وضع على الإطلاق.

احسب مقاييس التباين
تخبرك مقاييس التباين بمدى انتشار القيم في مجموعة البيانات. غالبًا ما يتم الإبلاغ عن أربعة مقاييس رئيسية للتباين:

  • النطاق: أعلى قيمة مطروحًا منها أقل قيمة لمجموعة البيانات.
  • النطاق الربيعي: نطاق النصف الأوسط من مجموعة البيانات.
  • الانحراف المعياري: متوسط المسافة بين كل قيمة في مجموعة البيانات والمتوسط.
  • الفرق: مربع الانحراف المعياري.

مرة أخرى ، يجب أن يوجه شكل التوزيع ومستوى القياس اختيارك لإحصائيات التباين. النطاق الربيعي هو أفضل مقياس للتوزيعات المنحرفة ، بينما يوفر الانحراف والتباين المعياريان أفضل المعلومات للتوزيعات العادية.

التجريبي

مثال: الإحصاء الوصفي (تجربة)
بعد جمع بيانات الاختبار القبلي والبعدي من 30 طالبًا عبر المدينة ، يمكنك حساب الإحصائيات الوصفية. نظرًا لوجود بيانات موزعة عادية على مقياس فاصل زمني ، يمكنك جدولة المتوسط والانحراف المعياري والتباين والنطاق.

باستخدام الجدول الخاص بك ، يجب عليك التحقق مما إذا كانت وحدات الإحصاء الوصفي قابلة للمقارنة لنتائج الاختبار القبلي والبعدي. على سبيل المثال ، هل مستويات التباين متشابهة عبر المجموعات؟ هل هناك قيم متطرفة؟ إذا كان هناك ، فقد تحتاج إلى تحديد وإزالة القيم المتطرفة في مجموعة البيانات الخاصة بك أو تحويل بياناتك قبل إجراء اختبار إحصائي.


نتائج الاختباردرجات الاختبار اللاحق
الوسط68.4475.25
الإنحراف المعياري9.439.88
الفرق88.9697.96
النطاق36.2545.12
N30

من هذا الجدول ، يمكننا أن نرى أن متوسط الدرجات زاد بعد تمرين التأمل ، وأن الفروق بين الدرجتين قابلة للمقارنة. بعد ذلك ، يمكننا إجراء اختبار إحصائي لمعرفة ما إذا كان هذا التحسن في درجات الاختبار ذا دلالة إحصائية لدى السكان.

الارتباطي

مثال: الإحصاء الوصفي (دراسة ارتباطية)


بعد جمع البيانات من 653 طالبًا ، يمكنك جدولة الإحصائيات الوصفية لدخل الوالدين السنوي والمعدل التراكمي.

من المهم التحقق مما إذا كان لديك نطاق واسع من نقاط البيانات. إذا لم تفعل ذلك ، فقد تنحرف بياناتك تجاه بعض المجموعات أكثر من غيرها (على سبيل المثال ، المتفوقون الأكاديميون) ، ويمكن فقط إجراء استنتاجات محدودة حول العلاقة.


دخل الوالدين (بالدولار الأمريكي)المعدل التراكمي
الوسط62,1003.12
الإنحراف المعياري150000.45
الفرق225,000,0000.16
النطاق8,000–378,0002.64–4.00
N653

بعد ذلك ، يمكننا حساب معامل الارتباط وإجراء اختبار إحصائي لفهم أهمية العلاقة بين المتغيرات في المجتمع.

المرحلة 4: اختبر الفرضيات أو قم بعمل تقديرات بإحصاءات استنتاجية

الرقم الذي يصف عينة يسمى الإحصاء ، بينما الرقم الذي يصف المجتمع يسمى المعلمة. باستخدام الإحصائيات الاستدلالية ، يمكنك التوصل إلى استنتاجات حول معلمات السكان بناءً على إحصائيات العينة.

غالبًا ما يستخدم الباحثون طريقتين رئيسيتين (في وقت واحد) لعمل استنتاجات في الإحصاء.

  • التقدير: حساب المعلمات السكانية بناءً على إحصائيات العينة.
  • اختبار الفرضيات: عملية رسمية لاختبار تنبؤات البحث حول السكان باستخدام العينات.

تقدير

يمكنك عمل نوعين من تقديرات المعلمات السكانية من عينة الإحصائيات:

  • تقدير نقطة: قيمة تمثل أفضل تخمين لديك للمعلمة الدقيقة.
  • تقدير الفاصل الزمني: نطاق من القيم التي تمثل أفضل تخمين لك عن مكان وجود المعلمة.

إذا كان هدفك هو استنتاج خصائص السكان والإبلاغ عنها من عينة البيانات ، فمن الأفضل استخدام كل من تقديرات النقطة والفاصل الزمني في ورقتك.

يمكنك اعتبار عينة إحصائية تقديرًا لنقطة لمعلمة السكان عندما يكون لديك عينة تمثيلية (على سبيل المثال ، في استطلاع رأي عام واسع ، يتم أخذ نسبة العينة التي تدعم الحكومة الحالية على أنها نسبة السكان من مؤيدي الحكومة).

هناك دائمًا خطأ في التقدير ، لذا يجب عليك أيضًا تقديم فاصل ثقة كتقدير للفاصل الزمني لإظهار التباين حول تقدير النقطة.

يستخدم فاصل الثقة الخطأ القياسي ودرجة z من التوزيع العادي القياسي للتعبير عن المكان الذي تتوقع عمومًا العثور فيه على معلمة السكان في معظم الأوقات.

اختبار الفرضيات

باستخدام بيانات من عينة ، يمكنك اختبار فرضيات حول العلاقات بين المتغيرات في المجتمع. يبدأ اختبار الفرضية بافتراض أن الفرضية الصفرية صحيحة في المجتمع ، ويمكنك استخدام الاختبارات الإحصائية لتقييم ما إذا كان يمكن رفض الفرضية الصفرية أم لا.

تحدد الاختبارات الإحصائية مكان تكمن بيانات العينة في التوزيع المتوقع لبيانات العينة إذا كانت الفرضية الصفرية صحيحة. تعطي هذه الاختبارات نتيجتين رئيسيتين:

  • تخبرك إحصائية الاختبار بمدى اختلاف بياناتك عن الفرضية الصفرية للاختبار.
  • تخبرك القيمة p باحتمالية الحصول على نتائجك إذا كانت الفرضية الصفرية صحيحة بالفعل في المجتمع.


تأتي الاختبارات الإحصائية في ثلاثة أنواع رئيسية:

  • اختبارات المقارنة تقيم الفروق الجماعية في النتائج.
  • تقيم اختبارات الانحدار علاقات السبب والنتيجة بين المتغيرات.
  • تقيم اختبارات الارتباط العلاقات بين المتغيرات دون افتراض وجود علاقة سببية.

يعتمد اختيارك للاختبار الإحصائي على أسئلة البحث وتصميم البحث وطريقة أخذ العينات وخصائص البيانات.

الاختبارات البارامترية

تقدم الاختبارات البارامترية استنتاجات قوية حول المجتمع بناءً على بيانات العينة. ولكن لاستخدامها ، يجب استيفاء بعض الافتراضات ، ويمكن استخدام بعض أنواع المتغيرات فقط. إذا كانت بياناتك تنتهك هذه الافتراضات ، فيمكنك إجراء تحويلات مناسبة للبيانات أو استخدام اختبارات غير معلمية بديلة بدلاً من ذلك.

نماذج الانحدار إلى أي مدى تؤدي التغييرات في متغير توقع إلى تغييرات في متغير (متغيرات) النتائج.

  • يتضمن الانحدار الخطي البسيط متغير توقع واحد ومتغير نتيجة واحد.
  • يتضمن الانحدار الخطي المتعدد متغيرين أو أكثر للتنبؤ ومتغير نتيجة واحد.

عادة ما تقارن اختبارات المقارنة بين وسائل المجموعات. قد تكون هذه الوسائل لمجموعات مختلفة داخل العينة (على سبيل المثال ، مجموعة العلاج والمراقبة) ، أو وسائل مجموعة عينة واحدة يتم أخذها في أوقات مختلفة (على سبيل المثال ، نتائج الاختبار القبلي والبعدي) ، أو متوسط ​​العينة والمتوسط ​​السكاني.

  • اختبار t هو لمجموعة واحدة أو مجموعتين بالضبط عندما تكون العينة صغيرة (30 أو أقل).
  • اختبار z مخصص لمجموعة واحدة أو مجموعتين بالضبط عندما تكون العينة كبيرة.
  • ANOVA مخصص لثلاث مجموعات أو أكثر.

يحتوي الاختباران z و t على أنواع فرعية بناءً على عدد وأنواع العينات والفرضيات:

  • إذا كان لديك عينة واحدة فقط تريد مقارنتها بمتوسط ​​محتوى ، فاستخدم اختبار عينة واحدة.
  • إذا كان لديك قياسات مقترنة (تصميم داخل الموضوعات) ، فاستخدم اختبار عينات تابع (مزدوج).
  • أما إذا كان لديك قياسات منفصلة تمامًا من مجموعتين غير متطابقتين (تصميم بين الموضوعات) ، فاستخدم اختبار عينات مستقل.
  • إذا كنت تتوقع اختلافًا بين المجموعات في اتجاه معين ، فاستخدم الاختبار أحادي الطرف.
  • إذا لم يكن لديك أي توقعات لاتجاه الاختلاف بين المجموعات ، فاستخدم اختبارًا ثنائي الطرف.

اختبار الارتباط المعياري الوحيد هو اختبار Pearson’s r. يخبرك معامل الارتباط (r) بقوة العلاقة الخطية بين متغيرين كميين.

ومع ذلك ، لاختبار ما إذا كان الارتباط في العينة قويًا بما يكفي ليكون مهمًا في المجتمع ، تحتاج أيضًا إلى إجراء اختبار أهمية لمعامل الارتباط ، عادةً اختبار t ، للحصول على قيمة p. يستخدم هذا الاختبار حجم عينتك لحساب مدى اختلاف معامل الارتباط عن الصفر في المجتمع.

تجريبي

مثال: اختبار t الزوجي للبحث التجريبي

نظرًا لأن تصميم البحث الخاص بك عبارة عن تجربة داخل الموضوعات ، فإن قياسات الاختبار القبلي والبعدي تأتي من نفس المجموعة ، لذلك فأنت تحتاج إلى اختبار t تابع (مزدوج). نظرًا لأنك تتوقع تغييرًا في اتجاه معين (تحسن في درجات الاختبار) ، فأنت بحاجة إلى اختبار أحادي الطرف.


يمكنك استخدام اختبار t وحيد الذيل للعينات التابعة لتقييم ما إذا كان تمرين التأمل يحسن نتائج اختبار الرياضيات بشكل ملحوظ. يمنحك الاختبار:

  • قيمة t (إحصائية اختبار) تبلغ 3.00
  • قيمة p 0.0028

الارتباط

مثال: معامل الارتباط واختبار الأهمية


يمكنك استخدام r لـ Pearson لحساب قوة العلاقة الخطية بين دخل الوالدين والمعدل التراكمي في عينتك. تبلغ قيمة r لبيرسون 0.12 ، مما يشير إلى ارتباط صغير في العينة.


على الرغم من أن Pearson’s r هي إحصائية اختبارية ، إلا أنها لا تخبرك بأي شيء عن مدى أهمية الارتباط في المجتمع. تحتاج أيضًا إلى اختبار ما إذا كان معامل ارتباط العينة كبيرًا بما يكفي لإثبات وجود ارتباط في المجتمع.

يمكن أن يحدد اختبار t أيضًا مدى اختلاف معامل الارتباط بشكل كبير عن الصفر بناءً على حجم العينة. نظرًا لأنك تتوقع ارتباطًا إيجابيًا بين دخل الوالدين والمعدل التراكمي ، فإنك تستخدم اختبار t أحادي الطرف. يمنحك اختبار t:

  • قيمة t هي 3.08
  • قيمة p هي 0.001

المرحلة 5: فسر نتائجك

الخطوة الأخيرة في التحليل الإحصائي هي تفسير نتائجك.

دلالة إحصائية

في اختبار الفرضيات ، الأهمية الإحصائية هي المعايير الرئيسية لتشكيل الاستنتاجات. تقارن القيمة الاحتمالية بمستوى الأهمية المحدد (عادةً 0.05) لتحديد ما إذا كانت نتائجك ذات دلالة إحصائية أم غير مهمة.

من غير المحتمل أن تكون النتائج ذات الدلالة الإحصائية قد نشأت بسبب الصدفة فقط. هناك فرصة ضئيلة للغاية لحدوث مثل هذه النتيجة إذا كانت الفرضية الصفرية صحيحة في المجتمع.

حجم التأثير

لا تعني النتيجة ذات الدلالة الإحصائية بالضرورة أن هناك تطبيقات مهمة في الحياة الواقعية أو نتائج سريرية لاكتشاف ما.

في المقابل ، يشير حجم التأثير إلى الأهمية العملية لنتائجك. من المهم الإبلاغ عن أحجام التأثير جنبًا إلى جنب مع الإحصائيات الاستنتاجية للحصول على صورة كاملة لنتائجك. يجب عليك أيضًا الإبلاغ عن تقديرات الفاصل الزمني لأحجام التأثير إذا كنت تكتب ورقة بنمط APA.

أخطاء القرار

أخطاء النوع الأول والنوع الثاني هي أخطاء ارتكبت في استنتاجات البحث. يعني الخطأ من النوع الأول رفض الفرضية الصفرية عندما تكون صحيحة بالفعل ، بينما يعني الخطأ من النوع الثاني الفشل في رفض الفرضية الصفرية عندما تكون خاطئة.

يمكنك أن تهدف إلى تقليل مخاطر هذه الأخطاء عن طريق تحديد مستوى الأهمية الأمثل وضمان قوة عالية. ومع ذلك ، هناك مفاضلة بين الخطأين ، لذا فإن التوازن الدقيق ضروري.

التكرار مقابل الإحصاء البايزي

تقليديًا ، تؤكد الإحصائيات المتكررة على اختبار أهمية الفرضية الصفرية وتبدأ دائمًا بافتراض فرضية فارغة حقيقية.

ومع ذلك ، نمت شعبية إحصاءات بايز كنهج بديل في العقود القليلة الماضية. في هذا النهج ، تستخدم البحث السابق لتحديث فرضياتك باستمرار بناءً على توقعاتك وملاحظاتك.

يقارن عامل بايز القوة النسبية للأدلة على الفرضية الصفرية مقابل الفرضية البديلة بدلاً من التوصل إلى استنتاج حول رفض الفرضية الصفرية أم لا.

الحوسبة الإحصائية

استخدم العلماء الطرق التقليدية للتحليل الإحصائي – من أخذ العينات إلى تفسير النتائج – لآلاف السنين. لكن أحجام البيانات اليوم تجعل الإحصائيات أكثر قيمة وقوة. أدى التخزين الميسور التكلفة وأجهزة الكمبيوتر القوية والخوارزميات المتقدمة إلى زيادة استخدام الإحصائيات الحسابية.

سواء كنت تعمل بأحجام بيانات كبيرة أو تقوم بإجراء تباديل متعدد لحساباتك ، فقد أصبحت الحوسبة الإحصائية ضرورية للإحصائي اليوم. تشمل ممارسات الحوسبة الإحصائية الشائعة ما يلي:

  • البرمجة الإحصائية – من التحليل التقليدي للتباين والانحدار الخطي إلى الأساليب الدقيقة وتقنيات التصور الإحصائي ، تعد البرمجة الإحصائية ضرورية لاتخاذ القرارات المستندة إلى البيانات في كل مجال.
  • الاقتصاد القياسي – نمذجة العمليات التجارية والتنبؤ بها ومحاكاةها لتحسين التخطيط الاستراتيجي والتكتيكي. تطبق هذه الطريقة الإحصائيات على علم الاقتصاد للتنبؤ بالاتجاهات المستقبلية.
  • بحوث العمليات – حدد الإجراءات التي ستؤدي إلى أفضل النتائج – بناءً على العديد من الخيارات والنتائج الممكنة. تُستخدم الجدولة والمحاكاة وعمليات النمذجة ذات الصلة لتحسين العمليات التجارية وتحديات الإدارة.
  • برمجة المصفوفة – تقنيات الكمبيوتر القوية لتنفيذ الأساليب الإحصائية الخاصة بك وتحليل البيانات الاستكشافية باستخدام خوارزميات عملية الصف.
  • التصور الإحصائي – يمكن استخدام التحليل الإحصائي السريع والتفاعلي والقدرات الاستكشافية في الواجهة المرئية لفهم البيانات وبناء النماذج.
  • تحسين الجودة الإحصائية – نهج رياضي لمراجعة خصائص الجودة والسلامة لجميع جوانب الإنتاج.

أنظر أيضاً: أنواع البيانات الإحصائية

وظائف في التحليل الإحصائي

مع إعلان الجميع من New York Times إلى Hal Varien كبير الاقتصاديين في جوجل أن الإحصائيات هي أحدث مجال وظيفي مثير ، فمن نحن لنجادل؟ ولكن لماذا هناك الكثير من الحديث عن وظائف في التحليل الإحصائي وعلم البيانات؟ يمكن أن يكون نقص المفكرين التحليليين المدربين. أو قد يكون الطلب على إدارة أحدث سلالات البيانات الضخمة. أو ربما يكون هذا هو الإثارة لتطبيق المفاهيم الرياضية لإحداث فرق في العالم.

إذا تحدثت إلى الإحصائيين حول ما أثار اهتمامهم أولاً بالتحليل الإحصائي ، فسوف تسمع الكثير من القصص حول جمع بطاقات البيسبول عندما كان طفلاً. أو تطبيق الإحصائيات للفوز بالمزيد من ألعاب المحور والحلفاء.

غالبًا ما تكون هذه المشاعر المبكرة هي التي تقود الإحصائيين إلى الميدان. كشخص بالغ ، يمكن لهذه المشاعر أن تنتقل إلى القوى العاملة كحب للتحليل والتفكير ، حيث يتم تطبيق شغفهم على كل شيء من تأثير الأصدقاء على قرارات الشراء إلى دراسة الأنواع المهددة بالانقراض في جميع أنحاء العالم.

الأسئلة الشائعة

ما هو الإحصاء؟

الإحصاء هو علم جمع البيانات وتحليلها لاستنتاج النسب (العينة) التي تمثل السكان. بمعنى آخر ، تقوم الإحصائيات بتفسير البيانات من أجل عمل تنبؤات للسكان.

لماذا ندرس الإحصاء؟

للتلخيص ، فإن الأسباب الخمسة لدراسة الإحصاء هي القدرة على إجراء البحوث بشكل فعال ، والقدرة على قراءة مقالات المجلات وتقييمها ، وزيادة تطوير التفكير النقدي والمهارات التحليلية ، والتصرف كمستهلك مستنير ، ومعرفة متى تحتاج لتوظيف مساعدة إحصائية خارجية.

ما الفرق بين الانحراف المعياري والتباين؟

التباين هو متوسط الانحرافات التربيعية عن المتوسط ، بينما الانحراف المعياري هو الجذر التربيعي لهذا الرقم. يعكس كلا المقياسين التباين في التوزيع ، لكن وحداتهما تختلف:
1-يتم التعبير عن الانحراف المعياري بنفس الوحدات مثل القيم الأصلية (على سبيل المثال ، الدقائق أو الأمتار).
2-يتم التعبير عن التباين بوحدات أكبر بكثير (على سبيل المثال ، متر مربع).
على الرغم من صعوبة فهم وحدات التباين بشكل حدسي ، إلا أن التباين مهم في الاختبارات الإحصائية.

ما هو التوزيع الطبيعي؟

في التوزيع الطبيعي ، يتم توزيع البيانات بشكل متماثل بدون انحراف. تتجمع معظم القيم حول منطقة مركزية ، مع تناقص القيم كلما ابتعدت عن المركز.
مقاييس الاتجاه المركزي (الوسط ، الوضع والوسيط) هي نفسها تمامًا في التوزيع الطبيعي.

ما الفرق بين الإحصاء الوصفي والاستنتاجي؟

الإحصاء الوصفي يلخص خصائص مجموعة البيانات. تسمح لك الإحصائيات الاستدلالية باختبار فرضية أو تقييم ما إذا كانت بياناتك قابلة للتعميم على السكان الأوسع.