الإحصاء هي الطريقة التي تهتم بجمع البيانات وتنظيمها ، وتحليل البيانات وتفسيرها ، وأخيراً تقديم أنواع البيانات الإحصائية.
عندما يتم تطبيق الإحصائيات في مجال العلوم أو القضايا الاجتماعية ، يتم تحليل العملية من النهاية إلى النهاية من السكان الإحصائيين إلى التصميم الإحصائي في شكل استطلاعات ومنتديات وتجارب. تتضمن الطريقة الإحصائية الإحصاء الوصفي والاستنتاجي الذي يتبع الفهارس والميول المركزية ونظريات الاحتمالات.
تنقسم أنواع البيانات الإحصائية بشكل عام إلى بيانات رقمية وبيانات فئوية وبيانات أصلية.
أنواع البيانات الإحصائية
من المهم معرفة أنواع البيانات الإحصائية عند العمل على إحصاءات منفصلة أو مستمرة . لأن البيانات هي وظائف مهمة وضرورية لدراسة مشكلة. يتم تصنيف أنواع البيانات الإحصائية على نطاق واسع إلى عددية والتي تغطي النوع المنفصل والمستمر للبيانات والبيانات الفئوية والبيانات الترتيبية.
تعد أنواع البيانات الإحصائية مفهومًا مهمًا في الإحصاء ، يجب فهمه ، لتطبيق القياسات الإحصائية بشكل صحيح على بياناتك ، وبالتالي لاستنتاج افتراضات معينة حولها بشكل صحيح. سيقدم لك منشور المدونة هذا أنواع البيانات المختلفة التي تحتاج إلى معرفتها من أجل إجراء تحليل بيانات استكشافية مناسب ، والذي يعد أحد أكثر الأجزاء التي تم التقليل من شأنها في مشروع التعلم الآلي.
1.البيانات العددية
البيانات العددية تتضمن البيانات عددًا أو قياسًا لأي كائن أو شخص مثل الكتلة والحجم والطول ومعد الذكاء ومستوى السكر وعدد المشاركات وعدد الأسنان والأرجل وصفحات في كتاب وما إلى ذلك.
بشكل بسيط ، يُطلق على العدد المحدود للأرقام أو القيم التي يمكن تحليلها من كائن أو شخص كسمة محسوبة في دراسة مجال معين البيانات الرقمية. يتم تمثيلها في الغالب بالأرقام ويطلق عليها البيانات الكمية. يمكن تقسيمها إلى مستمر ومنفصل.
البيانات العددية المنفصلة
يُطلق على المجموعة المحتملة من القيم التي يمكن حسابها بيانات منفصلة ويمكن سردها. في بعض الأحيان يتم خلط مجموعة البيانات المنفصلة بما في ذلك الأعداد المحدودة أو اللانهائية.
على سبيل المثال ، إذا كان عدد الرؤوس في تقليب العملة 100 مرة يحصل على القيمة من 0 إلى 100 وهي قيمة محدودة ، ولكن قد يستغرق عدد مرات تقليب العملة أوقاتًا لا نهائية للوصول إلى 100 عدد للرأس. إذن هذه الحالة عبارة عن مزيج من السيناريوهات المحدودة واللانهائية.
البيانات العددية المستمرة
المجموعة المحتملة من القيم التي لا يمكن عدها وتمثيلها فقط على فترات منتظمة على رقم تسمى البيانات المستمرة. على سبيل المثال ، يمكن تمثيل كمية الغاز التي يتم شراؤها من مضخة الشاحنات ذات الخزانات سعة 200 جالون على أنها بيانات مستمرة من 0 إلى 200 مع الفاصل الزمني [0 ، 200] شامل.
لكن لا يمكن ضخ 80.4 جالونًا أو 80.41234 جالونًا ولكن من الممكن تمثيل عدد صحيح يتراوح بين 0 إلى 200. لذلك ، بهذه الطريقة ، تعتبر بيانات مستمرة لأنها غير محدودة. للحفاظ على البيانات وتنظيمها بسهولة ، يفضل الإحصائيون هذه الطريقة عن طريق التقريب في خطوط الأرقام.
في الوسائل العلمية ، يختلف عمر البطارية من صفر إلى عدد لا نهائي حيث تدوم إلى الأبد. يجب أن يتم فرزها مع جميع القيم الممكنة تقع بين صفر إلى بضع مئات من الساعات ، حيث لا يمكن فتح غطاء للبطارية للتحقق من قدرتها على التصريف.
2.البيانات النوعية أو البيانات الفئوية
البيانات النوعية أو البيانات الفئوية هي أحد أنوا ع البيانات الإحصائية التي يتم تضمين فيها الخصائص أو السمة السلوكية لشخص أو كائن ضمن البيانات الفئوية. يمكن أن يكون بأي شكل مثل الجنس أو المهد أو الطبقة الاجتماعية أو الحالة الاجتماعية أو شيء مفضل.
بمعنى أدق ، البيانات النوعية هي قياس قاطع لا يتم التعبير عنه من حيث الأرقام ، بل عن طريق وصف اللغة الطبيعية. في الإحصاء ، غالبًا ما يتم استخدامه بالتبادل مع البيانات “الفئوية”. تمثل البيانات الفئوية خصائص مثل جنس الشخص أو الحالة الاجتماعية أو مسقط رأسه أو أنواع الأفلام التي يفضلها.
يمكن أن تأخذ البيانات الفئوية قيمًا رقمية (مثل “1” تشير إلى ذكر و “2” تشير إلى أنثى) ، ولكن هذه الأرقام ليس لها معنى رياضي. لا يمكنك جمعها معًا ، على سبيل المثال.
3.البيانات الترتيبية
يتم احتساب البيانات الترتيبية على أنها مزيج من البيانات العددية والفئوية. يتم ترتيب البيانات تحت فئات ويتم وضع الأرقام في الفئات التي تعطي المعنى الصحيح.
على سبيل المثال ، يمكن إعطاء تصنيف الفندق من صفر إلى خمسة مع الفئة من ضعيف إلى ممتاز مع الأخذ في الاعتبار أجواء الفندق ، وذوقه ، وخدمته ، وتكلفته ، ومرافقه ، وما إلى ذلك.
من خلال دمج البيانات ، يتم إعداد الرسم البياني لتحليل أداء الفندق . لا يقدم الاستطلاع الذي أجراه عدد قليل من الأشخاص حلاً مثاليًا ولكن استجابة مائة شخص توفر حلاً قويًا للبحث. من هذا ، من المعروف أن الأرقام الزوجية لها معنى رياضي.
نظرًا لأن الرقم يمتلك بعض القيمة الإضافية للبحث ، فإن البيانات الأصلية تمثل معنى مهمًا لكل من البيانات العددية والفئوية.
القياس العددي هو اسمي ولا يعطي أي ترتيب معقول للدراسة بينما القيم الترتيبية تعطي تعديلات غير دقيقة بين القيم المتكررة ولكنها تصر على إعطاء معلومات معنية من هذا التسلسل.
المعايرات الفاصلة ذات دلالة إحصائية بين القياسات المحددة ولكن في بعض حالات قياسات درجة الحرارة والمواقع الجغرافية ، يمتلك الصفر قيمة عشوائية تفشل في إعطاء المعلومات الصحيحة وتمكين التحولات الخطية فقط. إذا كانت القيمة الصفرية والاختلافات بين القياس محددة مسبقًا ، يكون تحويل إعادة القياس ممكنًا باستخدام قياسات النسبة.
لا يمكن تبرير المتغيرات الإحصائية التي تتوافق مع القياس الترتيبي والاسمي بقيم عددية. لذلك يتم تجميعها كقيم فئوية ويتم دمج الفواصل الزمنية وقياسات النسب كقيم كمية. في الطبيعة ، يمكن أن تكون منفصلة أو مستمرة.
في علوم الكمبيوتر وتكنولوجيا المعلومات ، تلعب هذه القيم دورًا مهمًا حيث أن الوظائف المنطقية في العدد الصحيح للحساب والتطبيق ، وتطفو في البرمجة. لكن رسم الخرائط لكلا النوعين من البيانات في الإحصاء وعلوم الكمبيوتر يتم تصنيفهما وفقًا للمتطلبات ويتم توسيعه لاحقًا في الأبحاث المستقبلية.
العلاقة بين أي بيانات والرؤى الخفية لمعناها تعكس بصمت وظائفها وتعطي فقط الحقيقة المعرضة بشكل صارم للتحول. نظرًا لأن البيانات الإحصائية مهمة للغاية لتبرير أي نهج وتلعب دورًا رئيسيًا في اتخاذ القرار ، على الرغم من المصطلحات الرياضية مثل الدرجات البارزة ، والرتب المميزة ، والكسور المتميزة ، والكميات ، والأعداد والنسب المستمرة ، والفترات الدورية ، تبدو البيانات المصنفة والمحددة مسبقًا متشابهة ، فكل شخص لديه معنى محدد للغاية لوظيفته الفريدة في معالجة البيانات الرياضية عالية الأبعاد.
أنظر أيضاً: أنواع الإحصاء
أنواع البيانات الإحصائية : ملخص
نأمل أن يكون لديك الآن فهم جيد لبيانات النسبة ، والفاصل الزمني ، والترتيبي ، والاسمي ، وما يمكنك فعله بها.
يتم ملاحظة البيانات الاسمية وليس قياسها. فهي غير مرتبة وليست متساوية البعد وليس لها صفر ذي مغزى. يتم تسمية فئاتها ، ويمكنك تجميع نقاط البيانات المتشابهة معًا وفصل تلك المختلفة.
يتم أيضًا ملاحظة البيانات الترتيبية ، وليس قياسها. يتم ترتيبها ولكنها ليست متساوية البعد وليس لها أي صفر ذي معنى. يتم تسمية الفئات ، وبمجرد تجميع البيانات يمكنك فرزها.
البيانات الاسمية والبيانات الترتيبية هي أنواع من البيانات النوعية (تُعرف أيضًا باسم البيانات الفئوية) ، ولا يمكنك إجراء أي عمليات رياضية على البيانات الاسمية ولا على البيانات الترتيبية.
يتم قياس بيانات الفاصل الزمني وترتيبها باستخدام عناصر متساوية الأبعاد ، ولكن ليس لها صفر ذي معنى. يمكنك فرز بيانات الفاصل الزمني ويمكنك إضافة قيمها وطرحها.
يتم أيضًا قياس بيانات النسبة وترتيبها باستخدام عناصر متساوية البعد وصفر ذو مغزى. يمكن فرز بيانات النسبة وإضافتها وطرحها ، ولكن يمكن أيضًا ضربها وتقسيمها.
بيانات الفاصل الزمني وبيانات النسبة هي أنواع من البيانات الكمية (تُعرف أيضًا باسم البيانات الرقمية).
أساسيات الإحصاء ، مثل جمع البيانات وتنظيف البيانات وتكاملها ليست مثيرة ، ونتيجة لذلك غالبًا ما يتم تجاهلها ، وهذا هو الحال أيضًا مع أنواع البيانات.
من واقع خبرتي ، فإن القليل من الأشخاص الذين يتعين عليهم إجراء الإحصائيات كجزء من أبحاثهم يعرفون ويفهمون أنواع البيانات الإحصائية ، ونتيجة لذلك يكافحون من أجل فهم ما يمكنهم وما لا يمكنهم فعله ببياناتهم.
أنظر أيضاً: تخصص الإحصاء
هذا عار ، لأنه كما رأيت ، إذا كنت تعرف الأنواع الأربعة من البيانات في الإحصائيات التي تعرفها:
- كيف نتعامل معها بشكل صحيح
- ما يمكنك حسابه معهم
- ما هي الإحصاءات الوصفية والتصورات المناسبة
- ما هي الفرضيات الإحصائية التي يمكنك استخدامها
باختصار ، تعد أنواع البيانات خارطة طريق لإجراء دراستك بالكامل بشكل صحيح.
هم حقا بهذه الأهمية!
الأسئلة الشائعة
ما هي البيانات الإحصائية الفئوية ؟
تمثل البيانات الفئوية خصائص مثل جنس الشخص أو الحالة الاجتماعية أو مسقط رأسه أو أنواع الأفلام التي يفضلها. يمكن أن تأخذ البيانات الفئوية قيمًا رقمية (مثل “1” تشير إلى ذكر و “2” تشير إلى أنثى) ، ولكن هذه الأرقام ليس لها معنى رياضي. لا يمكنك جمعها معًا ، على سبيل المثال. (الأسماء الأخرى للبيانات الفئوية هي بيانات نوعية ، أو نعم / لا بيانات.)
ما هي البيانات الترتيبية ؟
تمزج البيانات الترتيبية البيانات العددية والفئوية. تنقسم البيانات إلى فئات ، لكن الأرقام الموضوعة على الفئات لها معنى. على سبيل المثال ، فإن تصنيف مطعم على مقياس من 0 (أدنى) إلى 4 (أعلى) نجوم يعطي بيانات ترتيبية.
غالبًا ما يتم التعامل مع البيانات الترتيبية على أنها فئوية ، حيث يتم ترتيب المجموعات عند عمل الرسوم البيانية والمخططات. ومع ذلك ، على عكس البيانات الفئوية ، فإن الأرقام لها معنى رياضي.
على سبيل المثال ، إذا قمت باستطلاع آراء 100 شخص وطلبت منهم تقييم مطعم على مقياس من 0 إلى 4 ، فإن أخذ متوسط الردود المائة سيكون له معنى. لن يكون هذا هو الحال مع البيانات الفئوية.
ما هي البيانات الإحصائية العددية او اليانات الرقمية ؟
البيانات الإحصائية العددية لها معنى كمقياس ، مثل طول الشخص أو وزنه أو معدل الذكاء أو ضغط الدم ؛ أو أنها عبارة عن عدد ، مثل عدد الأسهم التي يمتلكها الشخص ، أو عدد أسنان الكلب ، أو عدد الصفحات التي يمكنك قراءتها من كتابك المفضل قبل أن تغفو. (يطلق الإحصائيون أيضًا على البيانات الرقمية البيانات الكمية.)
ما هي أنواع البيانات الإحصائية ؟
أنواع البيانات الإحصائية في التحليل الاحصائي هي :
+ البيانات النوعية وتنقسم إلى البيانات الاسمية أو الشكلية
+ البيانات الترتيبية
+ البيانات الكمية وتنقسم إلى البيانات المنفصلة و البيانات المستمرة