تفاوت های داده های طبقه بندی شده (Categorical Data) در مقابل داده های عددی (Numerical Data)

تفاوت های داده های طبقه بندی شده (Categorical Data) در مقابل داده های عددی (Numerical Data)

داده ها حقایق یا قطعاتی از اطلاعات هستند که برای مرجع یا تجزیه و تحلیل جمع آوری شده اند. بیشتر اوقات، این داده ها به عنوان بخشی از موضوع مورد بررسی جمع آوری می شوند. این ویژگی برای هر فرد می تواند متفاوت باشد.

هنگام تحقیق و جمع آوری داده ها، دانستن نوع داده هایی که به دست می آورید ضروری است تا بتوانید آن ها را به خوبی تفسیر و تجزیه و تحلیل کنید. اغلب اوقات، دو نوع داده در یک مطالعه تحقیقاتی وجود دارد:

  • داده های طبقه بندی شده Categorical Data
  • داده های عددی Numerical Data

در آمار، درک انواع مختلف داده ها حیاتی است. بسیار مهم است که بفهمیم هر دو بر اساس تفاوت و نحوه یکسان بودن آنها چه کسانی هستند. این کار جمع آوری، استفاده و تجزیه و تحلیل صحیح آنها را آسان می کند.

تفاوت های داده های طبقه بندی شده (Categorical Data) در مقابل داده های عددی (Numerical Data)

داده ها حقایق یا قطعاتی از اطلاعات هستند که برای مرجع یا تجزیه و تحلیل جمع آوری شده اند. بیشتر اوقات، این داده ها به عنوان بخشی از موضوع مورد بررسی جمع آوری می شوند.

←برای خرید کرک Tableau با تمام ویژگی ها کلیک کنید

داده های طبقه بندی شده (Categorical Data) چیست؟

داده های دسته بندی را می توان با استفاده از نام ها یا برچسب ها در گروه ها یا دسته بندی ها قرار داد. این گروه بندی معمولاً با استفاده از روش تطبیق بر اساس ویژگی های داده و شباهت های بین این کیفیت ها ایجاد می شود.

هر قطعه از یک مجموعه داده طبقه‌بندی، که به عنوان داده‌های کیفی نیز شناخته می‌شود، ممکن است تنها به یک دسته بر اساس کیفیت آن اختصاص داده شود و هر دسته متقابلاً منحصر به فرد است.

دو دسته اصلی از داده های طبقه بندی شده وجود دارد:

  • داده های اسمی: این دسته داده ای است که دسته های خود را نام گذاری یا برچسب گذاری می کند. دارای ویژگی هایی شبیه به یک اسم است و گهگاه به عنوان داده های نامگذاری از آن یاد می شود.
  • داده های معمولی: عناصر دارای رتبه بندی، سفارشات یا مقیاس های رتبه بندی در این دسته از داده های طبقه بندی قرار می گیرند. داده های اسمی را می توان مرتب کرد و شمارش کرد اما اندازه گیری نمی شود.

داده های عددی (Numerical Data) چیست؟

داده هایی که به جای توصیف زبان طبیعی به صورت عددی بیان می شوند، داده های عددی نامیده می شوند. فقط می توان آن را به صورت عددی جمع آوری کرد و نام خود را حفظ کرد. این نوع داده عددی که به آن داده های کمی نیز گفته می شود، می تواند برای اندازه گیری قد، وزن، IQ و غیره افراد استفاده شود.

داده های عددی می توانند دو نوع باشند:

  • داده های گسسته: داده های عددی قابل شمارش داده های گسسته هستند. به عبارت دیگر آنها یک به یک به اعداد طبیعی نگاشت می شوند. سن، تعداد دانش‌آموزان در یک کلاس، تعداد نامزدهای انتخابات و غیره نمونه‌هایی از داده‌های گسسته به طور کلی هستند.
  • داده های پیوسته: این یک نوع داده غیرقابل شمارش برای اعداد است. مجموعه ای از بازه ها در یک خط اعداد طبیعی برای به تصویر کشیدن آنها استفاده می شود. CGPA دانشجویی، ارتفاع، و دیگر انواع داده های پیوسته چند نمونه هستند.
تفاوت های داده های طبقه بندی شده (Categorical Data) در مقابل داده های عددی (Numerical Data)

داده ها حقایق یا قطعاتی از اطلاعات هستند که برای مرجع یا تجزیه و تحلیل جمع آوری شده اند. بیشتر اوقات، این داده ها به عنوان بخشی از موضوع مورد بررسی جمع آوری می شوند.

←برای خرید کرک Tableau با تمام ویژگی ها کلیک کنید

تفاوت بین داده های دسته بندی در مقابل داده های عددی

خیلی موارد بین این دو نوع داده متفاوت است. بیایید دریابیم که آنها چه چیزی و چگونه متفاوت هستند:

ویژگی ها Categorical data Numerical data
Definition داده های دسته بندی را می توان با نام ها یا برچسب ها ذخیره و شناسایی کرد. داده های عددی اعداد هستند، نه کلمات یا توصیف.
Alias از آنجایی که داده ها را قبل از دسته بندی واجد شرایط می کند، گاهی اوقات به عنوان داده های کیفی نامیده می شود. داده های کمی مقادیر عددی را برای فرآیندهای حسابی نشان می دهد.
Examples میتوان جنسیت را تعریف کنید.

  • نر
  • مونث
  • دیگر
نمره آزمون از 20؟

·        زیر 5

·        5-10

·        10-15

·        15-20

·        20

Types داده های اسمی و داده های ترتیبی. داده های گسسته و داده های پیوسته.
Characteristics ·         هیچ مقیاسی از سفارشات وجود ندارد.

·         توصیف زبان طبیعی

·         می تواند اعداد عددی را بگیرد اما ویژگی های کیفی دارد

·         می توان به صورت گرافیکی با استفاده از نمودار دایره ای و نمودار میله ای نمایش داد.

·         دارای مقیاس منطقی است

·         استفاده از توصیفی که به زبان طبیعی نباشد

·         اعداد و اعداد را به عنوان ورودی می گیرد.

·         برای تجسم این موضوع می توان از نمودارهای میله ای و دایره ای استفاده کرد

User-friendly design نظرسنجی های طولانی یک امکان هستند و ممکن است پاسخ دهندگان را خاموش کنند. تعامل نظرسنجی سریع و کوتاه است و رها شدن را کاهش می دهد.
Data collection method ·         داده های اسمی: سوالات باز

·         داده های ترتیبی: سوالات چند گزینه ای

اغلب سوالات چند گزینه ای و گاهی اوقات باز.
Data collection tools پرسشنامه، نظرسنجی و مصاحبه پرسشنامه، نظرسنجی، مصاحبه، گروه های متمرکز و مشاهدات
Uses زمانی استفاده می شود که یک نظرسنجی اطلاعات، نظرات و تجربیات شخصی پاسخ دهندگان را می طلبد. در تحقیقات تجاری استفاده می شود محاسبات آماری بر اساس عملکرد حسابی.
Compatibility با اکثر رویکردهای آماری ناسازگار است. بنابراین محققان از آن اجتناب می کنند. اکثر محاسبات آماری را پشتیبانی می کند.
Visualization نمودارهای میله ای و دایره ای می توان از نمودارهای میله ای، نمودارهای دایره ای و نمودارهای پراکندگی استفاده کرد.
Structure داده های بدون ساختار مانند گوگل، بینگ و غیره، می تواند داده ها را فهرست کند. از آنجایی که ساختار یافته است، می توان آن را به راحتی مرتب کرد و فهمید.

شباهت بین داده های دسته بندی و داده های عددی

همانطور که قبلاً در مورد تفاوت ها بحث کردیم، 2 داده زیر نیز دارای شباهت هایی هستند که در زیر توضیح داده شده است:

داده های ترتیبی

این تلاقی بین دسته و داده های عددی است. اگرچه معمولاً از آن به عنوان یک زیرگروه از داده های طبقه بندی یاد می شود، می توان آن را به عنوان داده های عددی نیز نامید.

tableau

کاربرد

نتایج برای تحقیق و تجزیه و تحلیل آماری یکسان خواهد بود، چه از یک رویکرد عددی یا طبقه‌بندی استفاده کنید. محققان گاهی از هر دوی آنها در یک نظرسنجی استفاده می‌کنند تا راه‌های مختلف نگاه کردن به داده‌ها را بیابند.

ابزار جمع آوری

معمول‌ترین روش‌ها برای جمع‌آوری داده‌های مقوله‌ای و عددی شامل نظرسنجی، پرسشنامه و مصاحبه است.

محبوب‌ترین روش جمع‌آوری داده‌ها که توسط محققان استفاده می‌شود، پیمایش است. ممکن است برای جمع آوری داده های عددی و دسته ای ساخته شود.

می‌توانید از سؤالات بله/خیر یا سؤالات مقیاس لیکرت برای جمع‌آوری داده‌های عددی از شرکت‌کنندگان استفاده کنید. پرس و جوهای باز همچنین می توانند داده های اساسی را از مخاطبان مورد نظر به دست آورند.

نتیجه

بسته به تحقیقی که انجام می شود، ممکن است از داده های طبقه بندی (Categorical Data) در مقابل داده های عددی (Numerical Data) برای تجزیه و تحلیل آماری استفاده شود. هنگام پرداختن به یک موضوع، یک محقق ممکن است تصمیم بگیرد در برخی شرایط داده های دسته بندی، داده های عددی یا حتی هر دو را جمع آوری کند.

هنگام جمع آوری اطلاعات برای تجزیه و تحلیل برای در نظر گرفتن دیدگاه های جایگزین، محقق ممکن است داده های عددی و دسته بندی را جمع آوری کند. برای استفاده صحیح از این دو نوع داده در یک مطالعه، باید از تمایز آنها آگاه بود.

توجیه دیگری برای اینکه چرا درک انواع داده های مختلف بسیار مهم است، توسط این ارائه می شود.

←برای خرید کرک Tableau با تمام ویژگی ها کلیک کنید

مقاله های مرتبط:

1-تحلیل داده های کسب و کار با هوش تجاری

2-تحلیل داده های کسب و کار با هوش تجاری

3-هوش تجاری (BI) در مقابل تجزیه و تحلیل تجاری (Business Analytics)

4-معرفی و بررسی انواع تجزیه و تحلیل داده ها

5-معرفی ۵ ابزار برتر هوش تجاری

6-تفاوت و مقایسه هوش تجاری (BI) و انبار داده

7-معرفی ۱۵ کاربرد برتر تجزیه و تحلیل داده ها

8-بررسی نیازها و مزایای تجسم داده ها

9-معرفی انواع مدل های داده ای یا Data Model

10-داده های عددی (Numerical Data) چیست و چه ویژگی هایی دارد

 

امتیاز دهید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

سبد خرید