تفاوت های داده های طبقه بندی شده (Categorical Data) در مقابل داده های عددی (Numerical Data)
داده ها حقایق یا قطعاتی از اطلاعات هستند که برای مرجع یا تجزیه و تحلیل جمع آوری شده اند. بیشتر اوقات، این داده ها به عنوان بخشی از موضوع مورد بررسی جمع آوری می شوند. این ویژگی برای هر فرد می تواند متفاوت باشد.
هنگام تحقیق و جمع آوری داده ها، دانستن نوع داده هایی که به دست می آورید ضروری است تا بتوانید آن ها را به خوبی تفسیر و تجزیه و تحلیل کنید. اغلب اوقات، دو نوع داده در یک مطالعه تحقیقاتی وجود دارد:
- داده های طبقه بندی شده Categorical Data
- داده های عددی Numerical Data
در آمار، درک انواع مختلف داده ها حیاتی است. بسیار مهم است که بفهمیم هر دو بر اساس تفاوت و نحوه یکسان بودن آنها چه کسانی هستند. این کار جمع آوری، استفاده و تجزیه و تحلیل صحیح آنها را آسان می کند.
←برای خرید کرک Tableau با تمام ویژگی ها کلیک کنید
داده های طبقه بندی شده (Categorical Data) چیست؟
داده های دسته بندی را می توان با استفاده از نام ها یا برچسب ها در گروه ها یا دسته بندی ها قرار داد. این گروه بندی معمولاً با استفاده از روش تطبیق بر اساس ویژگی های داده و شباهت های بین این کیفیت ها ایجاد می شود.
هر قطعه از یک مجموعه داده طبقهبندی، که به عنوان دادههای کیفی نیز شناخته میشود، ممکن است تنها به یک دسته بر اساس کیفیت آن اختصاص داده شود و هر دسته متقابلاً منحصر به فرد است.
دو دسته اصلی از داده های طبقه بندی شده وجود دارد:
- داده های اسمی: این دسته داده ای است که دسته های خود را نام گذاری یا برچسب گذاری می کند. دارای ویژگی هایی شبیه به یک اسم است و گهگاه به عنوان داده های نامگذاری از آن یاد می شود.
- داده های معمولی: عناصر دارای رتبه بندی، سفارشات یا مقیاس های رتبه بندی در این دسته از داده های طبقه بندی قرار می گیرند. داده های اسمی را می توان مرتب کرد و شمارش کرد اما اندازه گیری نمی شود.
داده های عددی (Numerical Data) چیست؟
داده هایی که به جای توصیف زبان طبیعی به صورت عددی بیان می شوند، داده های عددی نامیده می شوند. فقط می توان آن را به صورت عددی جمع آوری کرد و نام خود را حفظ کرد. این نوع داده عددی که به آن داده های کمی نیز گفته می شود، می تواند برای اندازه گیری قد، وزن، IQ و غیره افراد استفاده شود.
داده های عددی می توانند دو نوع باشند:
- داده های گسسته: داده های عددی قابل شمارش داده های گسسته هستند. به عبارت دیگر آنها یک به یک به اعداد طبیعی نگاشت می شوند. سن، تعداد دانشآموزان در یک کلاس، تعداد نامزدهای انتخابات و غیره نمونههایی از دادههای گسسته به طور کلی هستند.
- داده های پیوسته: این یک نوع داده غیرقابل شمارش برای اعداد است. مجموعه ای از بازه ها در یک خط اعداد طبیعی برای به تصویر کشیدن آنها استفاده می شود. CGPA دانشجویی، ارتفاع، و دیگر انواع داده های پیوسته چند نمونه هستند.
←برای خرید کرک Tableau با تمام ویژگی ها کلیک کنید
تفاوت بین داده های دسته بندی در مقابل داده های عددی
خیلی موارد بین این دو نوع داده متفاوت است. بیایید دریابیم که آنها چه چیزی و چگونه متفاوت هستند:
ویژگی ها | Categorical data | Numerical data |
Definition | داده های دسته بندی را می توان با نام ها یا برچسب ها ذخیره و شناسایی کرد. | داده های عددی اعداد هستند، نه کلمات یا توصیف. |
Alias | از آنجایی که داده ها را قبل از دسته بندی واجد شرایط می کند، گاهی اوقات به عنوان داده های کیفی نامیده می شود. | داده های کمی مقادیر عددی را برای فرآیندهای حسابی نشان می دهد. |
Examples | میتوان جنسیت را تعریف کنید.
|
نمره آزمون از 20؟
· زیر 5 · 5-10 · 10-15 · 15-20 · 20 |
Types | داده های اسمی و داده های ترتیبی. | داده های گسسته و داده های پیوسته. |
Characteristics | · هیچ مقیاسی از سفارشات وجود ندارد.
· توصیف زبان طبیعی · می تواند اعداد عددی را بگیرد اما ویژگی های کیفی دارد · می توان به صورت گرافیکی با استفاده از نمودار دایره ای و نمودار میله ای نمایش داد. |
· دارای مقیاس منطقی است
· استفاده از توصیفی که به زبان طبیعی نباشد · اعداد و اعداد را به عنوان ورودی می گیرد. · برای تجسم این موضوع می توان از نمودارهای میله ای و دایره ای استفاده کرد |
User-friendly design | نظرسنجی های طولانی یک امکان هستند و ممکن است پاسخ دهندگان را خاموش کنند. | تعامل نظرسنجی سریع و کوتاه است و رها شدن را کاهش می دهد. |
Data collection method | · داده های اسمی: سوالات باز
· داده های ترتیبی: سوالات چند گزینه ای |
اغلب سوالات چند گزینه ای و گاهی اوقات باز. |
Data collection tools | پرسشنامه، نظرسنجی و مصاحبه | پرسشنامه، نظرسنجی، مصاحبه، گروه های متمرکز و مشاهدات |
Uses | زمانی استفاده می شود که یک نظرسنجی اطلاعات، نظرات و تجربیات شخصی پاسخ دهندگان را می طلبد. در تحقیقات تجاری استفاده می شود | محاسبات آماری بر اساس عملکرد حسابی. |
Compatibility | با اکثر رویکردهای آماری ناسازگار است. بنابراین محققان از آن اجتناب می کنند. | اکثر محاسبات آماری را پشتیبانی می کند. |
Visualization | نمودارهای میله ای و دایره ای | می توان از نمودارهای میله ای، نمودارهای دایره ای و نمودارهای پراکندگی استفاده کرد. |
Structure | داده های بدون ساختار مانند گوگل، بینگ و غیره، می تواند داده ها را فهرست کند. | از آنجایی که ساختار یافته است، می توان آن را به راحتی مرتب کرد و فهمید. |
شباهت بین داده های دسته بندی و داده های عددی
همانطور که قبلاً در مورد تفاوت ها بحث کردیم، 2 داده زیر نیز دارای شباهت هایی هستند که در زیر توضیح داده شده است:
داده های ترتیبی
این تلاقی بین دسته و داده های عددی است. اگرچه معمولاً از آن به عنوان یک زیرگروه از داده های طبقه بندی یاد می شود، می توان آن را به عنوان داده های عددی نیز نامید.
کاربرد
نتایج برای تحقیق و تجزیه و تحلیل آماری یکسان خواهد بود، چه از یک رویکرد عددی یا طبقهبندی استفاده کنید. محققان گاهی از هر دوی آنها در یک نظرسنجی استفاده میکنند تا راههای مختلف نگاه کردن به دادهها را بیابند.
ابزار جمع آوری
معمولترین روشها برای جمعآوری دادههای مقولهای و عددی شامل نظرسنجی، پرسشنامه و مصاحبه است.
محبوبترین روش جمعآوری دادهها که توسط محققان استفاده میشود، پیمایش است. ممکن است برای جمع آوری داده های عددی و دسته ای ساخته شود.
میتوانید از سؤالات بله/خیر یا سؤالات مقیاس لیکرت برای جمعآوری دادههای عددی از شرکتکنندگان استفاده کنید. پرس و جوهای باز همچنین می توانند داده های اساسی را از مخاطبان مورد نظر به دست آورند.
نتیجه
بسته به تحقیقی که انجام می شود، ممکن است از داده های طبقه بندی (Categorical Data) در مقابل داده های عددی (Numerical Data) برای تجزیه و تحلیل آماری استفاده شود. هنگام پرداختن به یک موضوع، یک محقق ممکن است تصمیم بگیرد در برخی شرایط داده های دسته بندی، داده های عددی یا حتی هر دو را جمع آوری کند.
هنگام جمع آوری اطلاعات برای تجزیه و تحلیل برای در نظر گرفتن دیدگاه های جایگزین، محقق ممکن است داده های عددی و دسته بندی را جمع آوری کند. برای استفاده صحیح از این دو نوع داده در یک مطالعه، باید از تمایز آنها آگاه بود.
توجیه دیگری برای اینکه چرا درک انواع داده های مختلف بسیار مهم است، توسط این ارائه می شود.
←برای خرید کرک Tableau با تمام ویژگی ها کلیک کنید
مقاله های مرتبط:
1-تحلیل داده های کسب و کار با هوش تجاری
2-تحلیل داده های کسب و کار با هوش تجاری
3-هوش تجاری (BI) در مقابل تجزیه و تحلیل تجاری (Business Analytics)
4-معرفی و بررسی انواع تجزیه و تحلیل داده ها
5-معرفی ۵ ابزار برتر هوش تجاری
6-تفاوت و مقایسه هوش تجاری (BI) و انبار داده
7-معرفی ۱۵ کاربرد برتر تجزیه و تحلیل داده ها
8-بررسی نیازها و مزایای تجسم داده ها
9-معرفی انواع مدل های داده ای یا Data Model
10-داده های عددی (Numerical Data) چیست و چه ویژگی هایی دارد