داده های ترتیبی Ordinal Data چیست ؟
داده های ترتیبی Ordinal Data شکلی از دادههای طبقهبندی هستند که ترتیب معناداری در بین دستههای خود دارند. اما فاقد مقادیر عددی یا فاصله زمانی ثابتی است که بتواند آنها را از یکدیگر جدا کند. به زبان ساده، داده های ترتیبی متغیرهایی را نشان می دهند که می توانند رتبه بندی یا مرتب شوند، اما تفاوت دقیق بین رتبه ها مشخص نیست. در این مقاله، داده های ترتیبی چیست، ویژگی های آن، تجزیه و تحلیل و کاربرد داده های ترتیبی را بررسی خواهیم کرد.
Ordinal Data چیست؟
دادههای ترتیبی شکلی از دادههای طبقهبندی هستند که ترتیب معناداری در بین دستههای خود دارند. اما فاقد هر مقدار عددی یا فاصله ثابتی است که بتواند آنها را از یکدیگر جدا کند. به عبارت ساده تر، داده های ترتیبی متغیرهایی را نشان می دهد که می توانند رتبه بندی یا مرتب شوند، اما تفاوت دقیق بین رتبه ها مشخص نیست. این شکل از داده ها اغلب با نظرسنجی ها و پرسشنامه ها برای جمع آوری پاسخ هایی که شامل قضاوت ها یا ترجیحات ذهنی است استفاده می شود. چند نمونه از این موارد عبارتند از:
- گرفتن اولویت ها یا رتبه بندی
- مقیاس ذهنی و لیکرت
- ارزیابی های آموزشی
- برنامه های پزشکی یا مراقبت های بهداشتی
در همه این موارد، ما باید نوع خاصی از نمایش داده ها را داشته باشیم که به داده های ترتیبی معروف است.
مثال: بیایید برای درک بیشتر این موضوع مثالی بزنیم، مثلاً یک نظرسنجی رضایت مشتری داریم. طبق این نظرسنجی، پاسخ دهندگان باید رضایت خود را از یک محصول در مقیاسی با مقادیر «ناراضی»، «تا حدودی ناراضی»، «خنثی»، «تا حدودی راضی» و «راضی» ارزیابی کنند. در اینجا، ترتیب کلاس ها آشکار است، که نشان دهنده سطح تجمعی رضایت است. با این حال، ما نمی توانیم واریانس دقیق در سطوح رضایت بین هر دسته را تعیین کنیم زیرا مقیاس فاقد یک فاصله عددی ثابت است.
←برای خرید کرک لایسنس تبلو Tableau با تمام ویژگی ها کلیک کنید
سایر اشکال داده که معمولاً مورد استفاده قرار می گیرند عبارتند از:
- دادههای اسمی دستهها را بدون هیچ ترتیب ذاتی یا رتبهبندی در میان دستهها نشان میدهد.
مثال: رنگ ها، انواع سبزیجات
- دادههای بازهای دستههایی را با فواصل مساوی بین مقادیر مرتب کردهاند
مثال: دما
- دادههای نسبتی که دارای یک نقطه صفر واقعی هستند و اجازه میدهند نسبتهای معناداری بین مقادیر وجود داشته باشد.
مثال: وزن، درآمد
ویژگی های داده های ترتیبی
داده های ترتیبی یک نوع داده حیاتی در زمینه های مختلف از جمله تحقیقات بازار، علوم اجتماعی و روانشناسی است.
- دادههای ترتیبی دارای ترتیب یا رتبهبندی متمایز در بین دستههای خود هستند به این معنی که هر دسته دارای موقعیت مشخصی نسبت به سایرین است.
- دادههای ترتیبی برخلاف دادههای فاصلهای یا نسبتی، تفاوتهای پایدار و قابل اندازهگیری بین دستهها ندارند. حتی در حالی که میدانید یک دسته بالاتر از دسته دیگر قرار دارد، نمیتوانید اندازهگیری دقیق یا تفاوت ارزش بین این دو را مشخص کنید.
- داده های ترتیبی برای عملیات ریاضی معنی دار مانند جمع، تفریق، ضرب و تقسیم نامناسب هستند، زیرا فاقد فواصل مساوی و تعیین کمیت دقیق هستند. هنگام تلاش برای محاسبه نسبت ها یا میانگین ها با استفاده از داده های ترتیبی، ممکن است به نتایج نادرستی برسید.
- این به پژوهشگران اجازه میدهد تا جنبهها، احساسات و نگرشهای افراد یا گروهها را با گرفتن رتبهبندی نسبی آنها اندازهگیری کنند. به عنوان مثال، در بازاریابی، داده های ترتیبی می توانند به درک ترجیحات مشتریان برای محصولات یا خدمات مختلف کمک کنند.
تجزیه و تحلیل داده های ترتیبی
هر داده ترتیبی یک ویژگی کلیدی دارد که عبارت است از: “وجود یک ترتیب رتبه بندی طبیعی”. این ترتیب اطلاعات حیاتی در مورد موقعیت نسبی دسته ها از نظر بزرگی آنها ارائه می دهد، اما به ما اجازه نمی دهد تا عملیات ریاضی مانند جمع، تفریق یا تقسیم را روی داده ها انجام دهیم. برای مثال، نمیتوانیم بگوییم که تفاوت بین «تا حدودی راضی» و «خنثی» با تفاوت بین «خنثی» و «تا حدودی ناراضی» برابر است.
آمار توصیفی برای داده های ترتیبی
آمار توصیفی برای داده های ترتیبی شامل روش هایی برای خلاصه کردن و توصیف ویژگی های داده ها است. در حالی که برخی از آمارهای عددی سنتی ممکن است به دلیل ماهیت داده های ترتیبی مناسب نباشند (به عنوان مثال، محاسبه میانگین)، تکنیک های توصیفی خاصی وجود دارد که مناسب تر هستند. برخی از آنها به شرح زیر است:
- توزیع فرکانس: یک توزیع فرکانس یا هیستوگرام برای نشان دادن توزیع پاسخ ها یا رتبه ها ایجاد کنید. این یک نمای کلی از اینکه هر دسته یا رتبه هر چند وقت یکبار در داده ها رخ می دهد را ارائه می دهد.
- حالت: حالتی را مشخص کنید که کدام دسته یا رتبه بیشتر در داده ها ظاهر می شود. این حالت به شما بینشی در مورد رایج ترین پاسخ یا ترجیح می دهد.
- میانه: میانه را محاسبه کنید، که در هنگام مرتب شدن داده ها، مقدار وسط است. میانه یک معیار قوی از تمایل مرکزی است و برای داده های ترتیبی مناسب است زیرا فواصل مساوی بین دسته ها را در نظر نمی گیرد.
- صدک ها: صدک ها را محاسبه کنید تا بفهمید چگونه داده ها در سطوح مختلف مقیاس ترتیبی پخش می شوند. به عنوان مثال، صدکهای 25 و 75، محدوده بین چارکی را به شما میدهند، که نشاندهنده گسترش 50 درصد متوسط دادهها است.
- Range: محدوده را محاسبه کنید، که تفاوت بین بالاترین و کمترین مقدار در داده ها است. در حالی که برای داده های ترتیبی به اندازه داده های بازه ای یا نسبتی آموزنده نیست، اما هنوز مقداری تغییرپذیری را ارائه می دهد.
- محدوده بین ربعی (IQR): محاسبه IQR که محدوده مقادیر بین صدک 25 و 75 است. این اندازه گیری تخمین قوی از تغییرپذیری را ارائه می دهد که حساسیت کمتری به مقادیر پرت دارد.
- نمودار میله ای: نمودارهای میله ای ایجاد کنید تا فرکانس ها یا درصدهای هر دسته را تجسم کنید. نمودارهای میله ای روشی مفید برای نمایش توزیع داده های ترتیبی است.
- دسته بندی های مرتب شده: هنگام ایجاد تصاویر یا جداول، دسته ها یا رتبه ها را به ترتیب مناسب خود نمایش دهید. این به حفظ ماهیت ترتیبی داده ها کمک می کند و تضمین می کند که اطلاعات به شیوه ای معنادار ارائه می شود.
آمار استنباطی برای داده های ترتیبی
آمار استنباطی شامل نتیجه گیری یا پیش بینی در مورد یک جمعیت بر اساس نمونه ای از داده ها است. هنگام کار با داده های ترتیبی، الگوریتم ها و تکنیک های آمار استنباطی خاصی وجود دارد که برای تجزیه و تحلیل و استنتاج از این نوع داده ها مناسب است. برخی از آزمون های استنباطی رایج عبارتند از:
- آزمون U Mann-Whitney (آزمون رتبه-جمع ویلکاکسون): این آزمون ناپارامتریک تعیین می کند که آیا تفاوت معنی داری در داده های ترتیبی دو گروه مستقل وجود دارد یا خیر. این رتبه بندی مشاهدات را در بین گروه ها مقایسه می کند تا ببیند آیا یک گروه رتبه های بیشتری نسبت به گروه دیگر دارد یا خیر.
- آزمون کروسکال-والیس: مانند آنالیز واریانس (ANOVA)، این آزمون ناپارامتریک تعیین می کند که آیا میانه های سه یا چند گروه ترتیبی مستقل از نظر آماری معنی دار است یا خیر. این به شما امکان می دهد بدانید که آیا رتبه ها در گروه های مختلف احتمالاً یکسان است یا خیر.
- همبستگی رتبه اسپیرمن: ضریب همبستگی اسپیرمن درجه و جهت رابطه بین دو متغیر ترتیبی را اندازه گیری می کند. همبستگی یکنواخت بین رتبهبندیها را ارزیابی میکند و میتواند به شناسایی اینکه آیا روند مداومی در چگونگی تغییر متغیرها با هم وجود دارد یا خیر کمک کند.
- رگرسیون لجستیک ترتیبی: زمانی که نتیجه ترتیبی و دارای سطوح متعدد باشد، این تحلیل رگرسیون خاص مناسب است. این به درک روابط بین متغیرهای ترتیبی و در نظر گرفتن ماهیت مرتب آنها کمک می کند.
- آزمون Chi-Square Ordinal: این آزمون تعیین می کند که آیا بین دو یا چند متغیر ترتیبی ارتباط معناداری وجود دارد یا خیر. برای بررسی پیوندها و وابستگی ها در جداول احتمالی حاوی داده های ترتیبی بسیار مفید است.
- مدلهای لاجیت برای دادههای ترتیبی: مدلهای لاجیت دادههای ترتیبی ارتباطات بین متغیرها و نتایج مرتب شده را در حالی که فواصل غیر یکنواخت را در نظر میگیرند، ثبت میکنند. این احتمال تجمعی را برای دسته بندی نتایج محاسبه می کند. تأثیر پیشبینیکنندهها بر شانس دستهبندی با ضرایب قابل تفسیر آشکار میشود. این روش رگرسیون لجستیک را با ترتیب ذاتی داده های ترتیبی ترکیب می کند و استنتاج را برای نتایج رتبه بندی شده بهبود می بخشد.
تست های دیگری نیز وجود دارد، اما در بالا ذکر شد بیشتر برای داده های ترتیبی استفاده می شود.
کاربردهای داده های ترتیبی
داده های معمولی به دلیل توانایی آن در گرفتن روابط و ترجیحات مرتب شده بدون نیاز به فواصل مساوی بین دسته ها، کاربردهایی در زمینه های مختلف پیدا می کنند. در اینجا برخی از برنامه های کاربردی رایج آورده شده است:
- نظرسنجی ها و پرسشنامه ها: نظرسنجی های رضایت مشتری ممکن است از پاسخ دهندگان بخواهد که تجربه خود را به عنوان “ضعیف”، “خوب”، “عالی” رتبه بندی کنند.
- تحصیلات: سیستم های درجه بندی: حروفی مانند A، B، C و غیره دارای نظم ذاتی هستند. رتبه بندی کلاسی دانش آموزان بر اساس عملکرد.
- تحقیقات اقتصادی: وضعیت اجتماعی – اقتصادی را می توان به “پایین”، متوسط یا “بالا” متمایز کرد.
- بررسی محصول: بسیاری از پلتفرمهای آنلاین به کاربران اجازه میدهند تا کانالها یا خدمات را با استفاده از ستاره رتبهبندی کنند، که در آن 1 ستاره ممکن است محصول ضعیف و 5 ستاره نشاندهنده محصول عالی باشد.
- تست قابلیت استفاده: در فناوری و طراحی، آزمایش قابلیت استفاده ممکن است از شرکت کنندگان بخواهد که سهولت استفاده را در مقیاسی از “بسیار دشوار” تا “بسیار آسان” رتبه بندی کنند.
نتیجه گیری
دادههای ترتیبی ترکیبی منحصر به فرد از طبقهبندی طبقهبندی را با یک توالی معنیدار ارائه میدهند. اگرچه ممکن است فواصل عددی دقیقی را که دادههای نسبت یا فاصله ارائه میدهند ارائه نکند، اهمیت آن را نمیتوان دست کم گرفت.
مقاله های مرتبط:
1- مقایسه بین داده های اسمی / Nominal و داده های ترتیبی / Ordinal
2- روش های جمع آوری داده های کیفی
3- چرا Data Structures یا ساختارهای داده مهم هستند؟
4-داشبورد سازی در نرم افزار تبلو و تجسم داده ها