پایان نامه با فرمت word : خوشهبندی توافقی بر روی دادههای توزیع شده ناهمگن۹۴- … – منابع مورد نیاز برای مقاله و پایان نامه : دانلود پژوهش های پیشین |
(۳-۷)
شاخص DBK میانگین شباهت بین هر خوشه و شبیهترین خوشه به آن میباشد. مقادیر کوچک برای این شاخص فشردگی و تفکیک شدگی مناسب خوشهها را نشان میدهد. فشردگی بیشتر خوشهها و تفکیک شدگی مناسب آنها میتواند نشان دهندهی خوشهبندیای با کیفیت مناسب باشد. با کمینه نمودن شاخص DB میتوان تعداد خوشههای مناسب برای یک مجموعه دادهای را نیز تعیین نمود.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت nefo.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
مقداری که این شاخص به عنوان نتیجه بدست میآورد در بازهی مشخصی قرار ندارد. از اینرو، جهت قرار دادن مقادیر شاخص DB به ازاء هر خوشهبندی در یک بازهی مشخص، باید این مقادیر نرمال سازی شوند. ما از نرمال سازی Min-Max جهت محدود نمودن مقادیر شاخص DB در بازهی ۰٫۰۰۱ تا ۰٫۹۹۹ استفاده مینماییم. رابطه (۳-۸) نحوهی نرمال سازی شاخص DB را نشان میدهد:
(۳-۸)
در رابطه (۳-۸)، مقدار شاخص DB برای خوشهبندی πi با Ki خوشه میباشد.
همانطور که گفته شد مقدار کوچکتر برای شاخص DB نشاندهندهی خوشههایی با فشردگی و تفکیک شدگی بیشتر است. بنابراین جهت تعیین وزن هر خوشه با بهره گرفتن از شاخص DB به طوری که مقدار بزرگتر نشاندهندهی خوشهبندیای با کیفیت بالاتر باشد، وزن هر خوشهبندی به صورت رابطه (۳-۹) تعریف میگردد.
(۳-۹)
دلیل انتخاب بازهی ۰٫۰۰۱ تا ۰٫۹۹۹ به جای بازهی ۰ تا ۱ این است که خوشهبندیهایی با کیفیت پایینتر نسبت به دیگر خوشهبندیها، دارای وزن صفر نشوند و به طور کل هیچ تأثیری بر روی خوشهبندی نهایی نداشته باشند. به همین ترتیب خوشهبندیهایی با کیفیت بالاتر نسبت به دیگر خوشهبندیها، دارای وزن یک نشوند و تأثیر مطلقی بر روی خوشهبندی نهایی داشته باشند. به عبارت دیگر تعیین چنین بازهای به منظور ایجاد تعادل بین تأثیر گذاری رأی خوشهبندیهایی با کیفیت پایینتر و خوشهبندیهایی با کیفیت بالاتر در خوشهبندی نهایی است.
همانطور که در فصل قبل به آن اشاره گردید یکی از ویژگیهایی که اغلب روشهای خوشهبندی توافقی دارا میباشند، عدم نیاز به صفات خاصهی (ویژگیهای) دادههای اصلی جهت انجام خوشهبندی است. بنابراین ممکن است این ابهام به وجود آید که در روش پیشنهادی جهت محاسبهی وزن خوشهبندیها باید صفات خاصهی دادهها در دسترس باشند. از اینرو لازم به ذکر است که میتوان از منابعی که وظیفهی تولید خوشهبندیهای اولیه را به عهده دارند در خواست نمود تا شاخص DB را هم به عنوان نتیجهی خوشهبندی ارائه دهند. بدین صورت نیازی به صفات خاصهی دادهها جهت انجام خوشهبندی توافقی با بهره گرفتن از راهکار پیشنهادی نمیباشد.
۳-۲-۳- خوشهبندی توافقی بر روی داده های توزیع شده ناهمگن
در دو بخش قبل به بررسی نحوهی یافتن خوشههای نظیر به نظیر و چگونگی وزندار نمودن خوشهبندیها پرداخته شد. در این بخش قسمت اصلی کار یعنی الگوریتم خوشهبندی توافقی به صورت وزنی ارائه خواهد شد. در الگوریتم پیشنهادی جهت انجام خوشهبندی توافقی به ازاء هر یک از اشیاء داده برداری به صورت مورد استفاده قرار میگیرد. هر یک از ابعاد این بردار نشاندهندهی شماره خوشهای است که دادهی xi در یک خوشهبندی مشخص در آن قرار گرفته است. مجموعه دادههایی که الگوریتم بر روی آنها کار میکند نیز به صورت Y={y1, y2, …, yN} میباشد.
الگوریتم پیشنهادی از دو گام اصلی تشکیل شده است. در گام اول نمایندهی (مرکز) هر یک از خوشههای موجود تعیین میگردد. در گام دوم نیز هر یک از دادهها به خوشهای که کمترین فاصله را با نماینده آن خوشه دارند، تخصیص مییابند. نمایندهی هر خوشه در گام اول با بهره گرفتن از تشخیص اکثریت آراء به ازاء هر خوشهبندی، تعیین میگردد. در شکل ۳-۳ نحوهی تعیین نمایندهی یک خوشهی فرضی از خوشهبندی نهایی آورده شده است. در گام دوم نیز فاصلهی هر بردار yi با نمایندهی هر یک از خوشهها محاسبه میگردد. شبه کد الگوریتم خوشهبندی توافقی بر روی داده های توزیع شده ناهمگن[۱۵۲] ( COHD) در الگوریتم ۳-۳ آورده شده است.
π۳
π۲
π۱
۱
۱
۱
y1
فرم در حال بارگذاری ...
[چهارشنبه 1401-04-15] [ 05:23:00 ق.ظ ]
|