در این روش یک مدل احتمالی مشخص برای داده‌ها در نظر گرفته شده و سپس پارامترها برآورد می­شوند. در این گروه از الگوریتم­ها یک مدل چگالی آمیخته مطرح می­ شود و فرض می­ شود که داده‌ها از مخلوط شدن تعدادی منبع داده به وجود آمده­اند. هر یک از این منابع یک خوشه بالقوه در نظر گرفته می­ شود.

( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

۳- خوشه‌بندی مبتنی بر بخش‌بندی[۹۸]
نام دیگر این روش خوشه‌بندی بر مبنای تابع هدف است که در آن اساس کار فرمول­بندی تابع هدف می­باشد. تابع هدف حاصل باید طبیعت مسئله را به خوبی نشان دهد تا بتوان از طریق کمینه­سازی آن، ساختار معنی­داری (خوشه‌ها) را در داده‌های مفروض آشکار ساخت. معروف­ترین و ساده­ترین الگوریتم خوشه‌بندی مبتنی بر بخش‌بندی، الگوریتم K-means است. این الگوریتم به خاطر سادگی اجرا، سادگی برنامه و کارایی آن استفاده فراوانی دارد [۱]. عملکرد کلی این روش به این صورت است که هدف ایجاد K خوشه است، بدین ترتیب که عناصر درون هر خوشه نسبت به میانگین رکوردهای آن خوشه که مرکز نامیده می­ شود بیشترین شباهت و با مراکز دیگر خوشه‌ها بیشترین عدم شباهت را داشته باشند.
۲-۸-۵-۵-۲- معیارهای ارزیابی در خوشه‌بندی
تکنیک­های خوشه‌بندی برای تخصیص هر داده به خوشه مربوطه بر اساس یکی از معیارهای شباهت[۹۹] و یا عدم شباهت[۱۰۰] (یا فاصله) عمل می­ کنند. داده، در صورتی که بیشترین شباهت را با داده‌های یک خوشه و یا بیشترین فاصله را با خوشه­های دیگر داشته باشد، به خوشه منتسب می­ شود.
زمانی که مشاهدات به گونه‌ای خوشه‌بندی شوند که هر خوشه در حداکثر تراکم باشد و حداکثر فاصله را با دیگر خوشه‌ها داشته باشند، خوشه بندی خوبی انجام‌گرفته است [۱۱].
معیار شباهت، معیاری عددی است که میزان شباهت دو شیء داده را نسبت به یکدیگر نشان می‌دهد. هر چقدر دو شیء به یکدیگر شبیه­تر باشند این معیار مقدار بالاتری دارد و معمولاً مقداری بین ۰ و ۱ دارد. معیارهای ارزیابی شباهت در جدول ۲-۶ نشان داده شده است.
n: تعداد ابعاد (ویژگی‌های) ورودی، p و q: اشیاء داده ورودی، pk و qk: kامین ویژگی یا شیء داده ورودی می­باشند.
جدول ۲-۶ معیارهای محاسبه شباهت در خوشه‌بندی

نام معیار
فرمول محاسبه
کسین[۱۰۱]

d1 و d2 دو بردار متن می­باشند

جاکارد[۱۰۲]

معیار فاصله نیز مقداری عددی است که میزان تفاوت دو شیء داده را نشان می‌دهد. هر چقدر دو شیء داده به یکدیگر شبیه­تر باشند این معیار مقدار پایین­تری خواهد داشت. معیارهای ارزیابی فاصله در جدول ۲-۷ ارائه شده است.
جدول ۲-۷ معیارهای محاسبه فاصله در خوشه‌بندی

نام معیار
فرمول محاسبه
فاصله اقلیدسی
مینکوسکی
سیتی بلاک[۱۰۳] یا مانهاتان
if r=1
ماهالانوبیس[۱۰۴]

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...