۴-۴-۱-۱-مجموعه داده IRIS
این مجموعه در واقع مجموعه ­ای از داده ­ها می­باشد که شامل سه نمونه گل زنبق است که توسط فیشر[۵۸] در سال ۱۹۳۶ برای نشان دادن تکنیک­های خطی تفکیک­پذیر معرفی گردید. از این رو به نام مجموعه داده گل زنبق فیشر نیز خوانده می­ شود. از طرف دیگر، به دلیل این­که ادگار اندرسون[۵۹] نیز این مجموعه را به­ دلیل کیفیت تنوع جغرافیایی در شبه جزیره گاسپه، گردآوری کرده است، به مجموعه داده زنبق اندرسون نیز مشهور می­باشد.

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

شکل ۴-۱ نمونه های گلهای زنبق از مجموعه دادهIris.
این مجموعه شامل ۵۰ نمونه از سه نوع گل زنبق با نام­های سیتوسا [۶۰]، وریجینیکا[۶۱] و ورسیکولار[۶۲] می­باشد. شاخصه­هایی که در این مجموعه جهت اندازه ­گیری مد نظر می­باشند عبارت است: از پهنای گلبرگ، طول گلبرگ، پهنای کاسبرگ وطول کاسبرگ [۵۴].
شایان ذکر است که این شاخصه­ها بر حسب سانتیمتر می­باشند. بر اساس مدل خطی فیشر، این دسته از دادها به­عنوان یک دسته رایج از داده ­ها برای آزمایش تکنیک های کلاسه بندی در زمینه یادگیری ماشین مورد استفاده قرار می گیرد. با این وجود، استفاده از این داده ­ها برای آنالیز دسته­ها رایج نمی ­باشد. به­ دلیل این­که اطلاعات تنها حاوی دو دسته (خوشه) می­باشد که نسبتاً به راحتی قابل جداسازی هستند. یکی از دسته ها شامل گونه­ های سیتوسا است، در صورتی­که دو گونه ورجینیکا و ورسیکولار، تاحد زیادی دارای هم­پوشانی هستند و جداسازی آن بدون استفاده از اطلاعات گونه هایی که فیشر به­کار برده است، قابل جداسازی نمی ­باشد. بنابر این، این مجموعه داده مثال خوبی برای توصیف تفاوت بین روش­های با ناظر و بدون ناظر در داده کاوی است. به­عبارت دیگر، مدل خطی فیشر تنها زمانی که گونه های موجود ناشناخته باشند؛ به­دست می آید. در نهایت این مجموعه به ۳ خوشه تقسیم می­گردد.
جدول ۴-۲ مراکز خوشه به دست آمده با اجرای الگوریتم FCM-BA روی مجموعه دادهIris .

مراکز خوشه مجموعه دادهIris

مرکز خوشه اول

مرکز خوشه دوم

مرکز خوشه سوم

۵٫۸۸۹۰

۶٫۷۷۴۹

۵٫۰۰۳۶

۲٫۷۶۱۲

۳٫۰۵۲۴

۳٫۴۰۳۰

۴٫۳۶۴۰

۵٫۶۴۶۶

۱٫۴۸۵۰

۱٫۳۹۷۳

۲٫۰۵۳۵

۰٫۲۵۱۵

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...