منابع پایان نامه با موضوع طراحی سامانه ی خبره ی فازی برای تشخیص دام … – منابع مورد نیاز برای مقاله و پایان نامه : دانلود پژوهش های پیشین |
شکل ۳-۶ نواحی مثبت، منفی، مرزی و تقریبهای مجموعه
۳-۵- انتخاب ویژگی[۱۴۹]
اغلب ویژگیهای زیادی در یک پایگاهداده وجود دارد. طبعاً انتظار میرود هرچه ویژگیهای بیشتری در نظر گرفته میشوند، اطلاعات کاملتری برای دستهبندی داشته باشیم. اما اگر همزمان با افزودن هر ویژگی، حجم مجموعه دادهی آموزشی[۱۵۰] زیاد نشود، این برداشت صحیح نخواهد بود. به این وضعیت اصطلاحاً «دردسر ابعادی»[۱۵۱] گفته می شود. در مجموعههای دادهای با ابعاد بالا، بیشتر ممکن است حالتی پیش بیاید که در آن داده کاوی الگوهای نادرستی را پیدا کند که عمومیت ندارند (Jensen, 2005).
مدیریت دانش، عنصر کلیدی در استخراج ارزش است. فرایند کشف دانش به ویژه کشف دانش در یک پایگاهداده، موضوع مهمی است. این فرایند از مراحل زیر تشکیل شده است (Düntsch, 2000):
-
- انتخاب داده[۱۵۲]
-
- پیش پردازش داده ها[۱۵۳]
-
- کاهش داده ها[۱۵۴]
-
- داده کاوی[۱۵۵]
-
- ارزشیابی[۱۵۶]
از آنجا که در اغلب موارد یک پایگاه داده فاقد منابع معنایی است، سومین گام از فرایند کشف دانش، یعنی کاهش ویژگیها، موضوع مهمی در هنگام مواجهه با حجم زیاد داده است (Jensen, 2005).
بسیاری روشها هستند که تا حدی به کاهش ابعاد داده کمک می کنند. ولی با توجه به آنچه گفته شد ما نیاز به روشی کارآمد و مؤثر برای کاهش ابعاد داده داریم. استفاده از نظریه مجموعههای ژولیده، رویکردی است که در این مرحله به سادگی مورد استفاده قرار میگیرد. کاهش ویژگی مجموعه ژولیده[۱۵۷] ابزاری را فراهم می کند که توسط آن دانش از اطلاعات قابل استخراج است. مزیت اصلی مجموعه ژولیده این است که هیچگونه پارامتر اضافهای را برای انجام عملیات لازم ندارد و تنها ساختار حبّهای[۱۵۸] داده های در دسترس را بکار میگیرد (Jensen and Shen, 2004). حبّه یک جزء بنیادی از دانش است که برای ما قابل درک است (Suraj, 2004). یک مجموعه دادهای با مقادیر گسسته در اختیار است. با بهره گرفتن از نظریهی مجموعههای ژولیده، یافتن زیرمجموعهای از ویژگیهای اصلی که بیشترین اطلاعات را در اختیار ما قرار میدهد و فاقد افزونگی است امکان پذیر است؛ این زیرمجموعه فروکاست[۱۵۹] نامیده می شود. سایر ویژگیها با از دست رفتن کمترین اطلاعات میتوانند از سامانه حذف شوند (Jensen and Shen, 2004).
یک موضوع مهم در بررسی داده ها، کشف وابستگی بین ویژگیها است. اگر تمام مقادیر مجموعه ویژگیهای Q با بهره گرفتن از مجموعه ویژگیهای Pمشخص گردد آنگاه Q کاملاً وابسته به مجموعه ویژگیهای P گفته می شود و با نماد نشان داده می شود. مفهوم وابستگی می تواند به صورت زیر تعریف گردد:
برای ، Q وابسته به P در درجه k نامیده می شود اگر:
(۳-۱۶)
این مفهوم با نماد نمایش داده می شود. اگر باشد، آنگاه Q کاملاً وابسته به P نامیده می شود؛ اگر ، آنگاه Q وابستهی جزئی به P از درجه k نامیده می شود و اگر باشد، آنگاه Q وابسته به P نخواهد بود (Jensen and Shen, 2000).
با محاسبهی تغییرات وابستگی، وقتی که یک ویژگی از ویژگیهای شرطی مجموعه حذف می شود، اندازه معنایی[۱۶۰] یک ویژگی به دست می آید. تغییر بالاتر در وابستگی نشاندهنده قابلیت معنایی بالاتر ویژگی است. فرض کنید P وQ و ویژگی داده شده است. معنای ویژگی به صورت زیر تعریف می شود:
(۳-۱۷)
۳-۶- فروکاستها و هسته[۱۶۱]
کاهش ویژگیها با مقایسه روابط همارزی تولید شده توسط مجموعههای ویژگیها به دست می آید. ویژگیها به گونه ای حذف میشوند که کیفیت طبقه بندی مجموعه کاهش یافته و مجموعه اصلی یکسان باشد.
یک فروکاست از مجموعه ویژگیهای اصلی به صورت زیر تعریف می شود:
فروکاست مجموعه ویژگی شرایط C نسبت به مجموعه ویژگی تصمیم D زیرمجموعه است که در دو شرط زیر صدق می کند (Jensen and Shen, 2000).
-
- حذف هر ویژگی شرط (۱) را تحت تأثیر قرار میدهد.
یک مجموعه از ویژگیها می تواند فروکاستهای مختلفی داشته باشد و بنابراین مجموعه تمام فروکاستها به صورت زیر قابل تعریف است:
(۳-۱۸)
اشتراک تمام مجموعههای R، هسته نامیده می شود، و ویژگیهایی را نشان میدهد که حذف آنها موجب به وجود آمدن تناقض در مجموعه دادهای می شود.
در مفهوم RSAR، فروکاست با کمترین تعداد عضو دارای اهمیت است. این فروکاست، فروکاست کمینه نامیده می شود و عبارت است از:
فرم در حال بارگذاری ...
[چهارشنبه 1401-04-15] [ 02:42:00 ق.ظ ]
|