مرحله چهارم، داده‌کاوی: در این مرحله از الگوریتم‌های داده‌کاوی برای ساخت مدل استفاده می‌شود. تعدادی از الگوریتم‌های داده‌کاوی در همین فصل توضیح داده شده‌اند.

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

مرحله پنجم، ارزیابی و بازنمایی: در این مرحله دقت هر الگوریتم‌ ارزیابی می‌شود. به‌عبارت دیگر تشخیص الگوهای صحیح مورد نظر، از سایر الگوها در این مرحله انجام می‌شود و صحت الگوها بر اساس معیارهایی سنجیده می‌شود.
مرحله ششم، دانش: دانش به‌دست آمده از الگوریتم‌ها به روشی که برای انسان قابل درک باشد، بیان می‌شود.
فرایند CRISP – DM [۳۵]
روش‌های گوناگونی برای پیاده‌سازی و اجرای پروژ‌ه‌های داده‌کاوی وجود دارد. استفاده از این روش‌ها باعث می‌شود، داده‌کاو مدیریت بهتری بر روی پروژه مورد بررسی خود داشته باشد. یکی از روش‌های بسیار قوی و رایج در ادبیات داده‌کاوی فرایند CRISP-DM است. این فرایند استانداردی جهانی برای انجام پروژه‌های کاربردی در داده‌کاوی است که از شش فاز به صورت یک روند حلقه‌ای تشکیل شده است. شکل ۲-۳ نحوه قرار گرفتن این شش فاز را در این مدل نمایش می‌دهد (شهرابی ۱۳۹۰a).
شکل ‏۲‑۳ : فرایند CRISP-DM
فاز اول – درک فضای کسب و کار[۳۶]
در این فاز تمرکز اصلی بر روی تعیین اهداف پروژه و نیازهای وابسته به آن است که از منظر کسب ‌وکار مطرح می‌شود. در واقع در این فاز سعی می‌شود با توجه به نیازهای سازمان و خواسته‌های مورد انتظار از سازمان مسئله‌ای تعریف گردد. سپس مسئله‌ی تعریف شده به صورتی تبدیل می‌شود تا تکنیک‌های داده‌کاوی در آن قابل اجرا باشد. به‌عبارت دیگر، برای این‌که داده‌کاو فعالیت خود را آغاز کند، نیاز دارد با محیط و فرآیندها آشنا شود. هدف تحلیل‌گر کشف شاخص مهمی در آغاز پروژه است که می‌تواند در خروجی نهایی تأثیرگذار باشد. این فاز از چهار زیرفاز زیر تشکیل شده است:

    1. تعیین اهداف تجاری
    1. ارزیابی موقعیت
    1. تعیین اهداف پروژه داده‌کاوی
    1. تهیه برنامه پروژه

فاز دوم – درک داده‌ها[۳۷]
مواد اولیه یک پروژه داده‌کاوی داده‌ها هستند. این فاز با جمع‌ آوری داده‌های اولیه آغاز می‌شود. سپس به منظور دست‌یابی به یک درک اولیه از داده‌ها و شناسایی مشکلات تاثیرگذار بر روی کیفیت آن‌ها پردازش‌هایی بر روی داده‌ها انجام می‌شود. پردازش‌های انجام شده بر روی داده‌ها باعث می‌شود، یک فرضیه جالب از داده‌ها به منظور کشف اطلاعات پنهان شکل گیرد. این فاز از چهار مرحله تشکیل شده است که عبارت‌اند از:

    1. جمع‌ آوری داده‌ها
    1. تشریح و توصیف داده‌ها
    1. کاوش داده‌ها
    1. اعتبارسنجی کیفیت داده‌ها

فاز سوم – آماده‌سازی داده‌ها[۳۸]
تمام فعالیت‌هایی که باعث ساخت مدل از روی داده‌های اولیه می‌شود، توسط این فاز پوشش داده می‌شود. این فاز طولانی‌ترین مرحله در فرایند CRISP-DM است. ایجاد جدول، انتخاب ویژگی و رکوردها با توجه به هدف تعیین شده و همچنین تبدیل و تمیز کردن داده‌ها برای استفاده در مدل از جمله وظایفی است که در این فاز انجام می‌شود. این وظایف در قالب زیرفازهای زیر انجام می‌شود:

    1. انتخاب داده‌ها
    1. پاکسازی داده‌ها
    1. ساختاردهی داده‌ها
    1. یکپارچه‌سازی داده‌ها
    1. تنظیم فرمت داده‌ها

فاز چهارم – مدل‌سازی[۳۹]
هدف اصلی پروژه داده‌کاوی این فاز است. در این فاز تکنیک‌های مختلفی جهت آنالیز داده‌ها و استخراج دانش از آن‌ها به کار گرفته می‌شود، سپس کاراترین مدل انتخاب می‌شود. در برخی از مواقع برای استفاده از الگوریتمی خاص در مدل‌سازی، لازم است شکل داده تغییر پیدا کند. در نتیجه این فاز با فاز آماده‌سازی داده‌ها در ارتباط است. این فاز از چهار زیرفاز زیر تشکیل شده است:

    1. انتخاب تکنیک‌های ساخت مدل
    1. طراحی آزمایش‌ها
    1. ساخت مدل
    1. ارزیابی مدل

فاز پنجم – ارزیابی [۴۰]
پس از انتخاب مدل، در این فاز به بررسی و ارزیابی این موضوع پرداخته می‌شود که آیا نتایج آنالیز داده‌ها ما را در رسیدن به اهداف کسب و کار یاری می‌کنند؟ در این فاز، دانش به‌دست آمده در فاز چهار مورد تجزیه و تحلیل قرار می‌گیرد تا میزان سودمندی و کاربرد آن مشخص شود. به‌عنوان مثال در مورد مدل‌های پیش‌بینی کننده، دقت مدل با بهره گرفتن از داده‌های آزمون تعیین می‌شود تا در صورت تایید نتایج حاصل به‌کار گرفته شود. در پایان این فاز تصمیمی در رابطه با بهره گرفتن از نتایج داده‌کاوی گرفته می‌شود. مراحل این فاز عبارتند از:

    1. ارزیابی نتایج
    1. مرور فرایند داده‌کاوی
    1. تعیین گام‌های بعدی

فاز ششم – توسعه [۴۱]
در این فاز سود حاصل از سرمایه‌گذاری انجام شده در مراحل قبلی به‌دست می‌آید. تمرکز این فاز روی یکپارچه‌سازی دانش در فرآیندهای کسب و کار است به‌گونه‌ای که مسائل اساسی کسب و کار حل شود. با این حال، این فاز می‌تواند به سادگی تهیه یک گزارش ساده و یا به پیچیدگی تکرار اجرای فرایند داده‌کاوی در گستره سازمان باشد. در بیشتر موارد این مشتری است که گام‌های این فاز را انجام می‌دهد و البته برای مشتری مهم است که بداند که چه اقداماتی در جهت به اجرا درآوردن مدل‌های ایجاد شده انجام دهد. این فاز از چهار مرحله تشکیل شده است که عبارت است از:

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...