۳- مدل‌های مشاهده‌ای (تجربی)
مدل‌های آنالیتیکی مدل‌هایی هستند که معمولاً راه‌حل های آنالیتیکی یا مشابه آنالیتیکی دارند که اغلب بدون کمک کامپیوتر توسعه می‌یابند. مدل‌های آنالیتیکی از اهمیت بالایی برخوردارند چون زمانی که به کار می‌رود، تفهیم کاملی از سیستم به دست می‌دهد. اما کاربرد آن محدود است چراکه بسیاری از فرایندهای مواد غذایی بسیار پیچیده هستند که استفاده از چنین مدل‌هایی را توصیف کنند.
مدل‌های شمارشی یا کامپیوتری عموماً شامل یک سری معادلات دیفرانسیل است که فیزیک مدل را بسیار دقیق‌تر از مدل‌های آنالیتیکی توصیف می‌کند.
در مدل‌های آنالیتیکی و شمارشی فرض شده که مدل (توصیف فرایند) شناخته شده است و سعی می‌شود تا رفتار جزئی سیستم مشخص شود. غالباً مشخص کردن مدل در مرحله اول بسیار مشکل است؛ از این جهت که محقق باید یک مدل را از داده‌های اندازه‌گیری شده استنتاج نماید. این مدل‌ها که از درون‌بینی[۲۴] یا مشاهده و یا هر دو ناشی می‌شود، می‌تواند مدل‌های مشاهده‌ای یا تجربی نامیده شود. چنین مدل‌هایی به این جهت استفاده می‌شوند تا داده‌ها را طبقه‌بندی و دسته‌بندی کنند تا اندازه‌گیری‌ها تعمیم داده شوند و درباره مشاهدات جدید پیشگویی انجام شود. یک مثال از این نوع مدل، مدل شبکه عصبی است. این مدل‌ها به راحتی پیشگویی را بر اساس داده‌های شناخته شده بدون اندازه‌گیری فرایند اساسی انجام می‌دهند. بنابراین آنها می‌توانند به راحتی فرایندهای پیچیده را مدل سازی کنند اما محدودیت‌هایی نیز دارند.

( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

۲-۵-۱- رگرسیون و روش‌های آن

واژه رگرسیون[۲۵] از دید آمار و ریاضیات برای رساندن مفهوم «بازگشت به یک مقدار متوسط یا میانگین» به کار می رود. بدین معنی که برخی پدیده‌ها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل می‌کنند. در واقع، تحلیل رگرسیونی، تکنیکی آماری برای بررسی و مدل سازی ارتباط بین متغیرها است.
رگرسیون تقریباً در همه علوم مختلف برای برآورد و پیش‌بینی مورد نیاز است. می‌توان گفت تحلیل رگرسیونی، پرکاربردترین روش در بین تکنیک‌های آماری است. امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به روابط بین متغیرها به کار برده‌ می‌شود. به طور خلاصه در یک تحلیل رگرسیونی ساده، ابتدا تحلیل‌گر حدس می‌زند که بین دو متغیر نوعی ارتباط وجود دارد، در حقیقت حدس می‌زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع آوری اطلاعات کمی از دو متغیر می‌پردازد و این داده‌ها را به صورت نقاطی در یک نمودار دو بعدی رسم می‌کند.
در صورتی که نمودار نشان دهنده این باشد که داده‌ها تقریباً (نه لزوماً دقیق) در امتداد یک خط مستقیم پراکنده شده‌اند، حدس تحلیل‌گر تأیید شده و این ارتباط خطی به صورت زیر نمایش داده می‌شود:
y = a x + b
(معادله ۲-۱)
که در آن، a عرض از مبدأ و b شیب این خط است.
زمانی که بین برخی از نقاط و تصویر آنها بر روی خط رگرسیونی (خط y) کمی تفاوت به چشم می‌خورد، از آن به عنوان خطای برآورد یاد می‌شود. این خطا ممکن است از خطا در اندازه‌گیری، شرایط محیط، تفاوت‌های طبیعی و… ناشی شده باشد. بنابراین معادله اولیه به صورت زیر اصلاح می‌شود:
y = ax + b + є
(معادله ۲-۲)
معادله بالا یک مدل رگرسیون خطی نامیده می‌شود. معمولاً به x، متغیر مستقل (رگرسیونی) و به y، متغیر وابسته (پاسخ) گفته می­ شود. є، خطای تصادفی است که برای کامل شدن مدل و نشان دادن این که خطا نیز تا حدی وجود دارد در نظر گرفته می‌شود.
معمولاً فرض می‌شود که خطاها یکدیگر را خنثی می‌کنند، به عبارت دیگر مجموع خطاها برابر صفر است. همچنین فرض می‌شود خطای موجود در یک مشاهده رابطه‌ای با خطاهای دیگر ندارد و در نهایت تغییرات بین خطاها ثابت در نظر گرفته می‌شود. این سه فرض برای ساختن یک مدل ضروری است و روش‌های بسیاری برای پی بردن به وجود (یا عدم برقراری) این فرض‌ها وجود دارد. یکی از دلایل استفاده‌های نادرست از رگرسیون معمولاً نادیده گرفتن این فرض‌ها است که موجب استدلال‌های غلط خواهد شد.
در صورتی که در مدل رگرسیونی فقط یک متغیر مستقل وجود داشته باشد، مدل را مدل رگرسیونی خطی ساده می‌نامند. کافی است پارامترهای مجهول مدل (a و b) برآورد شوند. برآورد پارامترها در مدل سازی با بهره گرفتن از روش‌های مختلف انجام می‌شود از جمله روش کمترین مربع خطا. روش کمترین مربع خطا که یکی از روش های مورد استفاده در تحلیل رگرسیونی است اولین بار توسط لژندر[۲۶] ریاضیدان فرانسوی در سال ۱۸۰۵ و گوس[۲۷] ریاضیدان مشهور آلمانی در سال ۱۸۰۹ معرفی و در مطالعات نجومی به کار برده شد.
مدل رگرسیون خطی فرض می‌کند که یک رابطه خطی (یا خط مستقیم) بین متغیر وابسته و هر پیشگو وجود دارد. این رابطه در فرمول زیر توضیح داده شده است.
yi = b0 + b1xi1 + … + bpxip + ei
(معادله ۲-۳)
که در آن
yi: مقدار مورد iام متغیر کمی وابسته است.
p: تع
داد پیشگوها می‌باشد.
bj: مقدار ضریب jام است، j= 0 , … , p
Xij: مقدار مورد iام از پیشگوی jام می‌باشد.
ei: خطای در مقدار مشاهده شده برای مورد iام است.
مدل خطی است زیرا با افزایش مقدار پیشگوی jام با یک واحد باعث افزایش مقدار وابسته واحدهای bi می‌شود. b0 عرض از مبدأ است، که وقتی مقدار هر پیشگو برابر صفر می‌شود، b0 مقدار مدل پیشگوی متغیر وابسته می‌باشد.
به منظور آزمایش فرضیه‌های مربوط به مقادیر پارامترهای مدل، مدل رگرسیون خطی نیز فرضیات زیر را در نظر می‌گیرد:
ـ عبارت خطا یک توزیع نرمال با میانگین صفر دارد.
ـ واریانس عبارت خطا در سرتاسر موارد ثابت می‌باشد و از متغیرها در مدل مستقل است. یک عبارت خطا با واریانس غیرثابت را heteroscedastic می‌نامند.
ـ مقدار عبارت خطا برای یک مورد داده شده مستقل از مقادیر متغیرها در مدل و مستقل از مقادیر عبارت خطا برای موارد دیگر می‌باشد.
رگرسیون لوجستیک یک مدل آماری رگرسیون برای متغیرهای وابسته دوسویی مانند بیماری یا سلامت، مرگ یا زندگی است. این مدل را می‌توان به عنوان مدل خطی تعمیم ‌یافته‌ای که از تابع لوجیت به عنوان تابع پیوند استفاده می‌کند و خطایش از توزیع چندجمله‌ای پیروی می‌کند، به‌حساب‌آورد.
رگرسیون لوجستیک یکی از تکنیک‌های کاربردی برای تحلیل داده‌های طبقه‌بندی شده است. بعنوان نمونه اگر نتیجه آزمایشی را به‌صورت برد/باخت تعریف کنیم، در این حالت متغیر پاسخ دیگر پیوسته نبوده، بلکه بصورت طبقه‌بندی شده خواهد بود. یکی از اقسام رگرسیون لوجستیک، مدل رگرسیون لوجستیک باینری بوده که تعداد طبقه‌بندی‌های متغیر پاسخ در این مدل دوتاست. اگر این تعداد طبقه‌بندی‌ها بیش از دو تا باشد، آنگاه با توجه به جنس متغیر پاسخ (یعنی اسمی و ترتیبی) مدل‌های رگرسیون لوجستیک اسمی و ترتیبی حاصل می‌‌شود. رگرسیون لوجستیک تا اواسط دهه ۴۰ میلادی توسعه نیافته بود و تا دهه ۷۰ میلادی نیز کمتر استفاده می‌شد، اما هم اکنون کاربردهای فراوانی از آن دیده می‌شود. رگرسیون لوجستیک یکی از تکنیک‌های کاربردی جهت تحلیل داده‌های طبقه‌بندی شده است. این تکنیک با توجه به نوع و تعداد طبقه‌بندی‌های متغیر پاسخ به سه دسته باینری، اسمی و ترتیبی تقسیم می‌شود (بشیری و کامران راد،۱۳۹۰)

۲-۵-۲- تابع سیگموئید

تابع سیگموئید یک تابع ریاضی “S” شکل می‌باشد (منحنی سیگموئید). در اغلب موارد تابع سیگموئید به تابع خاصی اشاره می‌کند که در شکل شماره ۲-۳ نشان داده شده است.
شکل ۲-۳- تابع سیگموئید
از جمله توابع سیگموئیدی می‌توان از ریچارد[۲۸] (جنرال لوجستیک)، گمپرتز[۲۹]، لوجستیک[۳۰] و ویبول[۳۱] را نام برد.
انتگرال هر تابع صاف، مثبت و زنگی شکل، یک تابع سیگموئید خواهد بود. بنابراین توابع توزیع تجمعی برای بسیاری از توزیع‌های احتمالی مشترک سیگموئید هستند.
تابع f(xi) از چند گروه مدل منحنی‌های مشابه انتخاب می‌شود، در جدول ۲-۲ برخی ازمعادله‌های منحنی S شکل[۳۲] آورده شده است. تابع لجستیک متقارن است، در تابع گمپرتز سرعتی که به بی‌نهایت می‌رود کم می‌شود و تابع ریچارد با تغییر متغیر d این کاهش سرعت را تنظیم می‌کند (مهاجر، ۱۳۹۲).
جدول ۲-۲- خصوصیات برخی از معادله‌های منحنی S شکل

در ریاضیات، تابع گاوسی (نام گذاری شده به نام کارل فریدریش گاوس)، تابعی ا‌ست به شکل نمایی که به صورت زیر تعریف می‌شود:
(معادله ۲-۴)
که در آنa ، b و c ضرایب ثابت حقیقی و e، عدد اولیر است. شکل این تابع زنگوله‌ای متقارن است که به سرعت به صفر نزول می‌کند. ثابت a تعیین کننده ارتفاع قله منحنی،b تعیین کننده محل مرکز قله و c (انحراف معیار) تعیین کننده میزان کشیدگی یا پهن شدگی زنگوله است. تابع گاوسی در علوم احتمال، آمار و هوش مصنوعی و به ویژه در توزیع نرمال، استفاده فراوان دارد (فرمانی و همکاران، ۱۳۸۴).
منحنی یا تابع گمپرتز یکی از توابع کاربردی می‌باشد که یک تابع سیگموئیدی می‌باشد. این تابع، غیرخطی است و می‌توان از آن در پیش بینی بسیاری از موارد تولید مورد استفاده قرار گیرد .تابع گمپرتز اغلب در تحقیقات کاربردی از جمله زیست شناسی، کشاورزی، محاسبات، مهندسی، فیزیک، شیمی، آمار، پزشکی، اقتصاد، . . . کاربرد دارد. این توابع دارای پارامترهای مجهول می‌باشد که چندین روش برای برآورد این پارامترها به کار رفته ا
ست (مارانی، ۱۳۹۱).

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...