طرح های پژوهشی انجام شده در مورد مدل سازی … – منابع مورد نیاز برای مقاله و پایان نامه : دانلود پژوهش های پیشین |
۳- مدلهای مشاهدهای (تجربی)
مدلهای آنالیتیکی مدلهایی هستند که معمولاً راهحل های آنالیتیکی یا مشابه آنالیتیکی دارند که اغلب بدون کمک کامپیوتر توسعه مییابند. مدلهای آنالیتیکی از اهمیت بالایی برخوردارند چون زمانی که به کار میرود، تفهیم کاملی از سیستم به دست میدهد. اما کاربرد آن محدود است چراکه بسیاری از فرایندهای مواد غذایی بسیار پیچیده هستند که استفاده از چنین مدلهایی را توصیف کنند.
مدلهای شمارشی یا کامپیوتری عموماً شامل یک سری معادلات دیفرانسیل است که فیزیک مدل را بسیار دقیقتر از مدلهای آنالیتیکی توصیف میکند.
در مدلهای آنالیتیکی و شمارشی فرض شده که مدل (توصیف فرایند) شناخته شده است و سعی میشود تا رفتار جزئی سیستم مشخص شود. غالباً مشخص کردن مدل در مرحله اول بسیار مشکل است؛ از این جهت که محقق باید یک مدل را از دادههای اندازهگیری شده استنتاج نماید. این مدلها که از درونبینی[۲۴] یا مشاهده و یا هر دو ناشی میشود، میتواند مدلهای مشاهدهای یا تجربی نامیده شود. چنین مدلهایی به این جهت استفاده میشوند تا دادهها را طبقهبندی و دستهبندی کنند تا اندازهگیریها تعمیم داده شوند و درباره مشاهدات جدید پیشگویی انجام شود. یک مثال از این نوع مدل، مدل شبکه عصبی است. این مدلها به راحتی پیشگویی را بر اساس دادههای شناخته شده بدون اندازهگیری فرایند اساسی انجام میدهند. بنابراین آنها میتوانند به راحتی فرایندهای پیچیده را مدل سازی کنند اما محدودیتهایی نیز دارند.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
۲-۵-۱- رگرسیون و روشهای آن
واژه رگرسیون[۲۵] از دید آمار و ریاضیات برای رساندن مفهوم «بازگشت به یک مقدار متوسط یا میانگین» به کار می رود. بدین معنی که برخی پدیدهها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل میکنند. در واقع، تحلیل رگرسیونی، تکنیکی آماری برای بررسی و مدل سازی ارتباط بین متغیرها است.
رگرسیون تقریباً در همه علوم مختلف برای برآورد و پیشبینی مورد نیاز است. میتوان گفت تحلیل رگرسیونی، پرکاربردترین روش در بین تکنیکهای آماری است. امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به روابط بین متغیرها به کار برده میشود. به طور خلاصه در یک تحلیل رگرسیونی ساده، ابتدا تحلیلگر حدس میزند که بین دو متغیر نوعی ارتباط وجود دارد، در حقیقت حدس میزند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع آوری اطلاعات کمی از دو متغیر میپردازد و این دادهها را به صورت نقاطی در یک نمودار دو بعدی رسم میکند.
در صورتی که نمودار نشان دهنده این باشد که دادهها تقریباً (نه لزوماً دقیق) در امتداد یک خط مستقیم پراکنده شدهاند، حدس تحلیلگر تأیید شده و این ارتباط خطی به صورت زیر نمایش داده میشود:
y = a x + b
(معادله ۲-۱)
که در آن، a عرض از مبدأ و b شیب این خط است.
زمانی که بین برخی از نقاط و تصویر آنها بر روی خط رگرسیونی (خط y) کمی تفاوت به چشم میخورد، از آن به عنوان خطای برآورد یاد میشود. این خطا ممکن است از خطا در اندازهگیری، شرایط محیط، تفاوتهای طبیعی و… ناشی شده باشد. بنابراین معادله اولیه به صورت زیر اصلاح میشود:
y = ax + b + є
(معادله ۲-۲)
معادله بالا یک مدل رگرسیون خطی نامیده میشود. معمولاً به x، متغیر مستقل (رگرسیونی) و به y، متغیر وابسته (پاسخ) گفته می شود. є، خطای تصادفی است که برای کامل شدن مدل و نشان دادن این که خطا نیز تا حدی وجود دارد در نظر گرفته میشود.
معمولاً فرض میشود که خطاها یکدیگر را خنثی میکنند، به عبارت دیگر مجموع خطاها برابر صفر است. همچنین فرض میشود خطای موجود در یک مشاهده رابطهای با خطاهای دیگر ندارد و در نهایت تغییرات بین خطاها ثابت در نظر گرفته میشود. این سه فرض برای ساختن یک مدل ضروری است و روشهای بسیاری برای پی بردن به وجود (یا عدم برقراری) این فرضها وجود دارد. یکی از دلایل استفادههای نادرست از رگرسیون معمولاً نادیده گرفتن این فرضها است که موجب استدلالهای غلط خواهد شد.
در صورتی که در مدل رگرسیونی فقط یک متغیر مستقل وجود داشته باشد، مدل را مدل رگرسیونی خطی ساده مینامند. کافی است پارامترهای مجهول مدل (a و b) برآورد شوند. برآورد پارامترها در مدل سازی با بهره گرفتن از روشهای مختلف انجام میشود از جمله روش کمترین مربع خطا. روش کمترین مربع خطا که یکی از روش های مورد استفاده در تحلیل رگرسیونی است اولین بار توسط لژندر[۲۶] ریاضیدان فرانسوی در سال ۱۸۰۵ و گوس[۲۷] ریاضیدان مشهور آلمانی در سال ۱۸۰۹ معرفی و در مطالعات نجومی به کار برده شد.
مدل رگرسیون خطی فرض میکند که یک رابطه خطی (یا خط مستقیم) بین متغیر وابسته و هر پیشگو وجود دارد. این رابطه در فرمول زیر توضیح داده شده است.
yi = b0 + b1xi1 + … + bpxip + ei
(معادله ۲-۳)
که در آن
yi: مقدار مورد iام متغیر کمی وابسته است.
p: تع
داد پیشگوها میباشد.
bj: مقدار ضریب jام است، j= 0 , … , p
Xij: مقدار مورد iام از پیشگوی jام میباشد.
ei: خطای در مقدار مشاهده شده برای مورد iام است.
مدل خطی است زیرا با افزایش مقدار پیشگوی jام با یک واحد باعث افزایش مقدار وابسته واحدهای bi میشود. b0 عرض از مبدأ است، که وقتی مقدار هر پیشگو برابر صفر میشود، b0 مقدار مدل پیشگوی متغیر وابسته میباشد.
به منظور آزمایش فرضیههای مربوط به مقادیر پارامترهای مدل، مدل رگرسیون خطی نیز فرضیات زیر را در نظر میگیرد:
ـ عبارت خطا یک توزیع نرمال با میانگین صفر دارد.
ـ واریانس عبارت خطا در سرتاسر موارد ثابت میباشد و از متغیرها در مدل مستقل است. یک عبارت خطا با واریانس غیرثابت را heteroscedastic مینامند.
ـ مقدار عبارت خطا برای یک مورد داده شده مستقل از مقادیر متغیرها در مدل و مستقل از مقادیر عبارت خطا برای موارد دیگر میباشد.
رگرسیون لوجستیک یک مدل آماری رگرسیون برای متغیرهای وابسته دوسویی مانند بیماری یا سلامت، مرگ یا زندگی است. این مدل را میتوان به عنوان مدل خطی تعمیم یافتهای که از تابع لوجیت به عنوان تابع پیوند استفاده میکند و خطایش از توزیع چندجملهای پیروی میکند، بهحسابآورد.
رگرسیون لوجستیک یکی از تکنیکهای کاربردی برای تحلیل دادههای طبقهبندی شده است. بعنوان نمونه اگر نتیجه آزمایشی را بهصورت برد/باخت تعریف کنیم، در این حالت متغیر پاسخ دیگر پیوسته نبوده، بلکه بصورت طبقهبندی شده خواهد بود. یکی از اقسام رگرسیون لوجستیک، مدل رگرسیون لوجستیک باینری بوده که تعداد طبقهبندیهای متغیر پاسخ در این مدل دوتاست. اگر این تعداد طبقهبندیها بیش از دو تا باشد، آنگاه با توجه به جنس متغیر پاسخ (یعنی اسمی و ترتیبی) مدلهای رگرسیون لوجستیک اسمی و ترتیبی حاصل میشود. رگرسیون لوجستیک تا اواسط دهه ۴۰ میلادی توسعه نیافته بود و تا دهه ۷۰ میلادی نیز کمتر استفاده میشد، اما هم اکنون کاربردهای فراوانی از آن دیده میشود. رگرسیون لوجستیک یکی از تکنیکهای کاربردی جهت تحلیل دادههای طبقهبندی شده است. این تکنیک با توجه به نوع و تعداد طبقهبندیهای متغیر پاسخ به سه دسته باینری، اسمی و ترتیبی تقسیم میشود (بشیری و کامران راد،۱۳۹۰)
۲-۵-۲- تابع سیگموئید
تابع سیگموئید یک تابع ریاضی “S” شکل میباشد (منحنی سیگموئید). در اغلب موارد تابع سیگموئید به تابع خاصی اشاره میکند که در شکل شماره ۲-۳ نشان داده شده است.
شکل ۲-۳- تابع سیگموئید
از جمله توابع سیگموئیدی میتوان از ریچارد[۲۸] (جنرال لوجستیک)، گمپرتز[۲۹]، لوجستیک[۳۰] و ویبول[۳۱] را نام برد.
انتگرال هر تابع صاف، مثبت و زنگی شکل، یک تابع سیگموئید خواهد بود. بنابراین توابع توزیع تجمعی برای بسیاری از توزیعهای احتمالی مشترک سیگموئید هستند.
تابع f(xi) از چند گروه مدل منحنیهای مشابه انتخاب میشود، در جدول ۲-۲ برخی ازمعادلههای منحنی S شکل[۳۲] آورده شده است. تابع لجستیک متقارن است، در تابع گمپرتز سرعتی که به بینهایت میرود کم میشود و تابع ریچارد با تغییر متغیر d این کاهش سرعت را تنظیم میکند (مهاجر، ۱۳۹۲).
جدول ۲-۲- خصوصیات برخی از معادلههای منحنی S شکل
در ریاضیات، تابع گاوسی (نام گذاری شده به نام کارل فریدریش گاوس)، تابعی است به شکل نمایی که به صورت زیر تعریف میشود:
(معادله ۲-۴)
که در آنa ، b و c ضرایب ثابت حقیقی و e، عدد اولیر است. شکل این تابع زنگولهای متقارن است که به سرعت به صفر نزول میکند. ثابت a تعیین کننده ارتفاع قله منحنی،b تعیین کننده محل مرکز قله و c (انحراف معیار) تعیین کننده میزان کشیدگی یا پهن شدگی زنگوله است. تابع گاوسی در علوم احتمال، آمار و هوش مصنوعی و به ویژه در توزیع نرمال، استفاده فراوان دارد (فرمانی و همکاران، ۱۳۸۴).
منحنی یا تابع گمپرتز یکی از توابع کاربردی میباشد که یک تابع سیگموئیدی میباشد. این تابع، غیرخطی است و میتوان از آن در پیش بینی بسیاری از موارد تولید مورد استفاده قرار گیرد .تابع گمپرتز اغلب در تحقیقات کاربردی از جمله زیست شناسی، کشاورزی، محاسبات، مهندسی، فیزیک، شیمی، آمار، پزشکی، اقتصاد، . . . کاربرد دارد. این توابع دارای پارامترهای مجهول میباشد که چندین روش برای برآورد این پارامترها به کار رفته ا
ست (مارانی، ۱۳۹۱).
فرم در حال بارگذاری ...
[چهارشنبه 1401-04-15] [ 01:43:00 ق.ظ ]
|