پژوهش های کارشناسی ارشد با موضوع طراحی سیستم نظارت چهره … – منابع مورد نیاز برای مقاله و پایان نامه : دانلود پژوهش های پیشین |
استفاده از مجموع مربعات تفاضل (SSD) نیز برای محاسبه میزان شباهت قالب و پنجره جستجو رایج است. دقت روش SSD برای محاسبه میزان تطابق بیشتر از روش SAD میباشد. مقدار SSD از رابطه (۷) قابل محاسبه است.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
استخراج ویژگیهای مربوط به کاهش هوشیاری
در سیستمهای نظارت چهره راننده، ویژگیهای مفید برای تشخیص خستگی و عدم تمرکز حواس به سه دسته کلی قابل تقسیم است:
ویژگیهای ناحیه چشم
ویژگیهای ناحیه دهان
ویژگیهای ناحیه چهره و سر
ویژگیهای ناحیه چشم
چشم مهمترین عضو چهره است که نشانههای خستگی و عدم تمرکز حواس در آن ظهور پیدا میکند. به همین دلیل بسیاری از سیستمهای نظارت چهره راننده فقط بر اساس ویژگیهای استخراج شده از ناحیه چشم، خستگی و عدم تمرکز حواس راننده را تشخیص میدهند.
بسته بودن چشم
سادهترین ویژگی برای تشخیص خوابآلودگی، بسته بودن چشمها[۷۱] است. این ویژگی، در عین سادگی اطالاعات بسیار مفیدی در مورد خوابآلودگی و حتی بیهوشی راننده در اختیار میگذارد. ویژگی بستهبودن چشم به دو شکل مختلف برای تشخیص خوابآلودگی قابل استفاده است: بسته بودن ممتد چشم و درصد بسته بودن چشم در یک مدت معین.
در روش بسته بودن ممتد چشم، اگر چشم برای یک مدت معین به طور ممتد بسته باشد، خوابآلودگی تشخیص داده میشود. این روش کارایی خوبی ندارد و چندان قابل اطمینان نیست. چرا که خوابآلودگی راننده تنها زمانی مشخص میشود که چشمهای او برای مدت معینی کاملا بسته شده باشد. این ویژگی در [۲۴, ۲۵, ۳۱, ۳۴, ۳۵] مورد استفاده قرار گرفته است. برای افزایش دقت سیستم، معمولا این ویژگی همراه با برخی ویژگیهای دیگر مورد استفاده قرار میگیرد.
روش دیگر بر اساس درصد بسته بودن چشم[۷۲] در یک مدت معین عمل میکند. به این روش اختصارا PERCLOS گفته میشود. بر اساس تحقیقات به عمل آمده، یکی از بهترین معیارهای ارزیابی کاهش هوشیاری، محاسبه درصد بسته بودن پلکها در یک دوره زمانی است [۸]. به همین دلیل ویژگی PERCLOS به عنوان یک ویژگی بسیار مهم برای تشخیص خوابآلودگی در [۶, ۹, ۲۷, ۴۴, ۵۸] استفاده گردیده است.
روشهای متفاوتی برای تشخیص بسته یا باز بودن چشم استفاده شده که از مهمترین آنها میتوان به خاصیت بازتابشی چشم در طیف مادون قرمز [۲۰-۲۳]، محاسبه پروجکشن افقی ناحیه چشم [۲۶-۲۸, ۳۷, ۴۸] و محاسبه شار اپتیکی[۷۳] [۷, ۴۹] اشاره کرد.
Zheng و همکارانش [۵۹] روشی را ارائه کردهاند که با معلوم بودن ناحیه چشم، قادر است مرکز و شعاع مردمک[۷۴]، گوشههای چشم و کانتور[۷۵] پلک را مشخص کند. در این روش مردمک چشم از طریق اعمال سطح آستانه بر روی مقدار H در فضای رنگی HSI و دوسطحی کردن تصویر چشم تعیین میشود. به این ترتیب میتوان مرکز و شعاع مردمک چشم را در تصویر دوسطحی شده بدست آورد. آشکارسازی گوشههای چشم با روش فیلتر گوشه چشم[۷۶] و به کمک موجک Gabor انجام شده است. در نهایت کانتور پلکها به کمک نقاط بالا، پایین و طرفین چشم و با بهره گرفتن از تابع Spline تعیین میگردد. این الگوریتم میتواند در تعیین بسته بودن چشم، فاصله بین دو پلک و تعیین جهت نگاه[۷۷] راننده مورد استفاده قرار گیرد.
Brandt و همکارانش [۷] و Lalonde و همکارانش [۴۹] برای تشخیص بسته بودن چشم از اندازهگیری شار اپتیکی[۷۸] ناحیه چشم استفاده کردهاند. در این روش بر اساس محاسبه مقدار شار اپتیکی و تعیین جهت آن، باز و بسته شدن پلکها قابل تشخیص است.
Grace و همکارانش [۲۰] با بهره گرفتن از نورپردازی و تصویربرداری در طیف مادون قرمز و به کمک خاصیت بازتابش نور مادون قرمز از مردمک چشم، مکان چشم را تشخیص داده و از همین طریق بسته یا باز بودن آن را مشخص میکنند. در این روش اگر درصد بسته بودن چشم در بازه زمانی ۱ دقیقه بیشتر از ۸۰% باشد، سیستم اعلام هشدار میکند.
تشخیص خوابآلودگی در [۲۶] بر اساس بسته بودن چشم در ۵ ثانیه متوالی صورت میگیرد. در این سیستم پس از تعیین ناحیه چشم، با بهره گرفتن از عملگر Prewitt لبههای تصویر استخراج شده و دوسطحی میشود. هنگامیکه چشم بسته باشد، تنها لبه پلکها آشکارسازی میشود، اما در صورت باز بودن چشم، علاوه بر پلکها، حدقه و عنبیه چشم نیز لبههای قابل توجه دارند. پس انتظار میرود در صورت بازبودن چشم، پیکسلهای لبه در نواحی اطراف چشم بیشتر باشد. به این ترتیب باز یا بسته بودن چشم مشخص میگردد.
در [۲۱-۲۳] برای تشخیص بسته بودن چشم از بررسی اندازه مردمک چشم استفاده شده است. در این روش مردمک چشم بر اساس نوعی نورپردازی طیف مادون قرمز آشکارسازی میشود. اگر اندازه مردمک چشم کمتر از ۳۰% اندازه واقعی خود شود، چشم بسته تشخیص داده خواهد شد. سپس مقدار PERCLOS در ۳۰ ثانیه اخیر و مدت زمان بسته بودن ممتد چشم برای تخمین میزان خستگی راننده محاسبه میشود.
Rang-ben و همکارانش [۵۶] برای تشخیص بسته بودن چشم از موجک Gabor استفاده کردهاند. برای این منظور گوشههای چشم و مرکز چشم با ۱۸ فیلتر موجک Gabor پردازش شده تا ۵۴ ویژگی (۱۸ ضریب برای هر یک از نقاط دو گوشه چشم و مرکز آن) از هر چشم استخراج شود. این ویژگیها توسط شبکه عصبی پرسپترون چند لایه[۷۹] (MLP) پردازش میشود تا خوابآلودگی راننده تعیین شود. دقت تشخیص خوابآلودگی با بهره گرفتن از این روش ۸۵% است.
روش پیشنهادی Horng و همکارانش [۳۰] برای تشخیص خوابآلودگی بر اساس بسته یا باز بودن چشم میباشد. مقدار S پیکسلهای مردمک چشم در فضای رنگی HSI بین صفر تا ۱۴/۰ متغیر است. به این ترتیب با اعمال حد آستانه بر روی تصویر ناحیه چشم، بسته یا باز بودن چشم تعیین میشود. اگر چشم به مدت بیشتر از ۲۵/۰ ثانیه بسته تشخیص داده شود، سیستم اعلام هشدار خواهد کرد.
Gan و همکارانش [۴۸] روشی را ارائه کردهاند که خوابآلودگی راننده را بر اساس بسته بودن چشم تشخیص میدهد. در این روش با محاسبه پروجکشن افقی تصویر دوسطحی چهره، مکان چشمها مشخص شده و بر همین اساس بسته یا باز بودن آن تعیین میشود. در صورت باز بودن چشم، شیب نمودار پروجکشن در ناحیه چشم کم است، در حالی که هنگام بسته بودن چشم، شیب نمودار زیاد خواهد بود. به این ترتیب با بهره گرفتن از محاسبه مشتق نمودار پروجکشن و همچنین محاسبه تعداد پیکسلهای سیاه چشم، باز یا بسته بودن چشم قابل تشخیص است.
در [۲۷] تشخیص باز و بسته چشم بر اساس محاسبه پروجکشن واریانس افقی انجام شده است. اگر چشم باز باشد، پروجکشن واریانس افقی ناحیه چشم به دلیل اختلاف شدید مقادیر پیکسلهای کره چشم (روشن) و مردمک (تیره) زیاد است. در حالیکه اگر چشم بسته باشد، پروجکشن واریانس افقی ناحیه چشم کمتر خواهد شد.
فاصله بین پلکها
در [۲۸] برای تشخیص خوابآلودگی از فاصله بین دو پلک[۸۰] استفاده شده است. در حالتی که راننده بیدار باشد، فاصله بین دو پلک زیاد است، اما با افزایش خستگی، فاصله بین دو پلک کم میشود. در این روش، فاصله بین دو پلک بر اساس پروجکشن افقی چشم محاسبه میگردد.
سرعت پلکزدن
یکی دیگر از ویژگیهای خستگی، کاهش سرعت پلکزدن[۸۱] است. منظور از سرعت پلکزدن، زمان بین باز و بسته شدن پلکها در یک پلکزدن است. در [۶, ۲۷, ۴۴] از این ویژگی برای تشخیص خستگی استفاده شده است. در صورتی که مدت زمان پلکزدن بیشتر از یک حد آستانه (حدود ۵/۰-۸/۰ ثانیه) اندازهگیری شود، خوابآلودگی راننده تشخیص داده میشود.
نرخ پلکزدن
نرخ پلکزدن[۸۲] به معنی تعداد دفعات پلکزدن در یک مدت معین میباشد. این ویژگی میتواند برای تشخیص خستگی و عدم تمرکز حواس مورد استفاده قرار گیرد. نرخ پلکزدن در افراد مختلف با هم متفاوت است. در صورتی که نرخ پلکزدن بسیار کمتر از حد طبیعی باشد، نشانه عدم تمرکز حواس (به دلیل عوامل درونی و مشغله ذهنی) میباشد و اگر بسیار زیادتر از حد طبیعی باشد نشانه خوابآلودگی راننده است. از این ویژگی در [۶, ۲۱-۲۳] برای تشخیص خستگی و عدمتمرکز حواس استفاده شده است.
جهت نگاه چشم
جهت نگاه[۸۳] چشم ویژگی موثری در تعیین عدم تمرکز حواس راننده است. با بهره گرفتن از این ویژگی، علاوه بر تشخیص عدم توجه راننده به جاده، میتوان تصمیم راننده برای سبقت گرفتن یا تغییر مسیر را تشخیص داد. بر اساس تحقیقات نشان داده شده است که راننده به هنگام سبقتگرفتن، دائم جهت نگاه خود را از مسیر مبدا به مسیر مقصد و بالعکس تغییر میدهد [۶۰, ۶۱]. این ویژگی در [۶, ۴۴] براساس خاصیت بازتابشی چشم در طیف مادون قرمز استخراج شده و برای تشخیص عدم تمرکز حواس راننده مورد استفاده قرار گرفته است.
در [۶] تخمین جهت نگاه چشم بر اساس مرکز مردمک چشم و نور بازتابیده شده از قرنیه[۸۴] چشم انجام میشود. نور بازتابیده شده از قرنیه را درخشش چشم[۸۵] مینامند که نسبت به بازتابش نور مردمک ضعیفتر و از نظر قطر کوچکتر است. در این سیستم، نور بازتابیده شده از مردمک چشم فقط در فریمهای زوج مشاهده میشود، در حالی که نور بازتابیده شده از قرنیه در تمام فریمها دیده میشود. راستای خطی که مرکز مردمک چشم را به مرکز درخشش چشم متصل میکند، جهت نگاه چشم را در ۹ راستا مشخص خواهد کرد: مستقیم، بالا، پایین، چپ، راست، بالا راست، بالا چپ، پایین راست و پایین چپ. سرعت اجرا این روش بر روی کامپیوتر Sun Ultra 10 حدود ۱۵ فریم در ثانیه و میانگین دقت آن بیش از ۹۴% گزارش شده است.
تشخیص و ردیابی جهت نگاه چشم در [۴۴] بسیار شبیه روش فوق میباشد، با این تفاوت که با آموزش یک شبکه عصبی رگرسیون تعمیمیافته[۸۶] (GRNN)، به کمک تعدادی از ویژگیهای مربوط به مردمک و مرکز انعکاس نور قرنیه چشم، سیستم قادر به تخمین جهت نگاه چشم خواهد بود. دقت این روش برای تخمین جهت نگاه چشم حدود ۹۶% میباشد.
حرکات جهشی چشم
یکی از ویژگیهای قابل استخراج از جهت نگاه چشم، نرخ حرکات جهشی[۸۷] و نامنظم چشم است. هنگامیکه راننده هوشیاری عادی دارد، هر چند وقت یک بار محیط اطراف خود را بازبینی سریع میکند. این بازبینی سریع همراه با حرکات سریع جهشی و نامنظم است [۴۴]. Bergasa و همکارانش [۲۱-۲۳] نیز از همین ویژگی تحت عنوان «نگاه ثابت[۸۸]» برای تعیین میزان هوشیاری استفاده کردهاند. در واقع ثابت بودن جهت نگاه به مدت طولانی، نشانه عدم تمرکز حواس راننده است.
ویژگیهای دهان
خمیازه کشیدن[۸۹] یکی از نشانههای خستگی میباشد که همراه با بازشدن دهان است. همچنین صحبتکردن راننده به هنگام رانندگی میتواند از نشانههای کاهش تمرکز حواس باشد. از جمله مهمترین روشهای تشخیص باز بودن دهان، محاسبه نسبت عرض به ارتفاع دهان [۳۶]، محاسبه ضرایب موجک Gabor در نقاط گوشه دهان [۴۴] و استفاده از ماشین بردار پشتیبان (SVM) [51] است.
ویژگیهای سر
برخی از نشانههای خستگی و عدم تمرکز حواس راننده در حرکات سر بروز پیدا میکند. از جمله مهمترین ویژگیهای مربوط به ناحیه سر میتوان به افتادن سر، تعیین جهت سر (برای آشکارسازی چرخش) و عدم تحرک سر اشاره کرد. در این بخش ویژگیهای مربوط به ناحیه سر مورد بررسی قرار خواهد گرفت.
افتادن سر
یکی از نشانههای خوابآلودگی در انسان افتادن سر[۹۰] به دلیل چرتزدن[۹۱] است. در هنگام خوابآلودگی ماهیچههای گردن انقباض کامل ندارند و سر به تدریج خم میشود. این ویژگی یکی از نشانههای خوابآلودگی یا بیهوشی میباشد و در سیستمهای [۷, ۲۱-۲۳, ۲۵, ۴۴] برای تشخیص خوابآلودگی مورد استفاده قرار گرفته است. افتادن سر از نحوه ردیابی چهره با فیلتر کالمن قابل تعیین است [۲۱-۲۳].
جهت سر
تعیین جهت سر[۹۲] در تشخیص عدم تمرکز حواس راننده و پیشبینی قصد او برای تغییر مسیر موثر است. در حالت کلی، تعیین جهت سر نیاز به مدل سه بعدی از سر دارد. استفاده از بینایی استریو علاوه بر افزایش شدید حجم محاسبات، باعث افزایش قیمت تمام شده سیستم میشود. تاکنون در سیستمهای نظارت چهره راننده از بینایی استریو برای این منظور استفاده نشده است، بلکه روشهایی ارائه شده که بدون نیاز به بینایی استریو، مدل سه بعدی چهره و جهت سر تعیین میشود. از جمله تحقیقات انجام شده در این زمینه میتوان به تشخیص جهت سر با بهره گرفتن از مکان هندسی چشمها، بینی و دهان نسبت به یکدیگر [۲۱-۲۳, ۲۷, ۴۴, ۵۲] و یا استفاده از تغییر شکل هندسی مردمک چشم [۶] اشاره کرد.
عدم تحرک سر
عدم تحرک سر[۹۳] برای یک مدت طولانی نشان از عدم تمرکز حواس راننده دارد. هنگامیکه راننده بر روی موضوعی غیر از رانندگی تمرکز میکند، تحرک سر وی کم شده و تقریبا ثابت خواهد شد. این ویژگی به عنوان یکی از ویژگیهای تشخیص عدم تمرکز راننده در [۷] مورد استفاده قرار گرفته است.
تشخیص خستگی و عدم تمرکز حواس
پس از استخراج ویژگی، بحث چگونگی ارتباط میان ویژگیها و نحوه تعیین میزان خستگی و عدم تمرکز حواس راننده بر اساس این ویژگیها مطرح میشود. تعیین وضعیت راننده یک مسئله طبقهبندی[۹۴] (دسته بندی) محسوب میشود. سادهترین شکل آن، طبقهبندی وضعیت راننده به دو حالت هوشیار و غیرهوشیار میباشد. در حالت دیگر میتوان میزان هوشیاری راننده را با یک عدد حقیقی بین صفر و یک مشخص کرد.
روشهای مبتنی بر حد آستانه
سادهترین روش برای تشخیص خستگی و عدم تمرکز حواس، استفاده از حد آستانه است. اگر تنها از یک ویژگی برای تشخیص خستگی و عدم تمرکز حواس استفاده شود، مرحله تشخیص با اعمال حد آستانه به پایان میرسد. ولی اگر از چند ویژگی برای تشخیص کاهش هوشیاری استفاده شود، پس از اعمال حد آستانه بر روی هر ویژگی، تشخیص نهایی باید روشی برای ترکیب[۹۵] نتایج استفاده کرد. در واقع اعمال حد آستانه بر روی هر ویژگی، وضعیت راننده را به دو دسته طبقهبندی میکند، اما هنوز طبقهبندی نهایی سیستم برای تشخیص وضعیت راننده انجام نشده است. برای تولید خروجی نهایی سیستم میتوان از روش قوانین ابتکاری[۹۶] یا رای اکثریت[۹۷] استفاده کرد. در اکثر سیستمهای نظارت چهره برای تشخیص خستگی و عدم تمرکز حواس از روشهای مبتنی بر حد آستانه استفاده شده است.
رای اکثریت
یکی از روشهای ساده برای ترکیب نتایج حاصل از چند طبقهبندیکننده، استفاده از رای اکثریت است. این ایده برگرفته از قوانین دموکراسی میباشد و به سه شکل قابل استفاده است: رای مطلق[۹۸]، رای اکثریت ساده[۹۹] و رای ائتلافی[۱۰۰] [۶۲]. در سیستمهای نظارت چهره راننده معمولا از روش رای ائتلافی استفاده شده است. به این معنی که خروجی سیستم بر اساس رای اکثریت تعیین میشود. مثلا اگر وضعیت راننده بر اساس ۶۰% ویژگیها هوشیار و بر اساس ۴۰% دیگر غیرهوشیار تعیین شود، سیستم وضعیت هوشیار را برای راننده تعیین خواهد کرد.
روشهای مبتنی بر دانش
در روشهای مبتنی بر دانش، تصمیم گیری در مورد تعیین خستگی و خوابآلودگی راننده بر اساس دانش یک فرد خبره[۱۰۱] انجام میگیرد. در این روشها معمولا دانش در قالب قوانین اگر-آنگاه ظاهر میشود. یکی از سادهترین روشهای ترکیب نتایج، تعریف چند قانون ابتکاری ساده است. در این روش چند قانون اگر-آنگاه بر روی نتایج هر ویژگی اعمال شده تا وضعیت نهایی راننده تخمین زده شود. در حالت پیچیدهتر، میتوان از سیستمهای خبره نیز استفاده کرد. هرچند قوانین ابتکاری یک نوع سیستم خبره ساده میباشد.
یکی از راهکارهای قابل استفاده برای ترکیب اطلاعات حاصل از چند ویژگی، منطق فازی[۱۰۲] است. در سیستمهای خبره فازی یا سیستمهای استنتاج فازی با تعریف چند قانون فازی، میتوان اطلاعات حاصل از مرحله استخراج ویژگی را مورد پردازش قرار داد. در [۲۱-۲۳] برای تعیین میزان خستگی راننده از قوانین فازی در قالب سیستم استنتاج فازی استفاده شده است. در این روش میزان خستگی راننده در بازه صفر و یک تعیین میگردد.
روشهای مبتنی بر آمار و احتمال
در روشهای مبتنی بر آمار و احتمال، تخمین میزان خستگی و عدم تمرکز حواس بر اساس اطلاعات آماری و احتمالی انجام میگیرد. معمولا این اطلاعات در قالب دانش اولیه یا اطلاعات استخراج شده از دادههای آموزشی میباشد. سپس با بهره گرفتن از روشهای آماری و احتمالی مانند شبکه بیز یا شبکه عصبی، میزان کاهش هوشیاری راننده مشخص میشود.
فرم در حال بارگذاری ...
[چهارشنبه 1401-04-15] [ 02:42:00 ق.ظ ]
|