راهنمای نگارش مقاله در مورد ارائه مدلی برای سیستم های ... - منابع مورد نیاز برای پایان نامه : دانلود پژوهش های پیشین |
روشها و متدهای بسیار زیاد دیگری نیز در زمینه بهبود روش کلی پالایش گروهی مطرح میباشد که در ذیل به صورت فهرست وار اسامی این روشها بیان میگردد و به دلیل خروج از محدوده تحقیق، جزئیات آنها بیان نمیگردد:
Significance Weighting[27]
Inverse User Frequency[21]
weighted majority prediction[30]
imputation-boosted CF[31]
۲-۲-۲- پالایش گروهی مبتنی بر مدل(Model Based)
در این تکنیک به کمک تخمین پارامترهای مدل آماری که بر اساس نظرات کاربران ایجاد گردیده است، ارائه پیشنهاد به کاربران یا پیش بینی امتیازدهی کاربر مقصد به یک آیتم خاص صورت می پذیرد به عنوان مثال یکی از ابتداییترین روشها، روش تبدیل پالایش گروهی به یک مسئله “طبقه بندی[۴۴]” میباشد. در این حالت یک “تمایز دهنده[۴۵]” برای کاربر مقصد به صورتی ایجاد میگردد که در آن آیتمها به عنوان بردار معیارها روی کاربران تعریف و امتیازهای موجود به صورت برچسب کلاس در نظر گرفته می شود و به کمک تکنیکهای “کاهش بعد[۴۶]” مشکل کمبود اطلاعات[۴۷] نیز برطرف میگردد. در سالهای اخیر تکنیکهای “فاکتور نهان[۴۸]” و “مدل فاکتورگیری ماتریسی[۴۹] “به عنوان بهترین روش های موجود در این زمینه شناخته و عرضه شده اند[۳۲].
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت nefo.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
بر خلاف مدلهای مبتنی بر حافظه که بر اساس تشابه میان کاربران یا آیتمها و اطلاعات آماری موجود، نسبت به تولید پیشنهاد، اقدام مینمایند تکنیکهای مبتنی بر مدل تشابه میان کاربران یا آیتمها را، نتیجه وجود یک ساختار سطح پایین نهفته درون داده ها میدانند. در این تحقیق سعی در استفاده از تکنیکهای مبتنی بر حافظه می باشد لذا از ارائه توضیحات بیشتر در این خصوص پرهیز شده است.
۲-۳- پالایش محتوایی (Content Based Filtering)
سیستمهای توصیهگر تولید شده با بهره گرفتن از تکنیکهای پالایش گروهی، تنها بر اساس ماتریس امتیازات کاربران به آیتمهای مختلف یا بر اساس یک مدل تولید شده از اطلاعات موجود، نسبت به محاسبه و ارائه پیشنهاد اقدام می کنند همچنین کاربران و آیتمها به صورت موجودیتهای مجزا در نظر گرفته میشوند و خصوصیات و مشخصههای کاربران و آیتمها تاثیری در نتیجه پیشنهادات نخواهند داشت در حالیکه با کسب اطلاعات بیشتر در خصوص یک کاربر و شناخت علایق و سلایق وی، می توان پیشنهادات دقیق تر و مناسبتری را به وی ارائه نمود[۸] به عنوان مثال با داشتن اطلاعات در خصوص کارگردان یا سبک یک فیلم سینمایی میتوان پیشنهادات مناسبتری را به کاربر مقصد ارائه نمود[۳۳]. این تکنیک که در آن با توجه به خصوصیات و علایق یک کاربر یا مشخصات و ویژگیهای یک آیتم و با توجه به محتوا و مفاهیم، پیشنهاداتی ارائه میگردد تحت عنوان “سیستمهای توصیهگر مبتنی بر محتوا” یا “پالایش محتوایی[۵۰]” نامگذاری شده اند.
تحقیقات بسیار زیادی در این زمینه، خصوصا در مورد پیشنهاد آیتمهایی که اطلاعات متنی بسیاری در مورد آنها موجود میباشد مانند کتابها، فیلمها و صفحات وب انجام گردیده است و به این مسئله از دیدگاه “بازیابی اطلاعات[۵۱]” نگاه شده است و جمع آوری اطلاعات و محتوای مرتبط با ترجیحات و سلایق کاربر در قالب یک “پرسوجو[۵۲]” بر روی اطلاعات مطرح می شود، به عنوان مثال کتابی که توسط کاربر مقصد امتیازی به آن داده نشده است بر اساس تشابه با پرسوجوی انجام شده امتیاز دهی میگردد[۳۴].
به عنوان راه حل جایگزین روش های بازیابی اطلاعات، می توان مسئله پیشنهاد دهی به کاربران را به عنوان یک مسئله دستهبندی در نظر گرفت که در آن محتوای هر آیتم به عنوان مشخصهها و معیارها مطرح میگردند و امتیاز داده شده توسط کاربر به هر کدام از آیتمها به عنوان برچسب کلاس بکار میرود. به عنوان مثال در سایتهای فروش کتاب میتوان از اطلاعات عنوان کتاب، نویسنده، ناشر، تعداد دفعات چاپ و غیره برای آموزش[۵۳] یک چند جملهای کلاسهبند بیزین ساده[۵۴] استفاده نمود[۳۵] و امتیازات در بازه ۱ تاk را مستقیما به k دسته نگاشت[۳۳].
سایر الگوریتمهای دستهبندی مانند روش k نزدیکترین همسایه[۵۵]، درختهای تصمیم گیری[۵۶] و شبکه های عصبی[۵۷] نیز برای تولید سیستمهای توصیهگر مبتنی بر محتوا مورد استفاده قرار میگیرند[۳۶].
۲-۴- تکنیکهای ترکیبی
با ترکیب انواع روشها و تکنیکها میتوان مدلهای نوینی تولید نمود که دارای نقاط قوت روش های ترکیب شده باشند و در مقابل دارای نقاط ضعف کمتری نسبت به هر یک از روشها باشند. روش های متعدد و گوناگونی توسط محققان مطرح شده است که به عنوان سادهترین روش می توان روش های پالایش گروهی و پالایش محتوایی را با یکدیگر ترکیب نمود و لیستهای پیشنهادی توسط هر کدام از روشها را با یکدیگر ترکیب نمود یا در روشی دیگر می توان به نتایج حاصل از دو روش وزن انتساب داد و به کمک میانگین وزنی نتایج را با یکدیگر ترکیب نمود[۳۳].
۲-۵- سیستمهای توصیهگر مبتنی بر رابطه اعتماد میان کاربران
با ظهور شبکه های مبتنی بر اعتماد میان کاربران و با توجه به ویژگیها و خصوصیات اینگونه شبکه ها، روشها و الگوریتمهای جدیدی در خصوص ایجاد و بهبود سیستمهای توصیهگر به نام روش های مبتنی بر اعتماد مطرح گردید[۱۰][۱۵].
سیستمهای توصیهگر مبتنی بر اعتماد، سیستمهای توصیهگری هستند که اطلاعات ارزشمندی را به کاربران خود و بر اساس رابطه اعتماد ارائه مینمایند. اعتماد، در واقع اندازه میزان باور کاربران نسبت به یکدیگر است که بر اساس معیارهایی همچون توانایی، قدرت و خوبی افراد شکل میگیرد. رابطه اعتماد، لزوما یک رابطه دو طرفه نیست و در اکثر مواقع به صورت یک رابطه یک طرفه بیان میگردد که در آن به کاربری که به سایر کاربران اعتماد می کند “اعتماد کننده[۵۸]” و فردی که در واقع مقصد و هدف رابطه اعتماد می باشد “مورداعتماد[۵۹]” نامیده می شود.
مقوله اعتماد و اطمینان میان کاربران به دو صورت کلی “اعتماد آشکارا[۶۰]” و “اعتماد ضمنی[۶۱]” مطرح میباشد. اعتماد آشکارا، بیانگر وجود رابطه صریح اعتماد در میان خود کاربران و بر اساس نظرات ایشان میباشد. در اینگونه اعتماد، افراد و کاربران، خود مشخص می کنند که به چه افراد، گروه، سازمان یا کاربرانی اعتماد دارند و به نظرات، پیشنهادات یا آرای ایشان اطمینان دارند و نظرات آنها می تواند مبنا و پایه تصمیم گیری قرار گیرد در حالیکه در اعتماد ضمنی کاربران صراحتا رابطه اعتماد میان خود را بیان نمیکنند بلکه بر اساس پارهای از شواهد، مدارک و تشابهات، وجود رابطه اعتماد میان کاربران احساس میگردد. به عنوان نمونه، ارسال ایمیل میان دو کاربر، همکلاسی بودن دو فرد، جنسیت یکسان، شغل مشابه، عضویت در یک گروه مشترک، سطح سوادی و طبقاتی مشابه و مثالهایی از این دست، میتوانند بیانگر وجود یکی رابطه اعتماد ضمنی باشند.
در مورد اعتماد آشکارا نیز، دو مقوله ” اعتماد مستقیم[۶۲]” و ” اعتماد غیرمستقیم[۶۳]” مطرح میباشد. اعتماد مستقیم، در واقع توسط یک رابطه مستقیم فی مابین دو کاربر بیان می شود در حالیکه در اعتماد غیرمستقیم، بر اساس قانون تعدی و انتقال اعتماد، رابطه اعتماد میان دو کاربر غیر همسایه، شکل میگیرد. یکی از مسائل اصلی در سیستمهای مبتنی بر اطمینان چگونگی محاسبه اعتماد غیرمستقیم میباشد. دو رویکرد متفاوت برای محاسبه اعتماد غیرمستقیم مطرح میباشد که عبارتند از:
بر پایه مدل[۶۴] : در این روش یک مدل به همراه پارامترهایش برای محاسبه اعتماد غیرمستقیم آموزش میبیند[۳۷][۳۸].
بر پایه حافظه[۶۵] : در این روش از مدل استفاده نمی شود بلکه از روش های اکتشاف[۶۶] و ابتکاری[۶۷] استفاده میگردد[۱۵][۳۹].
در این تحقیق رابطه اعتماد میان کاربران از نوع آشکارا در نظر گرفته می شود تا بتوان به نتایج دقیق و قابل اعتمادی دست یافت چرا که تعیین و میزان رابطه اعتماد ضمنی، خود به عنوان یکی از موضوعات تحقیق می تواند مطرح گردد.
۲-۵-۱- چگونگی کارکرد سیستم توصیهگر مبتنی بر اعتماد
سیستمهای توصیهگر سنتی[۶] پیش بینی نظر کاربر u در خصوص آیتم i را بر اساس امتیازات و نظرات کاربران مشابه محاسبه و بیان مینمایند. در این سیستمها یک همسایگی از کاربرانی که در خصوص آیتم i دارای نظر میباشند و از نظر پروفایل دارای شباهت با کاربر u می باشند جستجو میگردد و سپس از تجمیع نظرات ایشان، پیش بینی امتیاز نهایی صورت میپذیرد. در سیستمهای توصیهگر مبتنی بر اعتماد، بجای شباهت کاربران از شبکه اعتماد جهت یافتن همسایگان استفاده میگردد و برای پیش بینی امتیاز به یک آیتم خاص، ابتدا از همسایگان مستقیم در خصوص اینکه آیا آنها در مورد آیتم مورد نظر دارای امتیاز می باشند یا خیر، پرسش می شود و در صورتیکه امتیازی موجود باشد به عنوان جواب بازگردانده می شود و در غیر اینصورت به صورت بازگشتی، از همسایگان مستقیم خود این پرسش را مطرح می کنند و به این ترتیب شبکه اعتماد به جهت یافتن پاسخ، جستجو و پیمایش می شود.
همسایگی در یک سیستم توصیهگر مبتنی بر اعتماد، به صورت مجموعه ای از کاربران دارای نظر و امتیاز در خصوص یک آیتم خاص، مطرح میباشد که می توانند به صورت مستقیم یا غیر مستقیم مورد اعتماد کاربر مبدا قرار گیرند. امتیازات این کاربران به یک آیتم خاص، تجمیع میگردد تا نهایتا پیش بینی امتیاز نهایی صورت پذیرد.
کاوش و پیمایش شبکه اعتماد، لزوما باعث افزایش و بهبود دقت سیستم نمیگردد اما به زوجهای<u,i> بیشتری می تواند پاسخ دهد که طبیعتا باعث افزایش و بهبود درصد پوشش میگردد. شکل ۲-۲ ساختار یک شبکه اعتماد و چگونگی عملکرد آنرا نمایش میدهد.
شکل ۲-۲ : نمایش یک شبکه اعتماد به همراه امتیازات بیان شده توسط کاربران در خصوص آیتمهای مختلف[۲۰]
همان طور که در شکل فوق مشخص است شبکه اعتمادی میان کاربران وجود دارد که باعث ارتباط ایشان میگردد. در این شبکه کاربر مبدا u به دنبال پیش بینی امتیاز، برای آیتم هدف i (الماس سبز رنگ) میباشد که در این شبکه تنها تعداد اندکی از کاربران، دارای امتیاز در خصوص آن میباشند و سایر کاربران، دارای امتیاز برای سایر آیتمهایی می باشند که ممکن است توسط u به آنها امتیازی داده شده باشد و یا اینکه شبیه آیتم i باشند.
۲-۵-۲- مزایا و معایب
تکنیکهای مبتنی بر اعتماد، قادر به حل مشکلات بیان شده در خصوص سیستمهای توصیهگر مبتنی بر تکنیکهای پالایش گروهی و پالایش محتوایی میباشند[۴۰][۴۱]. به عنوان مثال مشکل “کمبود اطلاعات[۶۸]” به دلیل وجود امکان انتقال اعتماد در شبکه میان کاربران، قابل کاهش و حل می باشد[۳۳][۴۲] مثلا اگر کاربر A به کاربر B و کاربر B به کاربر C اعتماد داشته باشد در نتیجه کاربر A به کاربر C نیز تا حدودی اعتماد خواهد داشت بنابراین در صورتیکه رابطه اعتماد مستقیمی میان کاربر هدف و سایر کاربران وجود نداشته باشد اما با توجه به توضیح فوق، کاربر هدف می تواند به واسطه توزیع و انتشار اعتماد، یک رابطه اعتماد غیر مستقیم را با سایر کاربران ایجاد نماید که این مسئله باعث افزایش درصد پوشش این تکنیکها به نسبت سایر تکنیکهای موجود خصوصا پالایش گروهی میگردد. در کنار کلیه مزایا و بهبودهای موجود در روش مبتنی بر اعتماد باید به نکاتی نیز در مورد این روش توجه نمود:
در یک شبکه مبتنی بر اعتماد، با توجه به کمی تعداد یا کمبود اطلاعات همسایگان کاربر مبدا در خصوص آیتم مورد نظر وی، الگوریتم نیازمند این است تا علاوه بر بررسی نظرات کاربرانی که به طور مستقیم مورد اعتماد میباشند نظرات کاربرانی نیز که به طور غیرمستقیم مورد اطمینان میباشند را بررسی نماید که این امر می تواند باعث کاهش دقت شود.
از سوی دیگر، زمانیکه در جستجوی نظرات کاربران مختلف در مورد آیتم هدف در شبکه مبتنی بر اعتماد، پیشروی میکنیم با افزایش فاصله از کاربر مبدا، درجه اطمینان به طرز قابل ملاحظهای کاهش مییابد که این امر می تواند باعث تولید داده های غیر قابل اعتماد گردد.
مدلهای مبتنی بر اعتماد دارای محدودیتها و نواقصی نیز میباشند[۴۳]. به عنوان مثال، از نظر پیچیدگی محاسبات و منابع مورد نیاز، بهینه نبوده و دارای هزینه بسیار زیادی میباشند و در برخی موارد نمی توان به صورت همزمان دقت نتایج و درصد پوشش را بهبود داد، همچنین اکثر مدلهای موجود بر وجود رابطه اعتماد مستقیم میان کاربران، بنا نهاده شده اند و تنها وجود یا عدم وجود رابطه اعتماد مد نظر قرار میگیرد در حالیکه در مدل کردن دنیای واقعی، میزان رابطه اعتماد، عددی فازی و در محدوده ۰ تا ۱ میباشد.
۲-۵-۳- انتشار اعتماد[۶۹] و تجمیع اعتماد[۷۰]
با توجه به بزرگی شبکه های اعتماد موجود در سایتهای مختلف، این امر کاملا مشخص است که تمامی کاربران نمی توانند روی یکدیگر شناخت داشته باشند و طبیعتا یک کاربر با تمامی کاربران دیگر ارتباط ندارد که معنی آن این است که اگر کاربر فرضی a بخواهد در رابطه با کاربر x، اعتماد خود را بیان کند به دلیل عدم وجود رابطه مستقیم با آن کاربر، باید از طریق سایر کاربران مانند کاربر b و ادامه این روند تا رسیدن به کاربر x میزان اعتماد خود را بیان نماید. به روند پیش بینی اندازه اعتماد میان کاربر a و کاربر x از طریق مسیر موجود میان آنها،”انتشار اعتماد” گفته می شود.
با توجه به این نکته که مسیرهای متعددی از کاربر a به کاربر x می تواند وجود داشته باشد باید مکانیزمی نیز برای تجمیع اندازه اعتماد محاسبه شده از طریق مسیرهای مختلف وجود داشته باشد که به این مکانیزم ” تجمیع اعتماد” اطلاق میگردد.
دو مفهوم فوق پایه و اساس شبکه اعتماد و محاسبه اعتماد میان دو کاربر ناشناس را پایهریزی مینمایند و روشها و تکنیکهای متعددی برای محاسبه آنها توسط محققان مطرح شده است.
۲-۶- چالش ها و محدودیتهای موجود
در این بخش پارهای از مشکلات، محدودیتها و چالشهای موجود در زمینه توسعه و بهبود سیستمهای توصیهگر بیان میگردد.
۲-۶-۱- نقصان و کاستی اطلاعات[۷۱]
به دلیل امتیاز دهی کاربران به اندکی از آیتمهای موجود و عدم وجود اطلاعات کافی در خصوص تمامی کاربران و امتیازات آیتمها، در توسعه سیستمهای توصیهگر در اکثر مواقع با مشکل کمبود اطلاعات مواجه خواهیم بود. این امر در تکنیکهای پالایش گروهی مشکلات بیشتری ایجاد می کند چراکه احتمال یافتن مجموعه ای از کاربران دارای ساختار امتیازدهی مشابه را کاهش میدهد. مشکل نقصان اطلاعات خصوصا در ابتدای کار یک سیستم توصیهگر که اطلاعات بسیار محدودی در اختیار میباشد بیشتر نمایان میگردد. برای حل این مشکل یا کاهش آن می توان از سایر اطلاعات موجود در حوزه مورد فعالیت استفاده نمود[۴۴] یا در روند تولید داده ها از مقادیر پیش فرض و مفروضات از پیش تعیین شدهای استفاده نمود[۳۱].
۲-۶-۲- مشکل کاربران تازه وارد[۷۲]
کاربران تازه وارد یا مشتریانی که برای اولین بار از یک سایت تجاری بازدید می کنند و همچنین آیتمها و محصولات جدید، سیستمهای توصیهگر را با یک چالش جدی مواجه می کنند که به صورت کلی از آن به عنوان مشکل کاربران تازه وارد یاد میگردد[۴۵].
یکی از ابتدایی ترین اشکال این مسئله در روش پالایش گروهی ظهور می کند زیرا آیتمهایی که توسط کاربران به آنها امتیازی داده نشده باشد قابل توصیه به سایر کاربران نمیباشند یا آیتمهای خاص که مورد توجه کاربران قرار نمیگیرند دسته دیگری از این مشکلات را ایجاد می کنند. در مقابل سیستمهای توصیهگر مبتنی بر محتوا به دلیل تمرکز بر روی ویژگیهای یک آیتم و عدم نیاز به امتیاردهی کاربران[۳۶] میتوانند برای تمامی آیتمها بکار روند و در خصوص کاربران مشابه نیز باعث بهبود پیشنهادات ارائه شده به کاربر هدف گردند.
ارائه پیشنهاد به کاربران تازه وارد از پیچیدگی و دشواریهای بیشتری برخوردار است چراکه بدون داشتن اطلاعات کافی در خصوص سلایق و ترجیحات یک کاربر پیدا نمودن کاربران مشابه یا ساختن یک پروفایل برای کاربر مقدور نمی باشد.
۲-۶-۳- کلاهبرداری و تقلب
با توجه به پذیرش و استفاده عملیاتی از سیستمهای توصیهگر در وب سایتهای تجاری و نقش کلیدی و تاثیرگذار این سیستمها در سود آوری صاحبان سرمایه، باعث بروز انواع روش های کلاهبرداری در بکارگیری سیستم توصیهگر برای تامین منافع کلاهبرداران گردیده است. به عنوان نمونه می توان به روش “حمله فشاری[۷۳]” اشاره نمود که در آن کلاهبرداران و فروشندگان متقلب سعی می کنند محصولات خود را دارای محبوبیت بیشتری در میان کاربران جلوه دهند یا در روش “حمله اتمی[۷۴]” سعی می شود تا از امتیازات کالاها و آیتمهای معرفی شده توسط رقیبان کاسته شود. این روشها و متدهای کلاهبرداری به صورت کلی تحت عنوان “حمله طولانی[۷۵]“[۴۶] و “حمله تزریق پروفایل[۷۶]“[۴۷] توسط محققین مورد مطالعه قرار گرفته است.
مطالعات نشان داده است که روش های فوق میتوانند تاثیرات مخربی بر روی امتیازات پیش بینی شده داشته باشند ولی متدهایی همچون پالایش گروهی مبتنی بر آیتم در مقابل چنین حملاتی مقاومت بیشتری از خود بروز میدهد[۴۶] و طبیعتا متدهای مبتنی بر محتوا نیز که بر سابقه و گذشته امتیازدهی یک کاربر تکیه دارند در مقابل حملات تزریق پروفایل دارای مصونیت میباشند.
در حالیکه تکنیکهای مبتنی بر محتوا در مقابل برخی از روش های کلاهبرداری مقاومت می کنند روش های پالایش گروهی در برخی موارد دارای برتری های نسبی نیز میباشند، به عنوان مثال روش های پالایش گروهی میتوانند در محیطهایی فعالیت کنند که اطلاعات محتوایی قابل ملاحظهای در خصوص آیتم ها در دسترس نباشد یا محتوای موجود مانند ایده ها و عقاید به سادگی قابل آنالیز و فهم توسط سیستمهای کامپیوتری نباشد، همچنین توانایی پیشنهاد آیتمهایی را دارند که اگرچه بر خلاف سلایق و ترجیحات قبلی کاربر میباشد ولی باعث جلب توجه و رضایتمندی کاربران میگردد.
۲-۶-۴- پیچیدگیهای محاسباتی و زمانی
فرم در حال بارگذاری ...
[چهارشنبه 1401-04-15] [ 08:31:00 ق.ظ ]
|