مدل پیشنهادی
از آنجایی که تمامی داده‌های ورودی باید به تمامی دسته‌بندها معرفی شوند تا نتایج هر یک از دسته‌بندها مشخص شود، از ساختار موازی MCS برای پیش‌بینی رویگردانی مشتری در فاز اول استفاده شده است. در طراحی این سیستم در بخش گروه دسته‌بندها، سعی کرده‌ایم از ابزار و تکنیک‌هایی استفاده کنیم که کاربرد گسترده‌ای در پیش‌بینی رویگردانی مشتری داشته‌اند. پس از مرور ادبیات، تکنیک‌های درخت تصمیم (DT)، ماشین بردار پشتیبان (SVM)، k – نزدیک‌ترین همسایه (KNN)، تحلیل تفکیک‌کننده[۱۷۲] (DA) و بیز ساده‌لوحانه (NB) انتخاب شدند. همچنین در انتخاب این دسته‌بندها از تنوعی استفاده کردیم که هر دسته‌بند نقطه قوت خاصی داشته باشد:
پایان نامه - مقاله - پروژه

 

    1. تکنیک SVM: بیشترین حاشیه اطمینان بین دسته‌ ها را فراهم می‌آورد و در مقابله با مشاهدات جدید انعطاف‌پذیرتر است (Auria and Moro 2008).

 

    1. درخت تصمیم: به دلیل ساختار غیر پارامتریک خود موجب دسته‌بندی سریع نمونه‌های آموزشی می‌گردد. همچنین قادر به شناسایی ویژگی‌های مهم داده‌ها است (Mitra and Acharya 2003).

 

    1. تکنیک KNN: برای دسته‌بندی نمونه‌های آموزشی از حافظه استفاده می‌کند و در کار با داده‌های با حجم متوسط دارای سرعت بهتری نسبت به تکنیک‌های دیگر است(Bishop 1995).

 

    1. تکنیک DA: قادر است تعیین کند که کدام متغیر پیشگو به متغیر هدف مرتبط است (Hu 2011).

 

    1. تکنیک NB: بر اساس قوانین احتمال بیز کار می‌کند و در صورت وجود شرط استقلال متغیرها از یکدیگر، در مجموعه داده‌های بزرگ دارای سرعت و دقت بالایی است (Bishop 2006).

 

ساختار کلی MSC پیشنهادی در شکل ۳-۲ نشان داده شده است.
شکل ‏۳‑۲: ساختار کلی سیستم چند دسته‌بند
از آنجایی که در فاز اول با یک مسئله دسته‌بندی دو کلاسه سروکار داریم و همچنین قدرت دسته‌بندهای استفاده شده متفاوت است، در طراحی بخش تابع ترکیب، از رویکرد رای اکثریت[۱۷۳] به گونه‌ای استفاده کردیم که تکنیک دسته‌بند با دقت بیشتر، حق بیشتری در رای‌گیری داشته باشد. به عبارت دیگر، از رای‌گیری موزون به جای رای اکثریت استفاده شده است. بنابراین، فرمول زیر نشان دهنده تابع ترکیب رای‌گیری موزون است (Ruta and Gabrys 2000).
که در آن N تعداد دسته‌بندها، lb خروجی هر دسته‌بند و w وزنی است که به هر دسته‌بند اختصاص داده شده است. پس از طراحی ساختار کلی سیستم، برای رسیدن به ساختار بهینه در این سیستم از الگوریتم ژنتیک استفاده کردیم.
بکارگیری الگوریتم ژنتیک در سیستم چند دسته‌بند پیشنهادی
در بکارگیری الگوریتم ژنتیک تلاش کرده‌ایم به طور همزمان سه بخش از ساختار مدل پیشنهادی را بهینه کنیم. این سه بخش عبارتند از:

 

    • انتخاب ویژگی[۱۷۴] در بخش پایگاه داده

 

    • انتخاب دسته‌بند در بخش گروه دسته‌بندها

 

    • انتخاب وزن‌های بهینه در تابع ترکیب رای‌گیری موزون

 

در شکل ۳-۳ بخش‌هایی از ساختار مدل پیشنهادی که توسط الگوریتم ژنتیک بهینه می‌شوند مشخص شده است.
شکل ‏۳‑۳: ساختار مدل پیشنهادی برای فاز اول
ساختار پاسخ:
برای پیاده‌سازی این مسئله از نرم‌افزار MATLAB استفاده کردیم. در این مسئله نیاز است که از الگوریتم ژنتیک چند بعدی[۱۷۵] استفاده کنیم. در الگوریتم ژنتیک چند بعدی، کروموزوم‌ها به جای آرایه‌های یک بعدی به صورت ساختارهای چند بعدی به گونه‌ای طراحی می‌شوند که در هر بعد بخشی از مسئله بهینه‌سازی می‌شود. با توجه به این که در مسئله ما سه بخش از ساختار به صورت همزمان بهینه می‌شوند، نیاز است کروموزوم‌ها به صورت مکعب‌های سه بعدی پیاده‌سازی شوند.
می‌توان برای راحتی پیاده‌سازی و همچنین درک بهتر مسئله از یک آرایه سه بخشی به عنوان جایگزینی برای مکعب استفاده کرد. شکل ۳-۴ ساختار این کروموزوم را نشان می‌دهد. در این ساختار، بخش اول که شامل ژن‌های باینری است بیان‌کننده ویژگی‌های انتخاب شده از داده‌های مسئله است. طول این بخش از کروموزوم به اندازه تعداد تمام ویژگی‌های موجود در پایگاه داده است و مقدار یک برای هر ژن به معنی انتخاب آن ویژگی و مقدار صفر به معنی عدم انتخاب آن ویژگی برای مسئله دسته‌بندی است. بخش دوم کروموزوم نیز از ژن‌های باینری تشکیل شده است و دسته‌بندهای انتخاب شده را تعیین می‌کند. طول این بخش از کروموزوم نیز به اندازه تعداد دسته‌بندهای استفاده شده در مسئله است و مانند آنچه در بخش اول داشتیم، مقدار یک برای هر ژن نشان دهنده انتخاب آن دسته‌بند و مقدار صفر به معنی عدم انتخاب دسته‌بند مربوطه برای حل مسئله است. بخش سوم، وزن دسته‌بندها را برای استفاده در تابع ترکیب رای‌گیری موزون نشان می‌دهد. طول این بخش از کروموزوم به اندازه طول بخش دوم یعنی به اندازه تعداد دسته‌بندهای استفاده شده در مسئله است.
شکل ‏۳‑۴: ساختار کروموزوم سه بعدی
عملگرهای الگوریتم ژنتیک:

 

    • تقاطع: برای پیاده‌سازی عملگر تقاطع از ماسک تقاطع[۱۷۶] به گونه‌ای استفاده کردیم که بخش‌های باینری بصورت تک نقطه‌ای تقاطع شوند و در بخش وزن‌ها عملگر تقاطع حسابی[۱۷۷] اعمال شود.

 

    • جهش: در پیاده‌سازی عملگر جهش تفاوت بین جهش باینری و حسابی در نظر گرفته شده است.

 

    • انتخاب: در انتخاب والدین از تکنیک چرخ رولت به گونه‌ای استفاده کردیم که احتمال انتخاب هر عضو برابر باشد. به عبارت دیگر از روش انتخاب تصادفی استفاده شده است.

 

تابع برازندگی:
تابع برازندگی این الگوریتم ژنتیک را برابر با دقت سیستم چند دسته‌بند قرار داده‌ایم. برای محاسبه دقت دسته‌بندی، روش ماتریس آشفتگی[۱۷۸] را بکار گرفته‌ایم؛ این روش با بهره گرفتن از ماتریس آشفتگی که در جدول ۳-۱ نشان داده شده است دقت پیش‌بینی را محاسبه می‌کند.
جدول ‏۳‑۱ :ماتریس آشفتگی

 

کلاس پیش‌بینی شده  
غیر رویگردان رویگردان   کلاس واقعی
FP
موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...