پیشبینی رویگردانی مشتریان در مدیریت ارتباط با مشتری با استفاده از ... |
![]() |
مدل پیشنهادی
از آنجایی که تمامی دادههای ورودی باید به تمامی دستهبندها معرفی شوند تا نتایج هر یک از دستهبندها مشخص شود، از ساختار موازی MCS برای پیشبینی رویگردانی مشتری در فاز اول استفاده شده است. در طراحی این سیستم در بخش گروه دستهبندها، سعی کردهایم از ابزار و تکنیکهایی استفاده کنیم که کاربرد گستردهای در پیشبینی رویگردانی مشتری داشتهاند. پس از مرور ادبیات، تکنیکهای درخت تصمیم (DT)، ماشین بردار پشتیبان (SVM)، k – نزدیکترین همسایه (KNN)، تحلیل تفکیککننده[۱۷۲] (DA) و بیز سادهلوحانه (NB) انتخاب شدند. همچنین در انتخاب این دستهبندها از تنوعی استفاده کردیم که هر دستهبند نقطه قوت خاصی داشته باشد:
-
- تکنیک SVM: بیشترین حاشیه اطمینان بین دسته ها را فراهم میآورد و در مقابله با مشاهدات جدید انعطافپذیرتر است (Auria and Moro 2008).
-
- درخت تصمیم: به دلیل ساختار غیر پارامتریک خود موجب دستهبندی سریع نمونههای آموزشی میگردد. همچنین قادر به شناسایی ویژگیهای مهم دادهها است (Mitra and Acharya 2003).
-
- تکنیک KNN: برای دستهبندی نمونههای آموزشی از حافظه استفاده میکند و در کار با دادههای با حجم متوسط دارای سرعت بهتری نسبت به تکنیکهای دیگر است(Bishop 1995).
-
- تکنیک DA: قادر است تعیین کند که کدام متغیر پیشگو به متغیر هدف مرتبط است (Hu 2011).
-
- تکنیک NB: بر اساس قوانین احتمال بیز کار میکند و در صورت وجود شرط استقلال متغیرها از یکدیگر، در مجموعه دادههای بزرگ دارای سرعت و دقت بالایی است (Bishop 2006).
ساختار کلی MSC پیشنهادی در شکل ۳-۲ نشان داده شده است.
شکل ۳‑۲: ساختار کلی سیستم چند دستهبند
از آنجایی که در فاز اول با یک مسئله دستهبندی دو کلاسه سروکار داریم و همچنین قدرت دستهبندهای استفاده شده متفاوت است، در طراحی بخش تابع ترکیب، از رویکرد رای اکثریت[۱۷۳] به گونهای استفاده کردیم که تکنیک دستهبند با دقت بیشتر، حق بیشتری در رایگیری داشته باشد. به عبارت دیگر، از رایگیری موزون به جای رای اکثریت استفاده شده است. بنابراین، فرمول زیر نشان دهنده تابع ترکیب رایگیری موزون است (Ruta and Gabrys 2000).
که در آن N تعداد دستهبندها، lb خروجی هر دستهبند و w وزنی است که به هر دستهبند اختصاص داده شده است. پس از طراحی ساختار کلی سیستم، برای رسیدن به ساختار بهینه در این سیستم از الگوریتم ژنتیک استفاده کردیم.
بکارگیری الگوریتم ژنتیک در سیستم چند دستهبند پیشنهادی
در بکارگیری الگوریتم ژنتیک تلاش کردهایم به طور همزمان سه بخش از ساختار مدل پیشنهادی را بهینه کنیم. این سه بخش عبارتند از:
-
- انتخاب ویژگی[۱۷۴] در بخش پایگاه داده
-
- انتخاب دستهبند در بخش گروه دستهبندها
-
- انتخاب وزنهای بهینه در تابع ترکیب رایگیری موزون
در شکل ۳-۳ بخشهایی از ساختار مدل پیشنهادی که توسط الگوریتم ژنتیک بهینه میشوند مشخص شده است.
شکل ۳‑۳: ساختار مدل پیشنهادی برای فاز اول
ساختار پاسخ:
برای پیادهسازی این مسئله از نرمافزار MATLAB استفاده کردیم. در این مسئله نیاز است که از الگوریتم ژنتیک چند بعدی[۱۷۵] استفاده کنیم. در الگوریتم ژنتیک چند بعدی، کروموزومها به جای آرایههای یک بعدی به صورت ساختارهای چند بعدی به گونهای طراحی میشوند که در هر بعد بخشی از مسئله بهینهسازی میشود. با توجه به این که در مسئله ما سه بخش از ساختار به صورت همزمان بهینه میشوند، نیاز است کروموزومها به صورت مکعبهای سه بعدی پیادهسازی شوند.
میتوان برای راحتی پیادهسازی و همچنین درک بهتر مسئله از یک آرایه سه بخشی به عنوان جایگزینی برای مکعب استفاده کرد. شکل ۳-۴ ساختار این کروموزوم را نشان میدهد. در این ساختار، بخش اول که شامل ژنهای باینری است بیانکننده ویژگیهای انتخاب شده از دادههای مسئله است. طول این بخش از کروموزوم به اندازه تعداد تمام ویژگیهای موجود در پایگاه داده است و مقدار یک برای هر ژن به معنی انتخاب آن ویژگی و مقدار صفر به معنی عدم انتخاب آن ویژگی برای مسئله دستهبندی است. بخش دوم کروموزوم نیز از ژنهای باینری تشکیل شده است و دستهبندهای انتخاب شده را تعیین میکند. طول این بخش از کروموزوم نیز به اندازه تعداد دستهبندهای استفاده شده در مسئله است و مانند آنچه در بخش اول داشتیم، مقدار یک برای هر ژن نشان دهنده انتخاب آن دستهبند و مقدار صفر به معنی عدم انتخاب دستهبند مربوطه برای حل مسئله است. بخش سوم، وزن دستهبندها را برای استفاده در تابع ترکیب رایگیری موزون نشان میدهد. طول این بخش از کروموزوم به اندازه طول بخش دوم یعنی به اندازه تعداد دستهبندهای استفاده شده در مسئله است.
شکل ۳‑۴: ساختار کروموزوم سه بعدی
عملگرهای الگوریتم ژنتیک:
-
- تقاطع: برای پیادهسازی عملگر تقاطع از ماسک تقاطع[۱۷۶] به گونهای استفاده کردیم که بخشهای باینری بصورت تک نقطهای تقاطع شوند و در بخش وزنها عملگر تقاطع حسابی[۱۷۷] اعمال شود.
-
- جهش: در پیادهسازی عملگر جهش تفاوت بین جهش باینری و حسابی در نظر گرفته شده است.
-
- انتخاب: در انتخاب والدین از تکنیک چرخ رولت به گونهای استفاده کردیم که احتمال انتخاب هر عضو برابر باشد. به عبارت دیگر از روش انتخاب تصادفی استفاده شده است.
تابع برازندگی:
تابع برازندگی این الگوریتم ژنتیک را برابر با دقت سیستم چند دستهبند قرار دادهایم. برای محاسبه دقت دستهبندی، روش ماتریس آشفتگی[۱۷۸] را بکار گرفتهایم؛ این روش با بهره گرفتن از ماتریس آشفتگی که در جدول ۳-۱ نشان داده شده است دقت پیشبینی را محاسبه میکند.
جدول ۳‑۱ :ماتریس آشفتگی
کلاس پیشبینی شده | |||
غیر رویگردان | رویگردان | کلاس واقعی | |
FP |
فرم در حال بارگذاری ...
[پنجشنبه 1400-08-13] [ 07:46:00 ب.ظ ]
|