صفحه محصول - مبانی نظری و پیشینه تحقیق داده کاوی و خوشه بندی فازی

توضیحات

مبانی نظری و پیشینه تحقیق داده کاوی و خوشه بندی فازی (docx) 1 صفحه

دسته بندی : تحقیق

نوع فایل : Word (.docx) ( قابل ویرایش و آماده پرینت )

تعداد صفحات: 1 صفحه

قسمتی از متن Word (.docx) :

233807021526500 دانشکدهی مهندسی صنایع و مدیریت گروه : مدیریت پایان نامه کارشناسی ارشد خوشهبندی فازی مشتریان و تحلیل رفتارآنها با رویکرد دادهکاوی پویا (مطالعه موردی : تلفن همراه سامسونگ) دانشجو : مریم علائیزاده استاد راهنما : دکتر رضا شیخ پایاننامه ارشد جهت اخذ درجه کارشناسی ارشد 8.1 تعریف واژه ها و اصطلاحات 1.8.1 داده کاوی داده کاوی استخراج اطلاعات و دانش و کشف الگوهای پنهان از پایگاه داده های بسیار بزرگ و پیچیده می باشد. 2.8.1 خوشه بندی خوشه بندی به عنوان یکی از فعالیت های داده کاوی میباشد و به گروه بندی کردن تراکنش ها و مشاهدات یا حالت ها درکلاس های مشابه می پردازد. همچنین یک خوشه مجموعه ای از رکوردها است که به هم شبیه می باشند و از رکوردهای بیرون خوشه تفاوت دارند. 3.8.1 داده کاوی پویا داده کاوی پویا به معنای درک و پیش بینی چگونگی تغییر الگوها در هر زمان است. برای نظارت بر تغییرات، مفاهیم داده کاوی پویا توسعه داده شده اند. 4.8.1 منطق فازی نظریه فازی برای بیان و تشریح عدم قطعیت و عدم دقت در رویدادها به وجود آمده است که براساس منطق چند ارزشی بوجود آمده است. پروفسور لطفی زاده برای اولین بار تئوری مجموعه های فازی و منطق فازی را مطرح کرد، وی با معرفی نظریه مجموعه های فازی مقدمات مدل سازی اطلاعات نادقیق و استدلال تقریبی با معادله های ریاضی را فراهم نمود که در نوع خود تحولی عظیم در ریاضیات و منطق کلاسیک بوجود آورد. فهرست مطالب 1-1-تعریف واژه ها و اصلاحات 9 1-8-1- داده کاوی 9 1-8-2- خوشه بندی 9 1-8-3- داده کاوی پویا 9 1-8-4- منطق فازی 10 فصل دوم: ادبیات تحقیق 11 2-1- مقدمه 13 2-2- داده کاوی 13 2-3- خوشه بندی 16 2-3-1- هدف خوشه بندی 18 2-3-2- انواع خوشه بندی 18 2-3-3- الگوریتم های خوشه بندی 22 2-3-4- معیار فاصله 23 2-3-5- الگوریتم C-means 24 2-3-6- الگوریتم FCM 25 2-4- طبقه بندی 29 2-5- کشف قواعد وابستگی 30 2-6- کشف الگوهای ترتیبی 30 2-7- داده کاوی پویا 31 2-8- خوشه بندی پویا 32 2-9- روش های نوین برای خوشه بندی فازی پویا 34 2-9-1- اختصاص اعضای پویا به کلاس های ایستا 36 2-9-1-1- روش به کار بردن مسیر در خوشه بندی 36 2-9-1-2- تشریح عملکرد c- میانگین فازی 37 2-9-2- اختصاص اعضای ایستا به کلاس پویا 39 2-9-2-1- شرح جزئیات روش پیشنهاد شده 41 2-10- منطق فازی 48 2-10-1 مجموعه های فازی 48 2-10-2- میانگین فازی 51 2-10-2-1- میانگین مثلثی 51 2-10-2-2- میانگین ذوزنقه ای 52 2-10-3- فازی زدایی از میانگین فازی 52 2-11- بخش بندی و تحلیل رفتار مشتریان 53 منابع فصل دوم ادبیات و پیشینه تحقیق مقدمه تحولات پیچیده و پرشتاب جهانی در عرصههای علم، فناوری، ارزشها و معیارها بسیاری از سازمانهای موفق جهان را بر آن داشته است تا اهداف، روشها و ساختار خود را در جهت شناخت هر چه بیشتر مشتریان هدایت کنند. در چنین فضایی داشتن درک صحیح از مشتریان و فرایند مصرف، مزیتهای متعددی را در بر دارد. این مزیتها شامل کمک به مدیران در جهت تصمیم‌گیری، تهیه یک مبنای شناختی از طریق تحلیل رفتار مصرف‌کنندگان، کمک به قانون‌گذاران و تنظیم‌کنندگان برای وضع قوانین مربوط به خرید و فروش کالا و خدمات و در نهایت به مشتریان در جهت تصمیم‌گیری بهتر است. با علم به نحوه رفتار مخاطبان است که می‌توان رسانه و پیام مناسب را انتخاب کرد. بر این اساس، تحلیل رفتار مصرف کننده در مواردی همچون طراحی آمیخته بازاریابی، بخش‌بندی بازار و تعیین موقعیت و متمایز سازی محصول نیز امری لازم و حیاتی است. اما رفتار مشتری موضوعی بحث انگیز و چالشی است زیرا رفتار مشتری ماهیتی پویا دارد و در طول زمان تغییر می کند و این موضوع بر کیفیت تحلیل رفتار افراد تاثیر بسزایی دارد. لذا مدیران و بازاریابان باید در تصمیم گیری ها و برنامه ریزی های خود به این موضوع توجه داشته باشند و بر اساس آن زمینه را برای موفقیت هرچه بیشتر خود در فضای رقابتی را فرهم نمایند. 2.2 دادهکاوی دادهکاوی به معنای يافتن نيمه خودکار الگوهای پنهان موجود در مجموعه دادههای موجود می باشد. دادهکاوی از مدل های تحليلی ، کلاس بندی و تخمين و برآورد اطلاعات و ارائه نتايج با استفاده از ابزارهای مربوطه بهره می گيرد. میتوان گفت که داده کاوی در جهت کشف اطلاعات پنهان و روابط موجود در بين دادههای فعلی و پيشبينی موارد نا معلوم و يا مشاهده نشده عمل میکند. برای انجام عمليات دادهکاوی لازم است قبلا روی دادههای موجود پيشپردازش هايی انجام گيرد. عمل پيش پردازش اطلاعات خود از دو بخش کاهش اطلاعات و خلاصهسازی و کلیسازی دادهها تشکيل شده است. کاهش اطلاعات عبارت است از توليد يک مجموعه کوچک تر، از دادههای اوليه، که تحت عمليات دادهکاوی نتايج تقريبا يکسانی با نتايج دادهکاوی روی اطلاعات اوليه به دست دهد. پس از انجام عمل کاهش اطلاعات و حذف خصايص غير مرتبط نوبت به خلاصهسازی و کلیسازی دادهها می رسد. دادههای موجود در بانکهای اطلاعاتی معمولا حاوی اطلاعات در سطوح پايينی هستند، بنابراين خلاصهسازی مجموعه بزرگی از دادهها و ارائه آن به صورت يک مفهوم کلی اهميت بسيار زيادی دارد. کلیسازی اطلاعات، فرآيندی است که تعداد زيادی از رکوردهای يک بانک اطلاعاتی را به صورت مفهومی در سطح بالاتر ارائه می نمايد (هان و کمبر، 2001). در دادهکاوی ، چهار عمل اصلی انجام می شود که عبارتند از: مدلسازی پیشگویی کننده ، تقطیع پایگاه داده ها ، تحلیل پیوند ، تشخیص انحراف. از عملیاتهای اصلی مذکور ، یک یا بیش از یکی از آنها در پیادهسازی کاربردهای گوناگون داده کاوی استفاده می شوند. نگاهی به ترجمه تحت اللفظی داده کاوی، به ما به درک بهت این واژه کمک می کند. Mine به معنای استخراج از منابع نهفته و با ارزش زمین اتلاق می شود. پیوند این کلمه با کلمه داده، جستجوی عمیق جهت پیدا کردن اطلاعات اضافی مفید که قبلا نهفته بودند، از دادههای قابل دسترس حجیم، را پیشنهاد می کند. دادهکاوی یک رشته نسبتا جدید علمی می باشد که از انجام تحقیقات در رشتههای آمار، یادگیری ماشینی، علوم کامپیوتر خصوصا مدیریت پایگاه داده شکل گرفته است (برسون و همکاران، 2004). تعاریف متنوعی از دادهکاوی در مراجع مختلف و توسط افراد مختلف ارائه شده است از جمله: دادهکاوی فرایند شناخت الگوهای معتبر، جدید، ذاتا مفید و قابل فهم از دادهها می باشد. دادهکاوی (کشف دانش از پایگاه داده ها نامیده می شود) نشانگر فرایند جالب استخراج دانش از قبل ناشناخته (الگو) از داده است . اصطلاح دادهکاوی به فرایند نیم خودکار تجزیه و تحلیل پایگاه دادههای بزرگ به منظور یافتن الگوهای مفید اطلاق می شود (ساندر، 2003). فرایند کشف الگوهای مفید از دادهها را دادهکاوی می گویند. فرایند انتخاب، کاوش و مدل بندی دادههای حجیم، جهت کشف روابط نهفته با هدف به دست آوردن نتایج واضح و مفید، برای مالک پایگاه دادهها را، دادهکاوی گویند. اما تعریفی که در اکثر مراجع به صورت مشترک ذکر شده عبارت است از " استخراج اطلاعات و دانش و کشف الگوهای پنهان از پایگاه دادههای بسیار بزرگ و پیچیده". دادهکاوی فرایندی است که از ابزارهای تحلیلی گوناگون برای کشف الگوها و روابط بین دادهها استفاده می کند که ممکن است برای اعتبار بخشیدن به پیش بینی استفاده شود (بری و لینوف،1997). دادهکاوی یک متدولوژی بسیار قوی و با پتانسیل بالا می باشد که به سازمان کمک می کند که بر روی مهمترین اطلاعات از مخزن دادههای خود تمرکز نمایند. دادهکاوی کمک می کند تا سازمانها با کاوش بر روی دادههای یک سیستم، الگوها ، روندها و رفتارهای آینده را کشف و پیش بینی کرده و بهتر تصمیم بگیرند. دادهکاوی با استفاده از تحلیل وقایع گذشته یک تحلیل اتوماتیک و پیش بینانه ارائه می نماید و به سوالاتی جواب می دهد که پاسخ آنها در گذشته ممکن نبوده و یا به زمان زیادی نیاز داشت. ابزارهای دادهکاوی الگوهای پنهانی را کشف و پیش بینی می کنند که متخصصان ممکن است به دلیل اینکه این اطلاعات و الگوها خارج از انتظار آن ها باشد، آن ها را مدنظر قرار ندهند و به آنها دست نیابند. شکل(1.2) : روشهای دادهکاوی 3.2 خوشهبندی خوشهبندی به عنوان یکی از فعالیتهای دادهکاوی میباشد و به گروهبندی کردن تراکنشها و مشاهدات یا حالتها درکلاسهای مشابه می پردازد. همچنین یک خوشه مجموعهای از رکوردها است که به هم شبیه می باشند و از رکوردهای بیرون خوشه تفاوت دارند. در خوشهبندی متغیر هدف وجود ندارد و به طبقهبندی تخمین و پیشگوئی مقدار متغیر هدف نمی پردازد (لاروس، 2005). خوشهبندی یکی از شاخههای یادگیری بدون نظارت می باشد و فرآیند خودکاری است که در طی آن، نمونهها به دستههایی که اعضای آن مشابه یکدیگر می باشند تقسیم می شوند که به این دستهها خوشه گفته میشود. بنابراین خوشه مجموعهای از اشیاء می باشد که در آن اشیاء با یکدیگر مشابه بوده و با اشیاء موجود در خوشههای دیگر غیر مشابه می باشند. برای مشابه بودن می توان معیارهای مختلفی را در نظر گرفت مثلا می توان معیار فاصله را برای خوشهبندی مورد استفاده قرار داد و اشیائی را که به یکدیگر نزدیکتر هستند را بعنوان یک خوشه در نظر گرفت که به این نوع خوشهبندی، خوشهبندی مبتنی بر فاصله نیز گفته می شود. بعنوان یک مثال شکل زیر را در نظر بگیرید در این شکل هر یک از دایرههای کوچک یک وسیله نقلیه (شیء) را نشان می دهد که با ویژگیهای وزن و حداکثر سرعت مشخص شده اند. هر یک از بیضیها یک خوشه می باشد و عبارت کنار هر بیضی برچسب آن خوشه را نشان می دهد. کل دستگاه مختصات که نمونهها در آن نشان داده شده اند را فضای ویژگی می گویند. شکل (2-2) : خوشه بندی وسایل نقلیه همانطور که در شکل می بینید وسایل نقلیه به سه خوشه تقسیم شده اند. برای هر یک از این خوشهها می توان یک نماینده در نظر گرفت مثلا می توان میانگین وسایل نقلیه باری را محاسبه کرد و به عنوان نماینده خوشه وسایل نقلیه باری معرفی نمود. در واقع الگوریتم های خوشه بندی اغلب بدین گونه اند که یک سری نماینده اولیه برای نمونه های ورودی در نظر گرفته می شود و سپس از روی میزان تشابه نمونه ها با این نمایندههای مشخص می شود که نمونه به کدام خوشه تعلق دارد و بعد از این مرحله نمایندههای جدید برای هر خوشه محاسبه می شود و دوباره نمونهها با این نمایندهها مقایسه می شوند تا مشخص شود که به کدام خوشه تعلق دارند و این کار آنقدر تکرار می شود تا زمانی که نمایندههای خوشهها تغییری نکنند. 1.3.2 هدف از خوشهبندی هدف خوشهبندی یافتن خوشههای مشابه از اشیاء در بین نمونههای ورودی می باشد اما چگونه می توان گفت که یک خوشهبندی مناسب است و دیگری مناسب نیست؟ می توان نشان داد که هیچ معیار مطلقی برای بهترین خوشه بندی وجود ندارد بلکه این بستگی به مساله و نظر کاربر دارد که باید تصمیم بگیرد که آیا نمونهها بدرستی خوشهبندی شدهاند یا خیر. با این حال معیارهای مختلفی برای خوب بودن یک خوش بندی ارائه شده است که می تواند کاربر را برای رسیدن به یک خوشهبندی مناسب راهنمایی کند که در بخشهای بعدی چند نمونه از این معیارها آورده شده است. یکی از مسایل مهم در خوشه بندی انتخاب تعداد خوشهها می باشد. در بعضی از الگوریتمها تعداد خوشهها از قبل مشخص شده است و در بعضی دیگر خود الگوریتم تصمیم می گیرد که دادهها به چند خوشه تقسیم شوند (قاسمی و خانگلدی، 1388). 2.3.2 انواع خوشهبندی روشهای خوشهبندی بسیار متنوع بوده و تفکیک آنها از یکدیگر بسیار مهم است.انتخاب بهترین این روشها برای رسیدن به بهترین نتیجه از بحثهای مهم در این زمینه است. متاسفانه روش مناسبی که بتواند بهترین روش را از بین روشهای متنوع خوشهبندی انتخاب کند وجود ندارد. در اکثر موارد نیز تنها آشنایی محقق و قابل دسترس بودن نرم افزارهای مربوطه است که مبنای استفاده از روش می شود. روشهای خوشهبندی متفاوتی وجود دارد که برای تمایز آنها از یکدیگر از پنج خصوصیت استفاده می شود. ابتدا به تعریف این خصوصیات پرداخته سپس روشهای خوشهبندی را بر اساس آنها معرفی میکنیم. روشهای انحصاری در مقابل روشهای غیر انحصاری: روشهای انحصاری روشهایی هستند که هر گونه تنها به یک گروه تعلق می گیرد در حالی که روشهای غیر انحصاری یک فرد به یک یا چند گروه تعلق می گیرد. روشهای کلاسیک خوشه بندی از جمله روشهای انحصاری و روشهای خوشهبندی فازی از جمله روشهای غیر انحصاری هستند. روشهای تکرار توالی در مقابل روشهای همزمان : در روشهای تکرار توالی عمل خوشهبندی در دفعات متفاوت بر روی افراد انجام می گیرد در حالی که در روشهای همزمان این عمل به طور آنی بر روی همه افراد انجام می شود. روشهای سلسله مراتبی در مقابل روشهای غیر سلسله مراتبی : در روشهای سلسلهمراتبی خوشهها به شکل سلسلهمراتبی از خوشههای بزرگ تا کوچک و یا برعکس تعیین می شوند. به عبارت دیگر در این روشها افراد در یک خوشه قرار میگیرند که خود این خوشه نیز به خوشههای دیگری تقسیم می شود. در روشهای غیر سلسلهمراتبی افراد به طور مستقیم در خوشههای متفاوتی قرار می گیرند. روشهای تجمعی در مقابل روشهای مقسمی: در روشهای تجمعی شبیهترین گونهها در یک خوشه قرار گرفته و این خوشهها با خوشههای دیگر تلفیق شده تا خوشه بزرگتری را بوجود آورند و این عمل تا رسیدن به بزرگترین خوشه که همه گونهها در آن قرار دارند ادامه می یابد. در روشهای مقسمی ابتدا گونهها به دو خوشه تقسیم شده و سپس این خوشهها به خوشههای ریزتری تقسیم می شوند. روشهای چند صفتی در مقابل روشهای تک صفتی : برای قراردادن گونهها در خوشههای متفاوت در روشهای چند صفتی از تمامی خصوصیات (متغیرها) آن ها استفاده می شود در صورتی که در روشهای تک صفتی تنها از یک ویژگی (متغیر) برای خوشهبندی استفاده میشود (طهماسبی،1390). فرآيند خوشهبندی سعی دارد که يک مجموعه داده را به چندين خوشه تقسيم نمايد بطوريکه دادههای قرار گرفته در يک خوشه با يکديگر شبيه بوده و با دادههای خوشههای ديگر متفاوت باشند. در حال حاضر روشهای متعددی برای خوشهبندی دادهها وجود دارد که بر اساس نوع دادهها، شکل خوشهها، فاصله دادهها و غيره عمل خوشهبندی را انجام میدهند. مهمترين روشهای خوشهبندی در زير معرفی شدهاند: روشهای تقسيمبندی (تفکیکی) : روشهای خوشهبندی که به روش تقسيم بندی عمل میکنند، دادههای موجود در يک مجموعه داده را به k خوشه تقسيم میکنند، بطوري که هر خوشه دو خصوصيت زير را داراست : هر خوشه يا گروه حداقل شامل يک داده میباشد. هر داده موجود در مجموعه داده دقيقا به يک گروه يا خوشه تعلق دارد. معيار اصلی در چنين مجموعه دادههايی ميزان شباهت دادههای قرار گرفته در هر خوشه میباشد. در حاليکه دادههای قرار گرفته در دو خوشه مختلف از نظر شباهت با يکديگر فاصله زيادی دارند. مقدار k که بعنوان پارامتر استفاده میگردد، هم میتواند بصورت پويا تعيين گردد و هم اينکه قبل از شروع الگوريتم خوشهبندی مقدار آن مشخص گردد. روشهای سلسله مراتبی : روش های سلسله مراتبی به دو دسته کلی روش های bottom-up و روش های top-down تقسيم میگردند. روش های سلسله مراتبی bottom-up به اين صورت عمل میکنند که در شروع هر کدام از دادهها را در يک خوشه جداگانه قرار میدهد و در طول اجرا سعی میکند تا خوشههايی نزديک به يکديگر را با هم ادغام نمايد. اين عمل ادغام تا زمانی که يا تنها يک خوشه داشته باشيم و يا اينکه شرط خاتمه برقرار گردد، ادامه میيابد. روش های top-down دقيقا به طريقه عکس عمل میکنند، به اين طريق که ابتدا تمام دادهها را در يک خوشه قرار میدهد و در هر تکرار از الگوريتم، هر خوشه به خوشههای کوچکتر شکسته میشود و اين کار تا زمانی ادامه میيابد که يا هر کدام از خوشهها تنها شامل يک داده باشند و يا شرط خاتمه الگوريتم برقرار گردد. شرط خاتمه معمولا تعداد کلاستر يا خوشه میباشد. روشهای مبتنی بر چگالی : اکثر روشهای خوشهبندی که به روش تقسيمبندی عمل میکنند معمولا از تابع فاصله بعنوان تابع معيار خود بهره میبرند. استفاده از چنين معياری باعث میگردد که الگوريتم خوشهبندی تنها قادر به ايجاد خوشههايی با اشکال منظم باشد. در صورتي که اگر خوشههای واقعی در دادهها دارای اشکال غيرمنظمی باشند، اين الگوريتمها در خوشهبندی آنها با مشکل مواجه میگردند. برای حل اين گونه مشکلات يکسری از روشها برای خوشهبندی پيشنهاد گرديدهاند که عمل خوشهبندی را بر مبنای چگالی دادهها انجام میدهند. ايده اصلی در اين روشها بر اين اساس است که خوشهها تا زمانی که دادههای قرار گرفته همسايگی خوشهها از حد معينی بيشتر باشد، رشد میکنند و بزرگ میشوند. چنين روش هايی قادرند خوشههايی با شکلهای نامنظم نيز ايجاد نمايند. البته دسته ديگری از روشهای خوشهبندی مانند روشهای مبتنی بر گريد، روشهای مبتنی بر مدل و ... وجود دارند که میتوانيد آنها را در همین مرجع مطالعه نماييد (هان و کمبر،2001). 3.3.2 الگوریتم های خوشه بندی تاکنون الگوریتم های مختلف و متعددی برای خوشه بندی ارائه شدهاند که در ادامه به برخی از مهمترین و پر کاربردترین آن ها اشاره می کنیم. شکل (2-3) : انواع الگوریتم های خوشه بندی در اینجا ما قصد نداریم وارد مباحث مربوط به الگوریتم های خوشه بندی شویم و تنها روش K-means و FCM را به دلیل استفاده در پژوهش تشریح خواهیم نمود. در هر فرآیند خوشه بندی مراحلی طی می شود که عبارتند از : تهیه و ارائه ماتریس دادهها استاندارد کردن ماتریس دادهها محاسبه ماتریس مجاورت (فاصله یا مشابهت) اجرای روش خوشهبندی محاسبه معیار اعتبار (حسین زاده و سلاجقه،2012). 4.3.2 معیار فاصله (تشابه) یکی از مسائل مهم در خوشه بندی تعیین معیاری برای محاسبه فاصله بین داده هاست. معیارهای مختلفی برای اندازه گیری فاصله بین اشیا وجود دارد که از معمولترین و پرکاربردترین آنها می توان فاصله اقلیدسی را نام برد. فاصله اقلیدسی برای دو نقطه X,Y در فضای n بعدی از رابطه زیر بدست می آید. (2-1) dx,y=i=1nxi-yi اگر معیار تشابه در تابع هدف بر اساس فاصله تعریف شود می توان از تعاریف مختلفی که در مورد فاصله وجود دارد استفاده کرد که در زیر چند نمونه از این توابع آورده شده است: شکل (2-4) : معیارهای تشابه بر اساس توابع فاصله مختلف الگوریتم C-means این الگوریتم یکی از معروفترین و سادهترین الگوریتمها است و علی رغم اینکه سال ها از ابداع آن می گذرد و پس از آن تعداد زیادی الگوریتم خوشه بندی توسعه داده شده اند، اما به دلیل مزایایی مثل سهولت پیاده سازی، سادگی و کارایی بالا هنوز هم به طور وسیعی مورد استفاده قرار می گیرد . این روش علی‌رغم سادگی آن یک روش پایه برای بسیاری از روش‌های خوشه‌بندی دیگر (مانند خوشه‌بندی فازی) محسوب می‌شود. این روش روشی انحصاری و مسطح محسوب می‌شود ( الپایدین،2004). برای الگوریتم C-meansتابع زير به عنوان تابع هدف مطرح است. J=j=1ki=1xxij-cj2 (2-2) که ║║ معيار فاصلة بين نقاط و cj مرکز خوشة j ام است. در این الگوریتم میانگین داده های یک خوشه ، نماینده یک خوشه است. مراحل الگوریتم به صورت زیر است: انتخاب تعداد خوشه ها ،C انتخاب تصادفی Cنقطه برای مقدار دهی اولیه مراکز خوشه ها. برای هر نمونه نزدیکترین مرکز خوشه را با استفاده از فاصله اقلیدسی پیدا می کنیم. در پایان این مرحله تمام نمونه ها در C خوشه قرار دارند. برای هر کدام از خوشه ها، مراکز ثقل جدید را محاسبه و مقدار آن را به روز رسانی می کنیم. تکرار مراحل 2 و 3 تا زمانی که الگوریتم خاتمه یابد. الگوریتم تا زمانی ادامه میابد که معیار مربع خطای تعریف شده به صورت رابطه زیر حداقل شود.حاصل این عبارت مجموع فاصله اشیا از خوشه خودشان است. E=i=1cp∈ci(p-mi)2 (2-3) که در آن mi مرکز خوشه iام و C تعداد خوشه هاست. همانطور که مشاهده شد هدف این الگوریتم حداقل کردن فاصله بین اجزای یک خوشه و حداکثر کردن فاصله بین اجزای خوشه های مجزاست. اما این الگوریتم معایبی دارد که از جمله آن می توان موارد زیر را برشمرد. حساس بودن نسبت به داده های دور از مرکز وابسته بودن نتایج به انتخاب مراکر اولیه و انجام یک جستجوی محلی ناتوانی در شناسایی داده نویز (حسین زاده و سلاجقه، 2012). 6.3.2 الگوریتم FCM مشابه الگوریتم c میانگین کلاسیک در این الگوریتم نیز تعداد خوشه ها (c) از قبل مشخص شده است. تابع هدفی که برای این الگوریتم تعریف شده است بصورت زیر می باشد: J=i=1ck=1nuikmdik2=i=1ck=1nuikmxk-vi2 (2-4) در فرمول فوق m یک عدد حقیقی بزرگتر از 1 است که در اکثر موراد برای m عدد 2 انتخاب می شود.xk نمونه k ام است و viنماینده یا مرکز خوشه i ام است. Uik میزان تعلق نمونه i ام در خوشه k ام را نشان می دهد. علامت ||*|| میزان تشابه (فاصله) نمونه با (از) مرکز خوشه می باشد که می توان از هر تابعی که بیانگر تشابه نمونه و مرکز خوشه باشد را استفاده کرد. از روی Uikمی توان یک ماتریس U تعریف کرد که دارای c سطر و n ستون می باشد و مولفههای آن هر مقداری بین 0 تا 1 را می توانند اختیار کنند. اگر تمامی مولفههای ماتریس U بصورت 0 و یا 1 باشند الگوریتم مشابه c میانگین کلاسیک خواهد بود. با اینکه مولفههای ماتریس U می توانند هر مقداری بین 0 تا 1 را اختیار کنند اما مجموع مولفههای هر یک از ستونها باید برابر 1 باشد و داریم: (2-5) i=1cuik=1, ∀ k=1,…,n معنای این شرط این است که مجموع تعلق هر نمونه به c خوشه باید برابر 1 باشد. با استفاده از شرط فوق و مینیمم کردن تابع هدف خواهیم داشت: (2-6) و (2-7) مراحل الگوریتم: مقدار دهی اولیه برای c، m و U0. خوشه های اولیه حدس زده شوند. مراکز خوشهها محاسبه شوند (محاسبه viها). محاسبه ماتریس تعلق از روی خوشههای محاسبه شده در 2. اگر Ul1Ul الگوریتم خاتمه می یابد و در غیر اینصورت برو به مرحله 2. برای مشاهده عملکرد خوشه بندی فازی به مثال زیر توجه کنید. در شکل زیر یک توزیع یک بعدی از نمونههای ورودی را آورده شده است. شکل (2-5) : توزیع یک بعدی نمونهها اگر از الگوریتم c میانگین کلاسیک استفاده کنیم داده های فوق به دو خوشه مجزا تقسیم خواهند شد و هر نمونه تنها متعلق به یکی از خوشه ها خواهد بود. بعبارت دیگر تابع تعلق هر نمونه مقدار 0 یا 1 خواهد داشت. نتیجه خوشه بندی کلاسیک مطابق شکل زیر است: شکل (2-6) : خوشه بندی کلاسیک نمونه های ورودی شکل 6 تابع تعلق مربط به خوشه A را نشان می دهد. تابع تعلق خوشه B متمم تابع تعلق A می باشد. همانطور که مشاهده می کنید نمونههای ورودی تنها به یکی از خوشه ها تعلق دارند و بعبارت دیگر ماتریس U بصورت باینری می باشد. حال اگر از خوشه بندی فازی استفاده کنیم خواهیم داشت: شکل (2-7) : خوشه بندی فازی نمونه ها مشاهده می کنید که در این حالت منحنی تابع تعلق هموارتر است و مرز بین خوشه ها بطور قطع و یقین مشخص نشده است. بعنوان مثال نمونه ای که با رنگ قرمز مشخص شده است با درجه تعلق 0.2 به خوشه A و با درجه تعلق 0.8 به خوشه B نسبت داده شده است. نقاط قوت الگوریتم c میانگین فازی: همیشه همگرا می شود. بدون نظارت بودن الگوریتم. نقاط ضعف الگوریتم c میانگین فازی: زمان محاسبات زیاد است. حساس به حدس های اولیه میباشد و ممکن است در مینیمم های محلی متوقف شود. حساس به نویز میباشد (قاسمی و خانگلدی،1388). خوشهبندی فازی یک روش خوشهبندی مشترک است که اجازه می دهد عناصر به بیش از یک خوشه بطور همزمان تعلق داشته باشند بر خلاف خوشه بندی کلاسیک که نتیجه آن، خوشه های ناسازگار (مانعه الجمع) هستند. دلایلی که برای اتخاذ روش خوشهبندی فازی وجود دارد عبارتند از: به راحتی با توزیع روشهای بهینهسازی اختیاری سازگار می شود. به دلیل دشواری شناسایی مرز شفاف بین خوشهها در مسائل دنیای واقعی، خوشههای فازی که ظاهر می شوند، جذابتر از خوشههای قطعی می باشند. خوشهبندی فازی کمتر دچار مشکل تعیین مناسبترین محل می شود. الگوریتم خوشهبندی فازی در محاسبات کاراتر است زیرا در روشهای تخمینی با احتمال کمتری تغییر در مقادیر عضویت خوشهها رخ می دهد. در پایان خوشهبندی فازی مقدار عضویت برای هر مجموعه از پاسخها نشان می دهد که آیا خوشه دیگری وجود دارد که نتایجی به خوبی این خوشهها داشته باشد؟ روش خوشه بندی کلاسیک این نتیجه را کشف نمی کند (ان و دورسو،2011). 4.2 طبقه بندی فرايند طبقهبندی در واقع نوعی يادگيری با ناظر میباشد که در طی دو مرحله انجام میگردد. در مرحله اول مجموعهای از دادهها که در آن هر داده شامل تعدادی خصوصيت دارای مقدار و يک خصوصيت بنام خصوصيت کلاس میباشد، برای ايجاد يک مدل داده بکار میروند که اين مدل داده در واقع توصيف کننده مفهوم و خصوصيات مجموعه دادههايی است که اين مدل از روی آنها ايجاد شده است. مرحله دوم فرآيند طبقهبندی اعمال يا بکارگيری مدل داده ايجاد شده بر روی دادههايی است که شامل تمام خصوصيات دادههايی که برای ايجاد مدل داده بکار گرفته شدهاند، میباشد، بجز خصوصيت کلاس اين مقادير که هدف از عمل طبقهبندی نيز تخمين مقدار اين خصوصيت میباشد. الگوريتمها و روشهای مختلفی برای طبقهبندی تاکنون پيشنهاد شدهاند که برای مثال میتوان از روشهای طبقهبندی با استفاده از درخت تصميم، طبقهبندی بيزين، SVM ، طبقهبندی با استفاده از شبکههای عصبی، طبقهبندی مبتنی بر قواعد و ... نام برد (میشل،1997). 5.2 کشف قواعد وابستگی بحث قواعد وابستگی به مقوله کشف عناصری يا المانهايی در يک مجموعه داده میپردازد که معمولا با يکديگر اتفاق میافتند و به عبارتی رخداد آن ها به نوعی با يکديگر ارتباط دارد. بطور کلی هر قاعده يا rule که از اين مجموعه داده بدست میآيد، دارای شکل کلی بصورت میباشد که نشان میدهد چنانچه الگوی X اتفاق بيفتد، با احتمال بالايی الگوی Y نيز اتفاق خواهد افتاد (هان و کمبر،2001). 6.2 کشف الگوی ترتیبی کشف الگوی ترتیبی تشابه زیادی به کشف قوانین انجمنی دارد و هر دو شامل یک مجموعه قلم داده هستند با این تفاوت که مدل های ترتیبی انتقال های بین قلم داده ها ی مختلف را تحلیل می کند، در حالی که در مدل های انجمنی فرض بر این است که تراکنش های مختلف یک مشتری همگی مستقل از همدیگرند. در الگوی های ترتیبی خرید یک صفحه کلید قبل از خرید یک مشواره با خرید یک موشواره قبل از صفحه کلید متفاوت است. به طور کلی دادههای ورودی به روشهای کشف الگوی ترتیبی شامل لیستی از تراکنشها به همراه زمان رخ داد آنهاست. دادهکاوی پویا دادهکاوی پویا در سالهای گذشته توجه بسیاری را به خود جلب کرده است. در دادهکاوی پویا بیان می شود که بر خلاف دادهکاوی ایستا، در بسیاری از کاربردهای دنیای واقعی مثل رفتار خرید مشتریان، تغییرات ساختار داده مشاهده می شود. به عبارت دیگر در دادهکاوی ایستا مسئله کشف الگوهای اصلی در مجموعه داده معین است ولی در دادهکاوی پویا مسئله درک و پیش بینی چگونگی تغییر الگوها در هر زمان است. الگوریتمهای خوشهبندی کلاسیک ساختار دادهها را ایستا فرض می کنند که در طول زمان تغییر نمیکند. هر چند مکررا دیده شده که تغییرات ساختار داده در بیشتر زمانها تحلیل می شوند. برای نظارت بر تغییرات، مفاهیم دادهکاوی پویا توسعه داده شده اند به ویژه برای خوشه بندی پویا. هدف اصلی این روشها این است که مدلهای اصلی را هر زمان که تغییری در ترکیب دادهها مشاهده شود، به روزرسانی کنند. برای این کار دو مرحله باید انجام شود: اول، کشف تغییر در ترکیب دادهها که نیاز به تعریف معیاری برای شناسایی تغییرات دارد. دوم، به روزرسانی مدل های دادهکاوی بر اساس آن. معمولا این کار با به روزرسانی پارامترهای مدلهای اولیه انجام می شود (پیتر و همکاران، 2012). در مقایسه با دادهکاوی ایستا، دادهکاوی پویا ظرفیت بیشتری برای سروکار داشتن با دادههای نا مطمئن، بی قاعده و وابسته به زمان دارد.. همانگونه که ذکر گرديد در دادهکاوی کلاسیک فرض بر اين است که مجموعه دادههايی که قرار است هر يک از اعمال يا روشهای دادهکاوی بر روی آنها اعمال گردد، بصورت ايستا در داخل يک پايگاه يا در يک فايل وجود دارند و در حين عمل دادهکاوی نيز اين دادهها تغييری نمیکنند. اين گونه فرض ها انجام عمل دادهکاوی را بسيار سادهتر مینمايد. اما نکتهای که بايد در اينجا مورد توجه قرار گيرد اين مطلب است که موارد ذکر شده همچون عدم تغيير دادهها، در دسترس بودن تمام دادهها و ... در بسياری از کاربردهای دنيای واقعی صدق نمیکند، بلکه دادههای اين کاربردها معمولا همواره در حال تغيير و تحول هستند و از طرفی حجم اين دادهها نيز به قدری زياد است که امکان ذخيرهسازی آنها نيز وجود ندارد. بنابراين تنها قسمت کوچکی از دادهها در هر لحظه در اختيار ما خواهد بود، لذا برای دادهکاوی بر روی دادههايی از اين دست، نمیتوان روش های سنتی و قديمی دادهکاوی را بکار برد بلکه اين نوع دادهها و مجموعه دادهها نياز به الگوريتم ها و روشهای دادهکاوی پويايی دارند که از پس ويژگي های اين دادهها برآيند. بنابراين نياز به نوعی دادهکاوی پويا احساس میشود. بنابراين منظور ما از دادهکاوی پويا دادهکاوی بر روی دادههايی است که همواره در حال تغيير و تحول بوده و حجم اين دادهها بقدری زياد است که نمیتوان آنها را در يک منبع ذخيرهسازی ذخيره کرد و تنها بخش کوچکی از دادهها در هر لحظه در دسترس میباشد (هان و کمبر، 2001). 8.2 خوشه بندی پویا یکی از اولین روشهای خوشه بندی پویا در دیدی (1973) ارائه شده است که در آن گروهی از اشیا که "نمونه" نامیده می شوند، با خوشههایی که از آن ها استخراج می شود، درطول زمان سازگار میشوند. روشهای خوشه بندی پویا با توجه به ماهیت داده ورودی برای توصیف این گونه ترکیبها مورد توجه قرار میگیرند، خواه دادههای مربوطه ایستا باشند یا پویا. دادههای ورودی درصورتی ایستا هستند که به تغییرات زمان وابسته نباشند و نقطه مقابل آن ها دادههای ورودی پویا هستند. چندین سیستم خوشه بندی ارائه شده است که با ورودیهای ایستا سروکار دارند ولی در خلال خوشه بندی از عناصر پویا استفاده میکنند. به عبارت دیگر پویا سازی الگوریتم مربوطه در حین اعمال در مجموعه داده ایستا، انجام میشود. چملون نمونه ای از این سیستم هاست که در خوشه بندی سلسله مراتبی بکار برده میشود. در این نوع خوشه بندی در هر مرتبه تصمیمگیری به طور پویا بر ویژگیهای خوشه فعلی منطبق می شود (کریپس و همکاران1999). به جز آن چه که در خوشه بندی سلسله مراتبی ذکر شد، در روشهای خاص خوشه بندی کاربردی از قبیل C-means و Fuzzy C-means قبل از اجرای الگوریتم باید تعداد خوشهها تعیین گردند. تعیین تعداد مناسب خوشهها موضوع چندین پژوهش نیز بوده است (بزدک و همکاران 1999). در " خوشه بندی تفکیکی پویا با استفاده از استراتژی های تکامل" تعداد خوشه ها در حین اجرا با استفاده از الگوریتم های تکاملی بهینه میشود ( لی و انتنسون 2001). در روشهای خوشه بندیای که در بالا به آن ها اشاره شد از عناصر پویا در حین اجرای الگوریتم روی مجموعه داده ایستا استفاده میشود. در حالی که ما وضعیت دادههای پویا را در دو حالت متمایز مورد تحلیل قرار خواهیم داد. در یک حالت خوشه بندی می تواند با توجه به رشد مقادیر ویژگی انجام شود که در این صورت خوشه بندی پویا یعنی، خوشه بندی مسیرها نه خوشه بندی بردار ویژگیها. در حال دوم قصد ما این است که دریابیم ترکیب کلاسها در طول زمان ممکن است چه تغییری کند و در صورتی که اطلاعات جدید در دسترس باشد، یک کلاس چطور به روزرسانی خواهد شد. در ادامه هردو مورد به طور دقیق مورد مطالعه قرار خواهند گرفت. در شرایطی که مقدار ویژگیهای فعلی برای توصیف موضوع موردنظر کافی نباشند، تحلیل مسیر ویژگیها بسیار مناسب خواهد بود. مثلا در علوم پزشکی شرایط بیمار نه تنها به فشار خون بلکه به بهبودی وی در قیاس با شرایط گذشته نیز بستگی دارد.مثال دیگر در این زمینه پیش بینی قیمت سهام می باشد. زمانی که برای پیش بینی افزایش قیمت در آینده، اطلاعات ارزش فعلی سهام کافی نباشد. در این حالت باید به قیمت سهام های مرتبط گذشته برای پیش بینی دقت کنیم. روشی که در آن مسیر ویژگی خوشه بندی شده است، روش ماتریوشکا می باشد (لی و همکاران 2002) که بر اساس مدل مخفی مارکو (HHM) برای خوشه بندی داده های موقتی طراحی شده است. این مدل با استفاده از دادههای ورودی موقتی، مقدار مطلوب کلاسها را توضیح می دهد. هر کلاس به عنوان یک (HHM) مشخص می شود و اعضای مربوط به هر کلاس را تخصیص می دهد. یک سیستم ارزیابی و استنتاج عصبی فازی برای برآورد سری های زمانی پویا (DENFIS) استفاده است (کاسابو و سانگ 2002). بر اساس روش خوشه بندی استنتاجی (ECM) نوعی مجموعه قواعد فازی به طور پویا ایجاد میگردد. منطق فازی نیز توانایی خود را در خوشه بندی جریان داده اثبات کرده است. يک جريان داده در واقع يک توالی از دادههايی بشکل میباشد، که هر کدام ازها يک خصوصيت دارای مقدار میباشند. خوشه بندی فازی مزایای بسیاری دارد زیرا به جای ان که تغییرات خوشه ها زود به زود رخ دهد، بسیار آرام انجام می شود. 9.2 روشهای نوین برای خوشه بندی فازی پویا در جدول زیر یک دسته بندی از حالاتهای مختلف خوشه بندی درحالی که دادههای ورودی پویا باشند تهیه شده است. در کلاسهای ایستا خوشه بندی فقط در یک نقطه از زمان انجام می شود و ترکیب کلاسهای به روز رسانی نمی شود. اگر اعضای اضافه شده ایستا باشند، به عبارت دیگر؛ اگر بردار ویژگی که براساس مقادیر واقعی توصیف شده ، شامل مقادیر ویژگی فعلی استفاده شده باشد، آن گاه یک نمونه از خوشه بندی کلاسیک وجود خواهد داشت. اگر بخواهید رشد مقادیر قبلی ویژگی را در خوشه بندی بررسی کنید، اعضای پویا را به کلاسهای ایستا اختصاص دهید. در این حالت بردار ویژگی شامل مسیر است به جای مقادیر واقعی. در کلاسهای پویا، ترکیب کلاسها باید مکررا به روز رسانی شوند. اگر در حال به روز رسانی با اعضای ایستا باشید آن گاه بردارهای ویژگی مربوطه با مقادیر فعلی ایجاد می شود. اختصاص اعضای پویا به کلاسهای پویا، نمونه ای از به روز رسانی کلاسها با مسیر ویژگی است. در قسمت زیر روشهای توسعه یافته خوشه بندی فازی برای موارد ( کلاس ایستا- اعضا پویا ) و (کلاس پویا – اعضا ایستا ) ارائه شده است. همچنین نشان داده شده است که کارکردن با منطق فازی تهیه شده مزایای ویژهای در خوشه بندی پویا دارد، به این دلیل که درجه عضویت مربوطه یک ابزار قوی به منظور گرفتن تغییرات محیط را نشان میدهد. توسعههای انجام شده بر مبنای C- میانگین فازی میباشند. پارامترهای مورد استفاده : C : تعداد کلاسها N : تعداد اعضا P : تعداد ویژگیهای هر عضو Xi : بردار ویژگی عضو i Vj: مرکز کلاس j μij: درجه عضویت عضو I به کلاس j جدول (2-1) : روشهای خوشه بندی برای دادهکاوی پویا 20375182478 کلاسهای پویا کلاسهای ایستا00 کلاسهای پویا کلاسهای ایستا1123951587500 1120726286500 خوشه بندی مجموعه تغییرات بردارهای ویژگیخوشه بندی مقادیر واقعی بردارهای ویژگیاعضای ایستاخوشه بندی مجموعه تغییرات مسیرهای ویژگیخوشه بندی مسیرهای ویژگیاعضای پویا 1127558255000 1.9.2 اختصاص اعضای پویا به کلاسهای ایستا در بسیاری از کاربردهای دنیای واقعی مقدار ویژگیهای فعلی به منظور توضیح علت اصلی پدیده کافی نیستند. در چنین وضعیتهایی ممکن است علاقه مند باشید این مقادیر را در طول زمان به عنوان ویژگیهایی که به صورت مسیر می باشند، توسعه دهید. 1.1.9.2 روش بهکار بردن مسیرها در خوشه بندی مسیرهای گنجانده شده در سیستم دادهکاوی می توانند در طول مرحله تبدیل فرایند KDD انجام شوند و سپس روش خوشه بندی کلاسیک اجرا شود یا مستقیما در همان محدوده روشها اصلاح شوند. تبدیل مسیرهای اصلی به مقادیر واقعی بردارهای ویژگی با حفظ اطلاعات پویای این مسیرها انجام می شود. به خاطر داشته باشید که غالبا کاهش مسیرهای اولیه به مجموعه ای از مقادیر واقعی در حالت کلی به معنی از بین رفتن اطلاعات است. FFCM که در ادامه شرح داده میشود با تمام مسیرهایی که از مقیاس فاصله اصلاح شده استفاده میکند، کار میکند. 2.1.9.2 تشریح عملکرد C – میانگین فازی به منظور خوشه بندی اعضای پویا، به یک مقیاس فاصله بین دو بردار نیاز است در جایی که هر مولفه یک مسیر (تابع) است بجای عدد واقعی.FFCM یک الگوریتم خوشه بندی فازی است که در آن فاصله مربوطه بر اساس شباهت بین دو مسیر و با استفاده از تابع عضویت تعیین شده است. FFCM یک C- میانگین فازی استاندارد عمومی است.در هر تکرار FCM از فرمول زیر به منظور محاسبه درجه عضویت عضو i در کلاس j استفاده می شود: μi,j=1k=1cdxi,vjdxi,vk2m-1(2-8) در اینجا xi بردار ویژگی عضو i ، vkو vj مرکز کلاس k و j، c تعداد کلاسها ، m∈1,∞ پارامتر تعیین کننده درجه ایجاد خوشه فازی می باشند. D(x.y) استفاده شده در فرمول بالا، فاصله بین دو بردار x,y را در فضا تعیین می کند. ایده اصلی FFCM تعمیم محاسبه فاصله بین یک جفت از بردارهای ویژگی با اعداد واقعی به محاسبه فاصله بین یک جفت از همین بردارها با مسیرهایشان است. ایده ارائه شده در اغلب تکنیک های داده کاوی، هرجا که فاصله بین اعضا لازم است، می تواند بکار رود. FFCM فاصله بین دو عضو را با انجام پنج مرحله زیر تعیین می کند: یک مجموعه فازی A (تقریبا صفر) با تابع عضویت μ تعریف کنید. درجه عضویت μ(fx) از یک تابع اختیاری برای مجموعه فازی A در هر نقطه محاسبه کنید. این درجه عضویت می تواند به عنوان (pointwise) شباهت تابع f به تابع صفر تفسیر شود. μ(fx) تبدیل شده به اعداد واقعی، میزان صفر شدن با بکارگیری تغییرات خاص را نشان می دهد. میزان شباهتی که در مرحله 1 تا 3 تعریف شده، برابر است با نسبت اضافه شده به تابع. به عبارت دیگرs(f,g)=s(f+h,g+h) برای همه توابع f, g , h را نگه می دارد. این اجازه می دهد که شباهت بین یک جفت اختیاری از توابع f و g را توسط تابع افزایشگر h=-g محاسبه شود و شباهت f-g با تابع شروع تعیین شود. در آخر، شباهت s(f,g) تبدیل می شود به فاصله d(f,g) با استفاده از : d(f,g)=1/s(f,g) -1 بکارگیری این مقیاس فاصله جدید بین توابع FFCM در تعیین کلاس اعضای پویا در FCM موثر است. شکل (2-8) : تشریح عملکرد FFCM 2.9.2 اختصاص اعضای ایستا به کلاسهای پویا روشی برای دادهکاوی پویا بر اساس خوشه بندی فازی که اعضای ایستا را به کلاسهای پویا اختصاص می دهد و یا به عبارت دیگر ترکیب کلاسها را در هر زمان تغییر می دهد، ارائه شده است. این کار با یک طبقه بندی معین و مجموعهای از اعضای جدید (اعضایی که بعد از طبقه بندی فعلی ظاهر می شوند) شروع می شود. زمان میان ایجاد یک طبقه و به روز رسانی آن چرخه نامیده می شود. طول چرخه به کاربرد خاص آن بستگی دارد. 1.2.9.2 نگاه جامع به روش پیشنهاد شده روش پیشنهاد شده فرض می کند که اعضای دیگر قابل شناسایی نیستند. به عبارتی نیازی نیست هر شی ای را شناسایی کنید. برای مثال در بخش بندی مشتریان بانک ها می توانید هر مشتری و فعالیتش را شناسایی کنید ولی در بخش بندی مشتریان سوپر مارکت ها، اطلاعات شخصی آن ها ندارید که می تواند کاربرد این روش برای اعضای غیر قابل شناسایی باشد. تغییرات ممکن در ترکیب یک خوشه در هر چرخه عبارتند از: ایجاد کلاس جدید حذف کلاس جابجایی کلاس در فضای ویژگی به منظور نشان دادن تغییر در ترکیب کلاس و پی بردن به تغییرات متناظر پنج مرحله زیر اجرا می شود: شناسایی اعضایی که نشان دهنده تغییرات هستند. ابتدا بررسی کنید که آیا اعضای جدید با خوشه های قبلی به خوبی توضیح داده می شوند یا نه. یعنی اعضایی را شناسایی کنید که ترکیب خوشه را تغییر می دهند و برای آن خوشه مناسب نیستند. اگر اعضای زیادی وجود دارند که چنین تغییراتی را نشان می دهند به گام 2 بروید و در غیر اینصورت به گام 3 بروید. تغییر ترکیب هر کلاس را تعیین کنید. در اینجا تصمیم بگیرید که به منظور اصلاح خوشه ها برای اعضای جدید، کلاس جدید ایجاد کنید و یا فقط جابجایی کلاس کافی است؟ اگر در گام 1 تعداد اعضای شناسایی شده که نشان دهنده تغییرات هستند زیاد بود، کلاس جدید ایجاد کنید در غیر این صورت آنها را به کلاس های موجود در فضا جابجا کنید. ترکیب کلاس را تغییر دهید. مطابق با نتایج گام های 1و 2 تغییرات را ایجاد کنید. (جابجایی (1) یا ایجاد کلاس (2)) 3.1: جابجایی کلاس: مراکز کلاس های موجود را بر اساس اطلاعات آماده شده توسط اعضای جدید به روز رسانی کنید، در حالی که این اعضا نیازی به کلاس جدید ندارند. 3.2: ایجاد کلاس: اگر بدانید که باید کلاس جدیدی ایجاد کنید، ابتدا تعداد مناسب کلاس را مشخص کنید سپس c میانگین فازی را با تعداد کلاسهای جدید برای داده های در دسترس اجرا کنید. شناسایی مسیرهای کلاسها: به منظور بررسی وضعیت پذیرش اعضای جدید، مسیر کلاس ها را از چرخه قبل شناسایی کنید ؟ کلاس هایی که در طول چندین چرخه عضو جدید دریافت نکرده اند، باید حذف شوند. حذف کلاسهای تغییر نکرده: طیق نتیجه گام 4 کلاسهایی که در طی یک دوره پذیرش، عضو جدیدی نپذیرفته اند؛ حذف می شوند. شکل(2-9) : نمای کلی روش خوشه بندی فازی پویا با تغییر ترکیب کلاس ها 2.2.9.2 شرح جزئیات روش پیشنهاد شده در طول چرخه m عضو جدید ظاهر شدند. k = n + 1; ... ; n+ mنماد m عضو جدید می باشند. گام 1: شناسایی عضوهای نشان دهنده تغییرات. هدف از این گام شناسایی عضوهایی است که در خوشه های تعیین شده به خوبی طبقه بندی نشده اند. برای این منظور به فاصله هر زوج از مراکز کلاس های فعلی نیاز دارید. فاصله هر زوج به این صورت است: dVi,Vj ∀i≠j,i,j∈1,……,c (2-9) علاوه بر این به فاصله بین k عضو جدید و مرکز کلاس vj از ترکیب کلاس فعلی نیاز دارید. این فاصله به صورت زیر است: dik=dXk,Vi i∈1,…..,c k∈1+n,….,n+m (2-10) در آخر برای پذیرش m عضو جدید از خوشه های قبلی استفاده کنید. μi,k= membership of new object k to class i i∈1,…..,c k∈1+n,….,n+m بر اساس اقدامات قبلی c عضو نشان دهنده تغییرات را در خوشه ها شناسایی کردید. در این مرحله می خواهید بدانید که ایجاد کلاس جدید کافی است با جابجایی آن. از این جهت عضوهایی را که با خوشه های موجود به خوبی طبقه بندی نشده اند و از مرکز کلاس های فعلی خیلی دور هستند، شناسایی کنید. طبق دو شرط زیر این اعضا را تعیین کنید: شرط 1: μik-1/c≤α ∀k∈1+n,….,n+m ∀i∈1,…..,c مقدار α≥0. حالت 1 اعضایی را که درجه عضویت آنها با تعداد کلاس رابطه وارونه دارد، تعیین می کند (1/c). این اعضا به صورت مناسب خوشه بندی نمی شوند. پارامتر آلفا یکی از استراتژی های زیر را برای اقدام تعیین می کند: اعضا می توانندثابت بمانند اگر دانش مریوطه موجود باشد. اگر بدانید که طبقه بندی اعضا در چرخه معین درست است، الفا را بصورت پویا تعیین کنید که به میزان درستی طبقه بندی اعضا بستگی دارد. برای مثال اگر میزان درستی در چرخه، زیاد باشد، الفا باید در چرخه نزدیک به صفر باشد به این منظور که تغییرات کمتری در ترکیب کلاس ها ایجاد شود. شرط 2 : dik>mindvi,vj ∀k∈1+n,….,n+m ∀i≠∈1,…..,c این حالت تعیین میکند که آیا k عضو جدید از کلاسهای فعلی خیلی دور هستند. فرض کنید که این گونه است که فاصله آن ها از i بزرگتر از min فاصله بین دو کلاس i و j است. بر این اساس دو حالت تعریف می شود: به عبارت دیگر Xk 1/c مقدار 1 را می پذیرد اگر و فقط اگر عضو k در خوشه های فعلی به خوبی خوشه بندی نشود. اگر k=n+1n+m1cXk=0 به گام 3 بروید در غیر این صورت گام 2 را ادامه دهید. گام 2: تعیین تغییرات در ترکیب کلاس ها. با توجه به اینکه حداقل یک عضو برای تغییر در ترکیب کلاس طبقه نیاز است، چک کنید که آیا به کلاس جدید نیاز دارید یا جابجایی کلاس موجود کافی است. برای این کار طبق ضابطه زیر عمل کنید: k=n+1n+m1cXkm≥β with a parameter β 0≤β≤1 (2-11) اگر رابطه بین اعضای جدیدی که نمایانگر تغییرات هستند و کل عضوهای جدید (m) در ضابطه بالا صدق کرد ،کلاس جدید ایجاد کنید و در غیر این صورت فقط کلاس موجود جابجا شود. β یکی از استراتژی های زیر را برای اقدام تعیین می کند: این مفهوم می تواند ثابت باشد در صورتیکه دانش مربوط به آن موجود باشد. اگر طبقه اعضا در چرخه معین به درستی شناخته شود، β می تواند میزان درستی طبقه را تعیین کند. گام 3: تغییر در ترکیب کلاس. بر اساس نتایج گام 2 ممکن است کلاس جدیدی تشکیل شود و یا یکی از کلاس های موجود جابجا خواهد شود. 3-1: جابجایی کلاس: دو گزینه اساسی برای جابجایی کلاس وجود دارد: اجرای الگوریتم خوشه بندی اصولی (c میانگین فازی) با اعضا قبلی و جدید (بدون تغییر در تعداد کلاس) تعیین مرکز کلاس نمایانگر اعضای جدید و ترکیب آن ها با مراکز کلاس های قبلی. در حالت دوم انتقال کلاس، مراکز کلاس های موجود را با مراکز نمایانگر اعضای جدید وابسته به همان کلاس ترکیب می کند. برای این منظور تابع نماینده k عضو جدید برای کلاس i را تعریف کنید: هر عضو را به کلاسی اختصاص دهید که بیشترین مقدار عضویت در آن کلاس را دارا است. برای هر عضو i، مرکز کلاسی که فقط نشان دهنده اعضای جدید باشد تعیین کنید. vi*=k=n+1n+m1-1cXkμikmXkk=n+1n+m1-1cXkμikm 1≤i≤c (2-12) با ترکیب این (مراکز عضوهای جدید) با مراکز قبلی، مرکز کلاس جدید تعیین کنید: (2-13lefttop) در اینجا وزن نسبت تخصیص اعضای جدید را به کلاس i نشان می دهد. (2-14) 3-2: ایجاد کلاس: اگر تشخیص دادید که به یک یا چند کلاس جدید نیاز دارید، در صورتی که تعداد عضوهای جدیدی که در کلاس های موجود بطور مناسب تخصیص داده نشدند زیاد باشد، ابتدا تعداد کلاسهای مناسب را برای آن ها تعیین کنید. برای این منظور مفهوم ارائه شده توسط لی و موکایدنو را که دوام ساختار نامیده می شود، بکار ببرید. بر اساس این مفهوم پیشنهاد شده که با اطلاع از یک بخش، به راحتی نتیجه درست را تخمین بزنید. تابع خطا L( c ) از میان مجموع مجذور خطاهای (WGSS) برای یک راه حل خوشه بندی معین تعیین می شود. (2-15) C : تعداد کلاس ها N : تعداد عضوها : درجه عضویت عضو k به کلاس i : فاصله بین عضو k و مرکز کلاس i بر اساس تابع خطا، تعداد کلاس ها به صورت زیر تعیین می شود: 27522718762200 موکایدنو اندازه گیری اثربخش را با استفاده از log(N/C) ارائه کرد. به عبارت دیگر طبقه بندی با کلاسهای کمتر موثرتر است. او اندازه گیری با log(L(1)/L(c)) را نیز پیشنهاد کرد، به عبارت دیگر طبقه بندی با کلاسهای بیشتر درست تراست.L(1) واریانس مجموعه دادههای درست و الفا وزن بین صحت و اثربخشی است. مولف پیشنهاد کرده که برای یک تخمین بدون غرض (اثربخشی و صحت مقادیر یکسان داشته باشند) مقدار α=0.5 باشد و مقدار c ماکزیمم S( c) فرض شود که تعداد کلاس ها کافی باشد. با استفاده از تعداد مناسب کلاس های جدید برای همه اعضا ، الگوریتم خوشه بندی پایه (دراینجا c میانگین فازی ) را به منظوره تعیین بهترین cnew کلاس های نشان دهنده همه اعضا، اجرا کنید . گام 4: شناسایی مسیرها: ایجاد کلاس و یا انتقال در این مرحله ضرورت دارد. بررسی کنید که آیا کلاسی برای حذف وجود دارد؟جهت آمادگی برای مرحله حذف کردن (مرحله 5) ، تغییر هر کلاس را در طول چرخه قبلی بر اساس مسیرهایش و ctiبرای کلاس i در چرخه t شناسایی کنید. در این جا دو گزینه زیر را دارید: کلاس i در چرخه t ایجاد شده است. در این مورد شماره آن را cti=1 بگذارید. کلاس i نتیجه انتقال قطعی کلاس j در چرخه t-1 است. در این مورد cji-1+1=citاست. گام 5: حذف کلاس های بدون تغییر: حذف یک کلاس با روش زیر تعیین میشود: " کلاسی که طول یک دوره معین عضو جدید دریافت نکرده باشد، باید حذف شود "، که دوره معین باید تعریف شود. در گام 5 برای هرکلاس i در چرخه t شماره cti تعریف می شود. به عبارت دیگر تعداد چرخههای آن فعال شده است. ماکزیمم تعداد چرخه های یک کلاس که می توانند فعال باشند را بدون اعضای جدید دریافت شده تعیین کنید (اینجا T چرخه) .اگر کلاسی برای T چرخه عضو جدید دریافت نکند، حذف خواهد شد. در روش پیشنهاد شده برای همه کلاس ها از مقدار T یکسان استفاده می شود که توسط کاربر تعیین می شود. در برخی از کاربردها می توان از مقادیر مختلف T برای کلاسهای موجود استفاده کرد. باید گفت که حذف یک کلاس به معنی این نیست که از این کلاس کاملا صرف نظر شده است. زمانی که یک کلاس حذف می شود، اطلاعات مربوط به آن در حافظه جداگانه ای نگهداری می شود. اگر در چرخه بعدی در گام ایجاد کلاس، کلاس جدیدی ایجاد شود، آن خیلی به کلاس حذف شده قبلی شبیه است (وبر،2007). منطق فازی در سال 1965 در دانشگاه کالیفرنیا، برکلی پروفسور لطفی زاده تئوری مجموعه های فازی و منطق فازی را مطرح کرد، وی برای اولین بار با معرفی نظریه مجموعههای فازی مقدمات مدل سازی اطلاعات نادقیق و استدلال تقریبی با معادله های ریاضی را فراهم نمود که در نوع خود تحولی عظیم در ریاضیات و منطق کلاسیک بوجود آورد. ایده نظریه مجموعه های فازی با این عبارت توسط پرفسور لطفی زاده مطرح شد: "ما نیازمند یک نوع دیگری از ریاضیات هستیم تا بتوانیم ابهامات و عدم دقت رویدادها را مدل سازی نماییم٫ مدلی که متفاوت از نظریه احتمالات است." لذا نظریه فازی برای بیان و تشریح عدم قطعیت و عدم دقت در رویدادها به کار میرود که براساس منطق چند ارزشی بوجود آمده است (شوندی،1385). 1.10.2 مجموعه های فازی در منطق کلاسیک عضویت در یک مجموعه به صورت صفر و یک در نظر گرفته میشود؛ بدین صورت که در صورتی که عضوی در یک مجموعه وجود داشته باشد با 1 و در غیر این صورت با 0 نشان داده میشود. و در حقیقت درجه عضویت تابعی است که برد آن عضو مجموعه {0،1} می باشد. اما از طرف دیگر در منطق فازی، مفهوم درجه عضویت در یک مجموعه به بازه [0, 1] گسترش می یابد. مفهوم منطق فازی از آن جهت مورد توجه قرار می گیرد که در جهان واقع نیز بسیاری از استدلال ها و دلایل بشر، جنبه عدم قطعیت و تقریبی دارد. تعریف مجموعه فازی: یک مجموعه فازی روی یک مجموعه مبدا X مجموعه ای از جفت های A={μA(x)/x :x ϵ X, μAx ϵ 0, 1ϵ R} به صورتی که μA(x) تابع درجه عضویت عضو فازی x مجموعه A نامیده می شود. تابع درجه عضویت می تواند هر یک از مقادیر حقیقی بین 0 و 1 را بپذیرد. : μAx= 0 بیانگر این است که x قطعا به مجموعه فازی A تعلق ندارد. : μAx= 1 بیانگر این است که x قطعا به مجموعه فازی A تعلق دارد. در ادامه مهمترین خصوصیات منطق فازی آمده است: در منطق فازی، استدلال دقیق یا منطق معمولی حالت خاصی از استدلال تقریبی است. هر سیستم منطقی قابل تبدیل به منطق فازی است. در منطق فازی، دانش به عنوان مجموعه ای از محدودیت های فازی یا انعطاف پذیر روی متغیر ها در نظر گرفته میشود. استنتاج به عنوان فرآیند انتشار این محدودیت ها در نظر گرفته میشود. در منطق فازی تمام مسائل دارای راه حلی هستند که درجه مطلوبیت (امکان) را نشان میدهد. برای توابع عضویت انتخابهای متفاوتی وجود دارد که بسته به کاربرد مد نظر می توان یکی از آنها را انتخاب کرد. در یک تقسیم بندی کلی که توسط زاده ارائه شد میتوان توایع فازی را به دو دسته خطی و غیر خطی (منحنی) تقسیم بندی کرد. توابع مثلثی، یکه، L، گاما، ذوزنقه، S، گاوسی، شبه نمایی، از جمله معروفترین توابعی هستند که برای مدل کردن درجه عضویت در مجموعه های فازی برای کاربردهای متفاوت مورد استفاده قرار گرفتهاند (جرج، 1995). شکل زیر یک عدد فازی را نشان میدهد که با این تعریف مطابق است. لازم به ذکر است که اعداد فازی به وسیله ی حروف برجسته ی A , B , C , … و یا به صورت a, b , c , … و تابع عضویت آن ها به وسیله ی μAx, μBx, μCx, … نمایش داده می شوند. شکل (2-10) : عدد فازی مثلثی مثبت عدد فازی مثلثی مثبت (TFN) A ، با یک سه تایی به صورت A = (a1, a2, a3) نشان داده میشود و تابع عضویت آن به صورت زیر است: μA (x)=0, & xa3 علاوه بر اعداد فازی مثلثی، اعداد فازی ذوزنقهای نیز از عمومیترین و پر کاربردترین اعداد فازی می باشند. در بخشهای آتی نیز خواهیم دید که نویسنده برای ایجاد تابع فازی NPS از هر دوی این اعداد و توابع آن ها استفاده نموده است. عدد فازی ذوزنقه ای A بصورت A = (a1, b1, b2, a2) ، نشان داده می شود. در این حالت بازه ی تکیه گاه برابر [b1 , b2] بوده و بخش هم سطح در سطح 1 = α ، روی محور x دارای تصویر [b1 , b2] است. تابع عضویت اعداد فازی ذوزنقهای در زیر آورده شده است. μA (x)=0, & xa2 همچنین با فرض در اختیار داشتن دو عدد فازی m و n ، روابط ریاضی ذیل برای آن ها برقرار خواهد بود. m (+)n= (m1+n1,m2+n2,m3+n3) m (-) n = (m1-n1,m2-n2,m3-n3) mn = (m1.n1, m2.n2, m3.n3) m () n= (m1n1 , m2n2 , m3n3 ) 2.10.2 میانگین فازی 1.2.10.2 فرمول میانگین مثلثی چنان چه n عدد مثلثی بصورت Ai = (a1i, , aMi a2i) در اختیار داشته باشیم ، Aave برابر است با: Aave = A1 +…+ An n = a11, aM1 a21+ …+ (a1i, aMi a2i) n = (i=1na1i , i=1naMi , i=1na2i ) n Aave = (m1 , mM , m2 ) =( 1n i=1na1i , 1n i=1naMi , 1ni=1na2i ) 2.2.10.2 فرمول میانگین ذوزنقهای اگر i= 1,… , n و Ai = (a1i, b1i, b2i, a2i) اعداد ذوزنقهای باشند، پس: Aave = (m1 , mM1 , mM2 , m2 ) = a11, b11, b21, a21+ …+ (a1i, b1i, b2i, a2i) n = (i=1na1i , i=1nb1i , i=1nb2i , i=1na2i ) n 3.10.2 فازی زدایی از میانگین فازی انبوهش تعریف شده به وسیله ی میانگین ذوزنقهای یا مثلثی، به طور غالب بایستی به وسیله ی یک عدد معین نشان داده شود که بهترین میانگین متناظر را معرفی میکند، این عملیات فازی زدایی نامیده می شود. اگر داشته باشیم : Aave = (m1 , mM , m2 )، به نظر می رسد برای نیل به هدف فازی زدایی، عدد mM درون بازه تکیه گاه [m1 , m2] از Aave را انتخاب نماییم. mM بالاترین درجه ی عضویت 1 را در Aave دارد. به عبارت دیگر Aave ماکزیمم درجه را در mM حاصل می کند، که آن را ماکزیمم کننده ارزش مینامند. در این جا سه گزینه انتخابی برای فازی زدایی Aave = (m1 , mM , m2 ) معرفی می شود که در اصل رابطههای مربوط به میانگین آماری هستند: xmax(1)= m1+ mM+ m 2 3 xmax(2)= m1+ 2mM+ m 24 xmax(3)= m1+ 4mM+ m 26 بر خلاف حالت قبل، رابطههای میانگین، سهم m1 و m 2 را در نظر می گیرند، اما به mM اوزان مختلف اختصاص میدهند. اگر عدد مثلثی Aave نزدیک به عدد مثلثی مرکزی باشد، به این معنی است که mM تقریباً در وسط [m1 , m 2] قرار میگیرد و xmax= mM. به طور معمول، اعداد میانگین مثلثی، در کاربردها، به شکل مرکزی حاصل میشوند. با این حال کارشناسان گاه با شرایطی روبرو میشوند که باید از قضاوت خود، برای انتخاب ماکزیمم کننده ارزش استفاده کنند. شکل زیر، روش فازی زدایی را به صورت یک نمودار بلوکی نمایش میدهد. 29019511430ماکزیمم کننده ارزشxmaxxmax1,2,(3)میانگین فازیAave = A1 +…+ An nاعدا مثلثیAi , i= 1,… , nانبوهشAave =00ماکزیمم کننده ارزشxmaxxmax1,2,(3)میانگین فازیAave = A1 +…+ An nاعدا مثلثیAi , i= 1,… , nانبوهشAave = فازی زدایی میانگین فازی 11.2 بخش بندی و تحلیل رفتار مشتریان دانشمندان روشهای متنوعی را در زمینه خوشه بندی معرفی نموده اند.این روشها مبتنی بر مفروضات خاص و بر اساس نوع دادهها، شکل خوشهها، فاصله دادهها و غيره دارای عملکرد متفاوتی میباشند. غضنفری و همکاران (1389) با استفاده از الگوریتم k- میانگین و k- میانگین فازی مشتریان صادراتی میوههای خوراکی را خوشه بندی نموده و نتایج این خوشه بندی را از لحاظ کیفیت بر اساس سه معیار مختلف سنجیده اند. مرتضوی و همکارن (1390) با استفاده از تحلیل خوشهای بر مبنای ملاک بیزی بازار گوشی تلفن همراه را بر مبنای مزایای مورد انتظار مشتریان به سه خوشه تقسیم بندی نموده و آنها را مورد مقایسه قرار دادند. ابطحی و اکبرزاده (1391) الگوریتم خوشهبندی فازی را با استفاده از جمعیت پویا و الگوهای مبتنی بر جمعیت بهینهسازی کردند. خان بابایی و زین العابدینی (1392) با ارائه مدلی بر مبنای فرایند استاندارد کریسپ در دادهکاوی اقدام به شناسایی و تحلیل رفتار مشتریان خدمات بانکداری الکترونیکی کردند و نشان دادند که مدل پیشنهادی میتواند مشتریان را بر اساس رفتار آن ها شناسایی و تحلیل نماید و به بخش بندی و طبقه بندی آنها بپردازد. بررسی تکنیکهای بکار گرفته شده در تحقیقات دانشمندان نشان میدهد علیرغم وجود محیط رقابتی و تغییر پذیری در تحلیل رفتار مشتریان فرض تغییری پذیری دادهها در دامنه زمانی نادیده گرفته شدهاند. خیری و احمدی (1393) عوامل موثر بر قصد تغییر رفتار مشتریان و پیامدهای آن را مورد بررسی قرار دادند و با استفاده از روش تحلیل چند متغیره و الگویابی معادلات ساختاری روابط بین متغیرها را مشخص نمودند. لیندر و همکاران (2004) برای بخشبندی مشتریان سه روش شبکه عصبی مصنوعی، درخت تصمیم و رگرسیون لجستیک را به کار گرفته که بر اساس مقایسه آن ها نشان دادهاند که روش مبتنی بر شبکههای عصبی ابزار کارآمدتری برای مدلسازی رفتار مشتریان با دادههای پیچیده و نمونههای کوچک است.کیم و آن (2008) با استفاده از سه تکنیک شبکه SOM ، الگوریتم K- میانگین و روش تلفیقی K- میانگین و الگوریتم ژنتیک مشتریان یک سایت اینترنتی ارائه دهنده خدمات رژیم را در 5 بخش تقسیمبندی کرده و برتری نسبی روش تلفیقی و شبکه SOM را تایید کردند. چانگ و شن (2008) در پژوهش خود با به کارگیری تکنیک خوشه بندی بر مبنای مدل RFM موزون و محاسبه مقدار ارزش دوره زندگی مشتری برای هر خوشه و سپس امتیازدهی خوشه‌ها بخش بندی جدیدی از مشتریان به منظور بازاریابی هدف و استراتژی‌های فروش متقاطع در حوزه صنعت فروشگاه‌های بزرگ انجام دادند. وو و همکاران (2009) با استفاده از تکنیک خوشه بندی K- میانگین ارزش مشتریان یک شرکت ساخت تجهیزات صنعتی را مورد تحلیل قرار دادند و پیشنهاداتی برای برنامههای ترفیع مناسب با هر بخش از مشتریان ارائه کردند. ناندا و همکاران (2010) الگوریتم خوشه بندی K- میانگین را برای بخش‌بندی مشتریان سهام در خوشه‌های متنوع به منظور ساخت یک مدل مدیریت پورتفوی با دارا بودن کمترین میزان ریسک مورد استفاده قرار دادهاند. لی و همکاران (2011) با استفاده از روش خوشه بندی دو مرحله ای به تحلیل ویژگیهای مشتریان یک کارخانه بافندگی پرداختند. مبنای تحلیل خوشهای در این پژوهش مدل توسعه یافته RFM بوده است. در این پژوهش مشتریان با روش k- میانگین به پنج خوشه تقسیم و تحلیل ویژگیهای هر خوشه با استفاده از مدل RFM انجام گرفته است . چانفی و ژی یی (2013) در پژوهش خود الگوریتم خوشه بندی k- میانگین را بر اساس مراکز اولیه و مقدار k بهبود دادند. الگوریتم بهبود یافته از دادههای نویزی موجود در پایگاه داده اجتناب میکند و یا آن ها را کاهش میدهد و نتیجه خوشه بندی نهایی را واقعیتر و موثرتر می کند. سرت و همکاران (2014) رویکرد جدیدی برای فرایند درک رفتار پویای مشتریان بر اساس ترکیب تکنیک خوشهبندی و روش دنبالهکاوی ارائه کردهاند که بر اساس آن مسیر رفتار مشتریان در پایگاه داده کشف میشود. بکارگیری الگوریتم خوشه بندی پویا (DFCM) در تحلیل تغییرپذیری رفتار مشتریان که در این تحقیق ارائه شده بدیع و جدید میباشد. منابع فارسی ابطحی ترانه و اکبرزاده توتونچی محمدرضا، (1391)،"بهینه سازی الگوریتم خوشه بندی فازی با استفاده از جمعیت پویا و الگوهای مبتنی بر جمعیت"،یازدهمین کنفرانس سیستم های هوشمند ایران اسماعیل پور حسن و غفاری آشتیانی پیمان،(1381)، بازاریابی، انتشارات دانشگاه آزاد، اراک، ص 85. خان بابایی محمد و زین العابدینی سیده فاطمه،(1392)،"مدل بکارگیری تکنیک های داده کاوی در شناسایی، بخش بندی و تحلیل رفتار مشتریان خدمات بانکداری الکترونیکی"، فصلنامه علمی – پژوهشی تحقیقات بازاریابی نوین،سال سوم، شماره 2، صص 188-175. خیری بهرام و احمدی الهام،(1393)،"بررسی عوامل موثرر بر قصد تغییر رفتار مشتریان و پیامدهای آن"، فصلنامه توسعه مدیریت پولی و بانکی، سال دوم،شماره 2، ص126-101 . سپهری محمد مهدی و کارگری مهرداد،(1391)،"بهبود الگوریتم خوشه بندی مشتریان برای توزیع قطعات یدکی با رویکرد داده کاوی (k-means)"، نشریه بین المللی مهندسی صنایع و مدیریت تولید، شماره 2، جلد 23، صص 249-240 شوندی حسن٫ (1385)،"نظریه های مجموعه های فازی و کاربرد آن در مهندسی صنایع و مدیریت"٫ تهران: گسترش علوم پایه. طهماسبی پژمان،(1390)،"خوشه بندی داده های محیطی". غضنفری حسن،ملک محمدی سمیرا، علیزاده سمیه و فتح الله مهدی، (1389)،"بخش بندی مشتریان صادراتی میوه های خوراکی"، فصلنامه پژوهشنامه بازرگانی، شماره 55، صص 151-181. قاسمی محمد سعید، خانگلدی مسعود ، (1388)، "کاربرد منطق فازی در بازشناسی الگو: خوشه بندی"، دانشکده فنی و مهندسی، دانشگاه اراک مرتضوی سعید،آسمان دره یاسر،نجفی سیاهرودی مهدی و علوی سید مسلم،(1390)،"بخش بندی بازار گوشی تلفن همراه بر مبنای مزایای مورد انتظار مشتریان"، مدیریت بازرگانی، دوره سوم، شماره 8، صص 132-115. میرواحدی سید سعید و نوراله اوغلی رقیه،(1390)، "تکنیک های تحلیل در تحقیقات بازاریابی"،انتشارات آییژ. منابع انگلیسی Aggarwal, C. (2007),"Data Streams:Models and Algorithms", Advances in Database Systems, 31. Alpaydin E, (2004),"Introduction to Machine Learning", the MIT Press. Ann Maharaj,E, and D'Urso,P ,(2011),"Fuzzy clustering of time series in the frequency domain", information sceinces, 181:1187-1188 . Berry M and Linoff G, (1997), “Data Mining Techniques: For Marketing, Sales, and Customer Support”, New York: John Wiley and Sons. Berson A, Smith S and Thearling K, (2004), “Buildin Data Mining Applications for CRM”, Tata McGraw-Hill, New York. Bezdek J.C., Keller J, Krishnapuram R., and Pal N. R., (1999),”Fuzzy Models and Algorithms for Pattern Recognition and Image Processing”, Kluwer, Boston, London, Dordrecht. Chuang H. M ,Shen C.C.,(2008), “A study on the application of data mining techniques to enhance customer lifetime value-based on the department store industry”, The Seventh International Conference on Machine Learning and Cybernetics:168-173. Chunfei Zh, Zhiyi F,(2013), “An Improved K-means Clustering Algorithm”, Journal of Information & Computational Science 10,1: 193–199 George J, Klir Bo Yuan,(1995)," Fuzzy sets and Fuzzy Logic, Theory and applications", Prentice Hall PTR. Han J and Kamber M, (2001),” Data Mining: Concepts and Techniques”, Morgan Kaufmann Publishers,San Francisco,USA. Hosseininezhad F and Salajegheh A, (2012),”Study and Comparison of Partitioning Clustering Algorithms”, Iranian Journal of Medical Informatics, 2, 1: 38-40. Hesieh N.C , (2004),”An integrated data mining and behavioral scoring model for analyzing bank customers”, 27: 623-633 Karypis G, Han E.-H, and Kumar V, (1999),” Chameleon: ‘A hierarchical Clustering Algorithm Using Dynamic Modeling” ,IEEE Computer, Special Issue on Data Analysis and Mining 32, 8: 68–75 Kasabov N.K, and Song Q, (2002), “DENFIS: Dynamic evolving neural-fuzzy inference system and its application for time-series prediction”, IEEE Transactions on Fuzzy Systems 10, 2: 144–154 Kim K-j, Ahn, H,(2008),”A recommender system using GA K-means clustering in an online shopping market”, Expert Systems with Applications,34: 1200-1209. Larose D.T,(2005),”Discovering knowledge in Data , an introduction to Data mining “ .New Jersey . WILLEY. Lee C-Y, Ma L, and Antonsson, E K, (2001),”Evolutionary and adaptive synthesis methods”, In Formal Engineering Design Synthesis (E. K. Antonsson and J. Cagan, eds), Cambridge University Press, Cambridge, U.K.: 270–320. Lee Marcus T.H (2003),”A Bayesian neural network model of consumer choice. Dissertation for the degree of Doctor of philosophy”, University of Toronto. Li C, Biswas G, Dale M, and Dale P, (2002), “Matryoshka: a HMM based temporal data clustering methodology for modeling system dynamics”, Intelligent Data Analysis, 6, 3: 281–308 Li Der-Chiang, Dai Wen-Li and Tseng Ean-Ting, (2011),”A twostage clustering mehod to analyze customer characteristics to build discriminative customer management: A case of textile manufacturing business”, expert systems with applications, 14: 1-6. Li W, Wu X, (2010),”Credit Card Customer Segmentation and Target Marketing Based on Data Mining”, International Conference on Computational Intelligence and Security: 73 – 76. Liao S.H., Chen Y.J., Hsieh H.H., (2011), “mining customer knowledge for direct selling and marketing, Expert Systems with Applications”, 38: 6059–6069. Linder R, Geier J, Kolliker M, (2004),” Artificial neural networks, classification trees and regression: which method for which customer base, Journal of Database Marketing & Customer Strategy Management”, 11, 4: 344-356. Malthouse E, C, (2001),”Assessing the performance of direct marketing scoring models”, Journal of Interactive Marketing, 15: 49-62. Mitchell, Tom M, (1997), “Machine Learning”, McGraw-Hill Science. Nanda S.R., Mahanty B., Tiwari M.K,(2010),”Clustering Indian stock market data for portfolio management”, Expert Systems with Applications, 37,8793–8798. Peters G, Weber R, Nowatzke R, (2012),”Dynamic rough clustering and its applications”, Applied Soft Computing, 12: 3193-3195. Robert S, Gyorodi,"A Comparative Study of Iterative Algorithm in Association Rules Mining ", Studies in Information and control, 12, 3. Sander J,(2003), "Principles of Knowledge Discovery in Data: Clustering I", Department of Computing Science University of Alberta, Tutorial Slides. Seret A, Seppe K.L.M. Broucke Y, Baesens B, Vanthienen J,(2014),” A dynamic understanding of customer behavior processes based on clustering and sequence mining”, Expert Systems with Applications,41: 4648-4657. Weber R,(2007), Fuzzy Clustering In Dynamic Data Mining- Techniques And Applications,pp:315-330,In ”Advances in fuzzy clustering and its applications”, Valente de Oliveira J, Pedrycz W, Wiley. Wu Hsin-Hung, Chang En-Chi and Lo Chiao-Fang, (2009),” Applying RFM model and K-means method in customer value analysis of an outfitter, International Conference on Concurrent Engineering, New York. You C, (2009),”On the convergence of uncertain sequences, Mathematical and Computer Modeling”, 49: 482-487. Zhenguo Z, Ying K, Gen P, (2012),"Dynamic data mining based on cloud model", Atlantis press. http://ceit.aut.ac.ir/~shiry, Dr.Saeed Shiry Ghidary Academic website http://www.thearling.com/ an introduction to data mining.htm.