ژانویه 22, 2021

تحقيق – پیش‌بینی رویگردانی مشتریان در مدیریت ارتباط با مشتری با استفاده از تکنیک‌های …

فاصله چبیشف

فاصله مینکوفسکی

فاصله کانبرا[۱۰۰]

جدایی زاویه‌ای[۱۰۱]

ما در این تحقیق به معرفی مختصر دو تکنیک خوشه‌بندی اکتفا کرده‌ایم.
K – Means:
در این الگوریتم تعداد خوشه‌ها (K) مشخص بوده و الگوریتم با تابع هدف حداقل نمودن فواصل درون یک خوشه به انتخاب K مرکز خوشه می‌پردازد. گام‌های این الگوریتم به صورت زیر است:

  1. انتخاب k مرکز خوشه اولیه به صورت تصادفی
  2. خوشه‌بندی داده‌ها: هر داده به خوشه‌ای تعلق دارد که کمترین فاصله را با مرکز آن خوشه داشته باشد.
  3. به روز کردن k مرکز خوشه از طریق محاسبه میانگین وزنی اعضای هر خوشه

مراحل ۲ و ۳ تا زمان یافتن حداقل فاصله درون خوشه‌ای ادامه می‌یابد.
نگاشت‌های خودسازمانده[۱۰۲] (SOM):
تکنیک SOM که توسط کوهنن[۱۰۳] معرفی شد، نوعی شبکه عصبی است که به خوشه‌بندی داده‌ها می‌پردازد. این شبکه عصبی در حیطه شبکه‌های عصبی بدون ناظر قرار دارد و بدین معنی است که برای به روز کردن وزن‌های اتصالات شبکه نیازی به تاثیر بازخورد ناظر نیست؛ به همین دلیل به عنوان خودسازمانده شناخته می‌شوند. ساختار این شبکه فقط دارای دو لایه است؛ یک لایه ورودی که به اندازه ابعاد (تعداد ویژگی‌ها) داده‌های ورودی نرون دارد و یک لایه خروجی که به اندازه تعداد خوشه‌ها نرون دارد و می‌توانند در ابعاد مختلف سازمان یابند. تمامی نرون‌های ورودی به تمامی نرون‌های خروجی متصل هستند؛ بنابراین، برای هر نرون خروجی یا به عبارت دیگر برای هر خوشه، اوزان کمان‌های متصل به آن خوشه را می‌توان در غالب یک بردار وزن برای آن خوشه در نظر گرفت. ابعاد بردارهای وزن خوشه‌ها هم‌بعد باداده‌های ورودی است (Karray and Silva 2004). شکل ۲-۵ ساختار این شبکه را نشان می‌دهد.
شکل ‏۲‑۵ : ساختار SOM
الگوریتم SOM بر مبنای یادگیری رقابتی است؛ بدین معنا که نرون‌های خروجی بر اساس شباهتی که با بردار ورودی دارند با یکدیگر رقابت می‌کنند و نرونی که بیشترین شباهت را با بردار ورودی داشته باشد به عنوان نرون برنده انتخاب می‌شود. بر اساس همین الگوریتم یادگیری رقابتی است که SOM قادر خواهد بود داده‌های ورودی را بر اساس شباهت موجود بین داده‌ها خوشه‌بندی کند. از آنجایی که در SOM ویژگی‌های توپولوژیکی مربوط به مجموعه داده حفظ می‌شود، می‌توان از آن برای اهداف کاهش بعد نیز استفاده کرد. در واقع این بدان معناست که، اگر دو داده در فضای ابعاد اولیه به یکدیگر نزدیک باشند، این وضع در فضای تقلیل یافته نیز حفظ می‌شود.
قبل از بیان گام‌های الگوریتم لازم است با مفهوم همسایگی در این الگوریتم آشنا شویم. شعاع همسایگی برای یک نرون لایه خروجی مشخص کننده نرون‌های همسایه آن نرون است. مراحل الگوریتم SOM به صورت زیر است (Karray and Silva 2004):

برای دانلود متن کامل پایان نامه به سایت zusa.ir مراجعه نمایید.

  1. تمامی وزن‌ها (wijها) و نرخ یادگیری α و شعاع همسایگی Nc مقداردهی اولیه می‌شوند.
  2. یک داده ورودی x از مجموعه داده‌های ورودی به شبکه معرفی می‌شود.
  3. انتخاب نرون برنده بر اساس معیار فاصله (معمولا فاصله اقلیدسی در نظر گرفته می‌شود) :
  4. به روز کردن وزن نرون برنده و نرون‌های همسایه از تکرار k به تکرار k+1:
  5. تکرار گام‌های ۲ تا ۴ به ازای تمامی برداهای ورودی.