ما در این تحقیق به معرفی مختصر دو تکنیک خوشهبندی اکتفا کردهایم.
K – Means:
در این الگوریتم تعداد خوشهها (K) مشخص بوده و الگوریتم با تابع هدف حداقل نمودن فواصل درون یک خوشه به انتخاب K مرکز خوشه میپردازد. گامهای این الگوریتم به صورت زیر است:
- انتخاب k مرکز خوشه اولیه به صورت تصادفی
- خوشهبندی دادهها: هر داده به خوشهای تعلق دارد که کمترین فاصله را با مرکز آن خوشه داشته باشد.
- به روز کردن k مرکز خوشه از طریق محاسبه میانگین وزنی اعضای هر خوشه
مراحل ۲ و ۳ تا زمان یافتن حداقل فاصله درون خوشهای ادامه مییابد.
نگاشتهای خودسازمانده[۱۰۲] (SOM):
تکنیک SOM که توسط کوهنن[۱۰۳] معرفی شد، نوعی شبکه عصبی است که به خوشهبندی دادهها میپردازد. این شبکه عصبی در حیطه شبکههای عصبی بدون ناظر قرار دارد و بدین معنی است که برای به روز کردن وزنهای اتصالات شبکه نیازی به تاثیر بازخورد ناظر نیست؛ به همین دلیل به عنوان خودسازمانده شناخته میشوند. ساختار این شبکه فقط دارای دو لایه است؛ یک لایه ورودی که به اندازه ابعاد (تعداد ویژگیها) دادههای ورودی نرون دارد و یک لایه خروجی که به اندازه تعداد خوشهها نرون دارد و میتوانند در ابعاد مختلف سازمان یابند. تمامی نرونهای ورودی به تمامی نرونهای خروجی متصل هستند؛ بنابراین، برای هر نرون خروجی یا به عبارت دیگر برای هر خوشه، اوزان کمانهای متصل به آن خوشه را میتوان در غالب یک بردار وزن برای آن خوشه در نظر گرفت. ابعاد بردارهای وزن خوشهها همبعد بادادههای ورودی است (Karray and Silva 2004). شکل ۲-۵ ساختار این شبکه را نشان میدهد.
شکل ۲‑۵ : ساختار SOM
الگوریتم SOM بر مبنای یادگیری رقابتی است؛ بدین معنا که نرونهای خروجی بر اساس شباهتی که با بردار ورودی دارند با یکدیگر رقابت میکنند و نرونی که بیشترین شباهت را با بردار ورودی داشته باشد به عنوان نرون برنده انتخاب میشود. بر اساس همین الگوریتم یادگیری رقابتی است که SOM قادر خواهد بود دادههای ورودی را بر اساس شباهت موجود بین دادهها خوشهبندی کند. از آنجایی که در SOM ویژگیهای توپولوژیکی مربوط به مجموعه داده حفظ میشود، میتوان از آن برای اهداف کاهش بعد نیز استفاده کرد. در واقع این بدان معناست که، اگر دو داده در فضای ابعاد اولیه به یکدیگر نزدیک باشند، این وضع در فضای تقلیل یافته نیز حفظ میشود.
قبل از بیان گامهای الگوریتم لازم است با مفهوم همسایگی در این الگوریتم آشنا شویم. شعاع همسایگی برای یک نرون لایه خروجی مشخص کننده نرونهای همسایه آن نرون است. مراحل الگوریتم SOM به صورت زیر است (Karray and Silva 2004):
برای دانلود متن کامل پایان نامه به سایت zusa.ir مراجعه نمایید. |
- تمامی وزنها (wijها) و نرخ یادگیری α و شعاع همسایگی Nc مقداردهی اولیه میشوند.
- یک داده ورودی x از مجموعه دادههای ورودی به شبکه معرفی میشود.
- انتخاب نرون برنده بر اساس معیار فاصله (معمولا فاصله اقلیدسی در نظر گرفته میشود) :
- به روز کردن وزن نرون برنده و نرونهای همسایه از تکرار k به تکرار k+1:
- تکرار گامهای ۲ تا ۴ به ازای تمامی برداهای ورودی.
More Stories
پیشبینی رویگردانی مشتریان در مدیریت ارتباط با مشتری با استفاده از تکنیکهای دادهکاوی؛ مورد مطالعه …
سايت مقالات فارسی – پیشبینی رویگردانی مشتریان در مدیریت ارتباط با مشتری با استفاده از تکنیکهای دادهکاوی؛ …
پژوهش دانشگاهی – پیشبینی رویگردانی مشتریان در مدیریت ارتباط با مشتری با استفاده از تکنیکهای …