راهنمای نگارش پایان نامه با موضوع ارائه یک الگوریتم کشف … – منابع مورد نیاز برای مقاله و پایان نامه : دانلود پژوهش های پیشین |
با اینکه فرمول ۴-۲ برای محاسبه وزن کلمات روش مناسبی است ولی رابطه نرمالی نیست. به عنوان مثال در بعضی از سندها مشاهده میشود که یک کلمهای Tf بالایی دارد که صرفاً به خاطر طولانی بودن سند اتفاق میافتد. برای نمونه اگر سندی به اسم D داشته باشیم و سند D’ را از افزودن D به خود آن به دست آوریم (D’ = D + D)، طبیعتاً Tfای که کلمه t در سند D’ میگیرد دو برابر Tf کلمه t در سند D خواهد بود. برای رفع مشکل مطرح شده از فرمول ۴-۴ استفاده میشود که مقادیر انتساب داده شده به کلمات را نرمال سازی میکند.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
رابطه ۴-۴
رابطه ۴-۵
مفاهیم پارامترهای مورد استفاده در معادلات عبارتند از :
: بیشترین مقدار Tf انتساب داده شده به یک کلمه در یک سند
: به عنوان تصفیهکننده عمل میکند که معمولاً بر روی Tf های خیلی کوچک و Tf های خیلی بزرگ تأثیر میگذارد.
هر چند که روشهای فوق از لحاظ دقت وزن دهی به کلمات کارایی خوبی دارند ولی از نظر محاسبه وزن وقتگیر هستند. چون که محاسبه df هر کلمه کار بسیار وقتگیری هستند. یک روش خلاقانه با زمان محاسبه خیلی کمتری وجود دارد که رابطه آن :
رابطه ۴-۶
در بسیاری از مواقع، وقوع ۱۰ بار کلمه t در یک سند معادل با وقوع ۱ بار در سند اهمیت دارد که برای اعمال این نکته به وزن کلمات میتوانیم از فرمول فوق استفاده کنیم.
۴-۳-۱-۲ محاسبه میزان تشابه
با فراهم شدن بردارهای وبسرویسها و درخواست کاربران، تنها مرحله محاسبه میزان مشابهت بین درخواست کاربر با وبسرویسها باقی میماند که برای این کار کسینوس زاویهای که بردار درخواست کاربر با بردار وبسرویس میسازد، محاسبه میشود که فرمول مورد استفاده به این صورت است:
و : بردارهای سند d و درخواست q
: ضرب نقطهای[۱۳۲] دو تا بردار
: طول اقلیدسی[۱۳۳] بردار
با بهره گرفتن از فرمولهای فوق میزان مشابهت هر کدام از سندها با درخواست کاربر محاسبه میشود و در نهایت سندهایی که میزان مشابهت بیشتری به درخواست کاربر دارند به عنوان نتیجه به کاربر برگردانده میشوند. الگوریتم بردار فضای حالت معایبی نیز دارد که در بخشهای بعدی همراه با راه حل بیان خواهند شد.
۴-۳-۲ خوشهبندی وب سرویسها
با توجه به مطالبی که در بخش ۲-۳ بیان شد، فرایند خوشهبندی اطلاعات باعث کاراتر شدن سیستمهای بازیابی اطلاعات و موتورهای جستجو میشود. با توجه به شباهتی که بین الگوریتمهای کشف وبسرویس و موتورهای جستجو و توصیفات متنی وبسرویسها با اسناد متنی وجود دارد، استفاده از این فرایند در الگوریتم پیشنهادی امری ضروری است. الگوریتمهای خوشهبندی مختلفی در بخش ۲-۳ تشریح شد که روند کلی آنها به این صورت بود که:
مجموعه ای از اشیاء(به عنوان مثال تعدادی فایل WSDL وب سرویسها) را به عنوان ورودی میگیرند.
خوشههایی از اشیاء را به صورت خودکار میسازند که با توجه به نوع الگوریتم، خوشهها میتوانند گسسته یا همپوشان باشند.
استفاده از این الگوریتمهای خوشهبندی در الگوریتم پیشنهادی معایبی دارد که به شرح زیر میباشند.
ایجاد نشدن خوشههای مورد نظر کاربران: همانطور که گفته شد این الگوریتمها با بهره گرفتن از وبسرویسهای موجود خوشههایی را به صورت خودکار ایجاد میکنند که در این حالت ممکن است خوشههای مورد نظر کاربران ایجاد نشوند. استفاده از این نوع الگوریتمها در محیطهایی که کاربران به صورت فعال در آنها (همانند شبکهی اجتماعی تخصصی) حضور دارند، مناسب نیست. برای اینکه کاربران در این نوع محیطها مایلند که خوشههای با مفهومی را انتخاب و یا ایجاد کنند.
زمانبر بودن ایجاد خوشههای جدید با افزایش تدریجی وبسرویسها به سیستم: در محیط پویای سیستمهای کشف وبسرویس که هر روز ممکن است تعدادی وبسرویس به سیستم اضافه شود، به روز کردن خوشههای موجود یا ایجاد خوشههای جدید با بهره گرفتن از این نوع الگوریتمها زمان بر است.
با توجه به مطالب و مشکلات بیان شده، باید الگوریتمی ارائه شود که هم مزیتهای الگوریتمهای خوشهبندی قبلی را داشته باشد و هم معایب مطرح شده فوق را نداشته باشد. روش ارائه شده برای خوشهبندی وبسرویسها در این تحقیق، تحت تأثیر مؤلفههایی همانند شبکهی اجتماعی تخصصی و رویکرد آگاه از زمینه مورد استفاده در الگوریتم کلی است که باعث میشوند کاربران نقش زیادی در خوشهبندی مناسب وبسرویسها داشته باشند. روند کلی الگوریتم خوشهبندی پیشنهادی به شرح زیر میباشد:
ایجاد خوشه: همانطور که بیان شد، هر کدام از کاربران با توجه به نیاز خود و سیستم میتوانند خوشههای مورد نظر خود را ایجاد کنند که این کار به آسانی با وارد کردن نام و توصیفی از خوشه صورت میپذیرد. با اینکه کاربران توانایی ایجاد خوشههای مختلفی را دارند، با این حال همه خوشههای ایجاد شده نمیتوانند به یک اندازه در الگوریتم کشف وبسرویس تأثیرگذار باشند. انتخاب شدن خوشهها توسط کاربران دیگر از نکات کلیدی است که باعث میشود تنها خوشههایی که مورد توجه افراد گوناگون قرار گرفتهاند تأثیر بیشتری بر روی الگوریتم کشف وبسرویس داشته باشند.
شکل ۴-۳ : واسط کاربری ایجاد خوشه
اضافه شدن وب سرویسها به خوشهها: کاربران در سه موقعیت وبسرویسهای خود را به خوشه اضافه میکنند که عبارتند از:
زمان ایجاد خوشه: در این موقعیت هم کاربر و هم سیستم میتوانند وبسرویسهایی را به خوشهها اضافه کنند. بدین صورت که کاربر از بین وبسرویسهایی که خود انتشار داده است، وبسرویسهایی را که بنا به تشخیص خود میتوانند در این خوشه قرار بگیرند به خوشه اضافه میکند. روش دوم نیز این است که سیستم وبسرویسهای کاربری را که خوشهای ایجاد کرده است، با توصیفات خوشه جدید مقایسه میکند که با هر کدام از وبسرویسها مشابه باشند به خوشه اضافه میکند.
زمان انتشار وبسرویس جدید: زمانی که وبسرویس جدیدی توسط کاربر انتشار داده میشود با خوشههای پسندیده توسط کاربر مقایسه میشود و هر کدام از وبسرویسها که شباهت بیشتری با این خوشه ها داشته باشند به آن اضافه میشوند.
زمان پسندیده شدن خوشه جدید : زمانی که کاربر خوشه جدیدی را میپسندد همه وبسرویسهای انتشار یافته توسط کاربر با خوشه مقایسه میشود تا وب سرویسهای مشابه به خوشه اضافه شوند.
ویرایش توصیفات خوشهها : توصیف خوشه انعکاسی از محتوای داخلی (وبسرویسهای متعلق به خوشه) خوشه است که با اضافه شدن هر وبسرویسی به آن باید به روز شود. به روز بودن توصیف خوشه هم بر الگوریتم کشف وبسرویس پیشنهادی و هم در اضافه شدن وبسرویسهای جدید به خوشه تأثیر میگذارد. هر اندازه که توصیف خوشه انعکاس خوبی از وبسرویسهای متعلق به خوشه را داشته باشد، به همان اندازه بر دقت افزودن وبسرویس جدید به خوشه افزایش مییابد و یا در الگوریتم کشف وب سرویس، زمانی که درخواست کاربر با توصیفات خوشهها مقایسه میشود، تأثیر زیادی دارد.
راهکار خوشهبندی مطرح شده، بنا به دلایلی، مشکلات الگوریتمهای خوشهبندی قبلی را ندارد: یکی از مشکلات الگوریتمهای قبلی ایجاد نشدن خوشههای مورد نظر کاربران است. در این روش چون کاربران خودشان خوشه های مورد نیاز را ایجاد میکنند، چنین مشکلی وجود نخواهد داشت. مشکل دوم، زمان بر بودن ایجاد خوشه های جدید با افزایش تدریجی وبسرویسها به سیستم است. با توجه به اینکه افزودن وبسرویسهای جدید تنها در خوشههایی که کاربر پسندیده است تغییراتی اعمال میکند، زمانبر نخواهد بود، اما در الگوریتمهای قبلی با افزایش تدریجی وبسرویسها کل ساختار خوشهبندی تغییر میکند.
۴-۴ معماری الگوریتم پیشنهادی
فرم در حال بارگذاری ...
[سه شنبه 1401-04-14] [ 02:08:00 ق.ظ ]
|