متن کامل پایان نامه مقطع کارشناسی ارشد رشته  کامپیوتر با عنوان :بررسی روشهای خوشه بندی توزیعی در ادامه مطلب می توانید صفحات ابتدایی این پایان نامه را بخوانید و در صورت نیاز به متن کامل آن می توانید از لینک پرداخت و دانلود آنی برای خرید این پایان نامه اقدام نمائید.

 

 

 

دانشگاه آزاد اسلامی
واحد تهران جنوب
دانشكده تحصیلات تكمیلی

 

سمینار برای دریافت درجه كارشناسی ارشد “M.Sc”
مهندسی كامپیوتر – نرم افزار

 

عنوان :
بررسی روشهای خوشهبندی توزیعی

 

برای رعایت حریم خصوصی اسامی استاد راهنما و نگارنده درج نمی شود

تکه هایی از متن به عنوان نمونه :
(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چكیده
چگونگی سازماندهی و ادغام نتایج پرسوجوی بازیابیشده از منابع مختلف، یكی از موضوعات كلیدی در
بازیابی اطلاعات توزیعی است. برخی از پژوهشها و آزمایشات پیشین توصیه میكنند كه مرور اسـنادی
كه بهصورت خوشه بیان میشوند به نسبت اسنادی كه تنها در یـك لیـست مطـرح مـی شـوند كـارآیی
بیشتری دارند. ارائهی نتایج بازیابی بهصورت خوشه مبتنیبر فرضیهی خوشه است. بر طبق این فرضـیه،
وضعیت اسناد درون یك خوشه ارتباط مشابهی با پرسوجوی مطرح شده دارند.
خوشهبندی میتواند بهعنوان فرآیند بخشبندی یك مجموعه از الگوها به گـروههـای معنـادار همگـن و
منفصل بهنام خوشهها تعریف شود. در خوشهبندی دادههـای توزیـعشـده، مجموعـهی دادههـا در میـان
چندین سایت توزیع شدهاند.
خوشـهبنـدی در حـوزههـای كـاربردی مـدرن مثـل تعـاون در خریـد و فـروش ، بیولـوژی مولكـولی و
چندرسانهای وظیفهای مهم بر دوش دارد. در بسیاری از این حـوزههـا ، اساسـا اطلاعـات از سـایتهـای
مختلفی گرفته میشود. برای اقتباس اطلاعات از این دادهها ، آنها بهصورت یك مجموعـه درآمـدهانـد و
خوشهبندی میشوند.
در سالهای اخیر، پیشنهاداتی برای اكتشاف دانش و كاوش دادهها، و بهویژه برای خوشهبندی گـسترش

یک مطلب دیگر :

یافته اما تنها تعداد كمی از آنها برای منابع داده ای توزیعشده اسـت. در ایـن تحقیـق، یـك مـروری بـر
الگوریتمهای خوشهبندی توزیعی مطرح شدهاست.

مقدمه
امروزه حتی با گسترش وب، كاربران برای یافتن نیازهای خود با مناب ع اطلاعاتی بسیاری مواجه هـستند.
چگونگی یافتن سریع نیازهای كاربر از این اقیانوس اطلاعات، یك مسئله ی مهم است. اگـر چـه راهحـل
استفاده از موتور های جستجو در پایگاه دادههای یكتا ظاهرا برای آن كارآمد است ، اما در عمل ایـن راه
حل برای جمع آوری همهی اطلاعات مورد نیاز ، به خـصوص اطلاعـات مـرتبط بـا منـابع مخفـی وب ،
ممكن است مشكلاتی را به دنبال داشته باشد.
كشف دانش در پایگاه داده، كاوش دادهها نامیده میشود و ابزاری ارزشمند برای گزینش اطلاعات مفیـد

مقالات و پایان نامه ارشد

 

از هر پایگاه داده است. این ابزار قابلیت محاسباتی بالایی دارد و میتواند به توزیع و موازیسازی دادههـا
بپردازد. برای مسائل مربوط به كاوش دادههـا ، لازم اسـت تـا بخـشبنـدی هوشـمندانه ای از دادههـا را
بهدست آوریم. بدین طریق ما می توانیم دادهها را به صورت جداگانه بررسی كنیم. به منظـور كمـك بـه
قانونمند كردن مساله، معیار اصلی برای بخشبندی هوشمندانه میتواند این باشد كه دادههای درون هر
بخش تا آن جاییكه احتمال دارد ، با هم مشابه باشند، در حالی كه دادههای درون بخشهای مختلف بـا
یكدیگر هیچ شباهتی نداشته باشند. این معیار همان چیزی است كه در الگوریتمهای خوشهبندی مـورد
استفاده قرار میگیرد و به ما اجازه میدهد تا برای دستیابی به كـل پایگـاه داده، بـه مـوازیسـازی ایـن
مساله بپردازیم.
در فصل اول این تحقیق، مفاهیم توزیعشدگی بهطور خلاصه مورد بررسی قرار میگیرد. سپس در فـصل
دوم، به بحث در مورد خوشهبندی توزیعی پرداخته میشود. در فصل سوم، الگـوریتمهـای خوشـهبنـدی
مورد بررسی و مطالعه قرار گرفته و بهدنبال آن برخی از كاربردهای خوشهبندی در فصل چهـارم مطـرح
میشوند. در نهایت، در فصل پنجم یك نتیجهگیری كوتاهی از این مباحث به عمل میآید.

مقدمه 1-1
یك سیستم توزیع شده، از یك مجموعه از كامپیوترهای مستقل تشكیل شده است كه كـاربران، آنهـا را
به صورت یك سیستم یكپارچه می بینند.[1]
چند مطلب از تعریف فوق مشخص می شود. اول اینكه در یك سیستم توزیـع شـده، تعـدادی كـامپیوتر
وجود دارد. مطلب دیگر اینكه كاربران سیستم توزیع شده، تصور می كنند كه با یك سیستم واحـد كـار
می كنند. از مجموع این دو نكته می توان فهمید كه اجزای داخل یك سیستم توزیع شده باید به شكلی
با همدیگر تعامل داشته باشند كه بتوانند برای كاربر خود این تصور را ایجاد كنند كه با یك سیستم كار
می كند. اینكه چگونه چنین تعاملی ایجاد شود یك مسأله ی م هم در مبحث سیستم های توزیـع شـده
است.
در واقع هیچ اجباری در مورد نوع كامپیوترهای داخل سیـستم توزیـع شـده، همچنـین در مـورد روش
اتصال بین آنها وجود ندارد. یعنی اینكه نباید این محدودیت ها را كه اجزای این سیـستم هـا یـا اتـصال
بین آنها از نوع خاصی باشند، برای سیستم های توزیع شده در نظر گرفت. از طرفی كاربر این سیستمها
نباید هیچ اطلاع و نگرانی در مورد تفاوت های بین كامپیوترهای مختلف موجود در یك سیـستم توزیـع
شده و روشی كه با هم ارتباط برقرار می كنند، همچنین سازمان داخلی سیستم، داشته باشد . ایـن یـك
ویژگی حیاتی برای سیستم های توزیع شده است كه به آن شـفافیت مـی گوینـد . سیـستمی كـه ایـن
ویژگی را نداشته باشد، طبق قسمت دوم تعریف فوق یك سیستم توزیع شده خوانده نمی شود.
ویژگی دیگر سیستم های توزیع شده این است كه این سیستم ها طبق قوانین اسـتانداردی كـه فرمـت،
محتوا و معنی پیام های فرستاده شده و دریافت شده را مشخص می كنند، ارتباط برقرار می كننـد . بـه
این ویژگی باز بودن می گویند. این قوانین به طور رسمی در قالب پروتكل ها تدوین می شوند . پیروی از
این پروتكل ها باعث می شود اجزای متنوع و متفاوت موجود در سیستم های توزیع شـده كـه احتمـالاً

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...