خوشه‌بندی زیر فضای سلسله‌مراتبی موازی داده‌های دسته‌بندی‌شده
واتساپ:09141077352 همراه: 09141077352 ثابت: 35250068-041 سفارش سمینار و مقاله سفارش ترجمه تخصصی
 

دانلود فایل با شمار فاکتور

لطفا شماره فاکتور خود را درج نمایید


جدیدترین لغات واژه‌نامه

آمار بازدیدکنندگان

بازدید امروز :105
بازدید روز گذشته :87
بازدید این هفته :361
بازدید این ماه :2147
مجموع آمار بازدید ها :786121

عنوان محصول: خوشه‌بندی زیر فضای سلسله‌مراتبی موازی داده‌های دسته‌بندی‌شده

دسته‌بندی: مقالات ترجمه شده رشته کامپیوتر
تاریخ انتشار: شنبه 21 تير 1399
خوشه‌بندی زیر فضای سلسله‌مراتبی موازی داده‌های دسته‌بندی‌شده خوشه‌بندی زیر فضای سلسله‌مراتبی موازی داده‌های دسته‌بندی‌شده
توضیحات مختصر: خوشه‌بندی موازی، یک زمینه تحقیقاتی مهم در آنالیز داده‌های کلان است. تکنیک‌های HAC متداول (خوشه‌بندی متراکم سلسله‌مراتبی) کارایی کافی برای کنترل و مدیریت مجموعه داده‌های طبقه‌بندی‌شده با مقیاس بزرگ را ندارند و دلیل آن دو مشکل عمده است. اول اینکه، HAC به میزان چشمگیری از منابع حافظه و زمان cpu استفاده...
خوشه‌بندی زیر فضای سلسله‌مراتبی موازی داده‌های دسته‌بندی‌شده خوشه‌بندی زیر فضای سلسله‌مراتبی موازی داده‌های دسته‌بندی‌شده


قیمت قیمت : 45000 تومان
تخفیف تخفیف: 3000 تومان
تخفیف تخفیف ویژه : 10 درصد
قیمت نهایی قیمت نهایی: 37500 تومان
324 بازدید
کد مقاله: TTC- 3848
نوع فایل : docx
لینک دانلود فایل خریداری شده بلافاصله بعد از خرید موفق فعال خواهد شد.
Journal: IEEE 2018,

Parallel Hierarchical Subspace Clustering of Categorical Data
Abstract
Parallel clustering is an important research area of big data analysis. The conventional HAC (Hierarchical Agglomerative Clustering) techniques are inadequate to handle big-scale categorical datasets due to two drawbacks. First, HAC consumes excessive CPU time and memory resources; and second, it is non-trivial to decompose clustering tasks into independent sub-tasks executed in parallel. We solve these two problems by a MapReduce-based hierarchical subspace-clustering algorithm - called PAPU - using LSHbased data partitioning. PAPU is conducive to partitioning a large-scale dataset into multiple independent sub-datasets, into which similar data objects are mapped. Advocating parallel computing, PAPU obtains sub-clusters corresponding to respective attribute subspaces from independent chunks in the local clustering phase. To improve the accuracy of approximated clustering results, PAPU measures various scale clusters by applying the hierarchical clustering scheme to iteratively merge sub-clusters during the global clustering phase. We implement PAPU on a 24-node Hadoop computing platform. The experimental results reveal that hierarchical subspace-clustering coupled with the data-partitioning strategy achieves high clustering efficiency on both synthetic and real-world large-scale datasets. The experiments also demonstrate that PAPU delivers superior performance in terms of extensibility and scalability (e.g., a nearly linear speedup).
Keywords: hierarchical subspace-clustering, LSH-based data partitioning, categorical data, Hadoop

چکیده
خوشه‌بندی موازی، یک زمینه تحقیقاتی مهم در آنالیز داده‌های کلان است. تکنیک‌های HAC متداول (خوشه‌بندی متراکم سلسله‌مراتبی) کارایی کافی برای کنترل و مدیریت مجموعه داده‌های طبقه‌بندی‌شده با مقیاس بزرگ را ندارند و دلیل آن دو مشکل عمده است. اول اینکه، HAC به میزان چشمگیری از منابع حافظه و زمان cpu استفاده می‌کند و دوم اینکه در این رویکردها، تجزیه وظایف خوشه‌بندی به زیر وظایفی مستقلی که به‌صورت موازی اجرا شوند، اهمیتی ندارد. ما این دو مشکل را با استفاده از الگوریتم خوشه‌بندی زیر فضای سلسله‌مراتبی مبتنی بر کاهش نگاشت با نام PAPU و با استفاده از روش بخش‌بندی داده مبتنی بر LSH حل کرده‌ایم. PAPU منجر به بخش‌بندی یک مجموعه داده بزرگ به تعداد زیادی از مجموعه داده‌های مستقل شده است که اشیاء داده‌ای مشابه به درون آن‌ها نگاشت شده‌اند. با پشتیبانی از محاسبات موازی، PAPU قادر به دستیابی به زیر خوشه‌هایی متناظر با زیر فضای ویژگی‌های به‌دست‌آمده از بخش‌های مستقل، در فاز خوشه‌بندی محلی است. به‌منظور افزایش دقت نتایج تقریبی خوشه‌بندی، PAPU خوشه‌هایی با مقیاس‌های بزرگ را از طریق اعمال طرح خوشه‌بندی سلسله‌مراتبی به‌منظور ادغام تکراری زیر خوشه‌ها در طول فاز خوشه‌بندی سراسری، مورد سنجش قرار می‌دهد. ما PAPU را بروی یک پلت فرم محاسباتی هادوپ با 24 گره پیاده‌سازی کرده‌ایم. نتایج آزمایشات نشان می‌دهند که خوشه‌بندی زیر فضای سلسله‌مراتبی ترکیب شده با استراتژی بخش‌بندی داده، می‌تواند به بهره‌وری خوشه‌بندی بالایی در مجموعه داده‌هایی بزرگ واقعی و ساختگی دست یابد. علاوه بر این، آزمایشات نشان می‌دهند که PAPU می‌تواند به کارایی چشمگیری در مقیاس‌پذیری و توسعه‌پذیری دست یابد.
کلمات کلیدی: خوشه‌بندی زیر فضای سلسله‌مراتبی، بخش‌بندی داده مبتنی بر LSH، داده‌های طبقه‌بندی‌شده، هادوپ.

تعداد صفحات انگلیسی تعداد صفحات انگلیسی:14 صفحه
تعداد صفحات فارسی تعداد صفحات فـارسـی:35 صفحه

  • آدرس: تبریز، آبرسان، مهرگان چهارم
  • تلفن  تماس: 09016347107
  • تلفن  ثابت : 35250068-041
  •  Mailttcenterاین آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید : آدرس  ایمیل
  • @zoodyab :آدرس تلگرام
مرکز  تخصصی  تلاش ترجمه از  سال  1385 شروع به کار نموده است  و تا کنون بیش از ده هزار ترجمه در رشته ها و زمینه های مختلف توسط متخصصین این مرکز انجام  شده  است.

تمامی ترجمه‌های انجام شده توسط موسسه تخصصی تلاش ترجمه، به صورت دستی (غیرماشینی) بوده و توسط مترجمین با سابقه انجام می‌شوند. ترجمه‌های انجام شده توسط موسسه تلاش ترجمه در قالب فایل Word و به صورت کاملا روان و بازخوانی شده و با ضمانت بازگشت وجه 72 ساعته (در صورت عدم رضایت از ترجمه) خدمت مشتریان محترم ارائه می‌شود.