مقالات فارسی

مقالات ترجمه شده

دانلود فایل با شمار فاکتور

لطفا شماره فاکتور خود را درج نمایید

جدیدترین لغات واژه‌نامه

Nordic countries

کشورهای شمال اروپا

wildfires

آتش سوزی های جنگلی

ambidextrous

دوسویه

flout

نادیده گرفتن، دست انداخ�

inexorable

اجتناب ناپذیر، بی شفقت،

آمار بازدیدکنندگان

بازدید امروز :6
بازدید روز گذشته :52
بازدید این هفته :64
بازدید این ماه :103
مجموع آمار بازدید ها :849501

عنوان محصول: خوشه‌بندی زیر فضای سلسله‌مراتبی موازی داده‌های دسته‌بندی‌شده

دسته‌بندی: مقالات ترجمه شده رشته کامپیوتر

تاریخ انتشار: شنبه 21 تير 1399

خوشه‌بندی زیر فضای سلسله‌مراتبی موازی داده‌های دسته‌بندی‌شده

توضیحات مختصر: خوشه‌بندی موازی، یک زمینه تحقیقاتی مهم در آنالیز داده‌های کلان است. تکنیک‌های HAC متداول (خوشه‌بندی متراکم سلسله‌مراتبی) کارایی کافی برای کنترل و مدیریت مجموعه داده‌های طبقه‌بندی‌شده با مقیاس بزرگ را ندارند و دلیل آن دو مشکل عمده است. اول اینکه، HAC به میزان چشمگیری از منابع حافظه و زمان cpu استفاده...

خوشه‌بندی زیر فضای سلسله‌مراتبی موازی داده‌های دسته‌بندی‌شده

قیمت : 45000 تومان

تخفیف: 3000 تومان

تخفیف ویژه : 10 درصد

قیمت نهایی: 37500 تومان

603 بازدید

کد مقاله: TTC- 3848

نوع فایل : docx

خرید و دانلود

لینک دانلود فایل خریداری شده بلافاصله بعد از خرید موفق فعال خواهد شد.

Journal: IEEE 2018,

Parallel Hierarchical Subspace Clustering of Categorical Data

Abstract

Parallel clustering is an important research area of big data analysis. The conventional HAC (Hierarchical Agglomerative Clustering) techniques are inadequate to handle big-scale categorical datasets due to two drawbacks. First, HAC consumes excessive CPU time and memory resources; and second, it is non-trivial to decompose clustering tasks into independent sub-tasks executed in parallel. We solve these two problems by a MapReduce-based hierarchical subspace-clustering algorithm - called PAPU - using LSHbased data partitioning. PAPU is conducive to partitioning a large-scale dataset into multiple independent sub-datasets, into which similar data objects are mapped. Advocating parallel computing, PAPU obtains sub-clusters corresponding to respective attribute subspaces from independent chunks in the local clustering phase. To improve the accuracy of approximated clustering results, PAPU measures various scale clusters by applying the hierarchical clustering scheme to iteratively merge sub-clusters during the global clustering phase. We implement PAPU on a 24-node Hadoop computing platform. The experimental results reveal that hierarchical subspace-clustering coupled with the data-partitioning strategy achieves high clustering efficiency on both synthetic and real-world large-scale datasets. The experiments also demonstrate that PAPU delivers superior performance in terms of extensibility and scalability (e.g., a nearly linear speedup).

Keywords: hierarchical subspace-clustering, LSH-based data partitioning, categorical data, Hadoop

چکیده

خوشه‌بندی موازی، یک زمینه تحقیقاتی مهم در آنالیز داده‌های کلان است. تکنیک‌های HAC متداول (خوشه‌بندی متراکم سلسله‌مراتبی) کارایی کافی برای کنترل و مدیریت مجموعه داده‌های طبقه‌بندی‌شده با مقیاس بزرگ را ندارند و دلیل آن دو مشکل عمده است. اول اینکه، HAC به میزان چشمگیری از منابع حافظه و زمان cpu استفاده می‌کند و دوم اینکه در این رویکردها، تجزیه وظایف خوشه‌بندی به زیر وظایفی مستقلی که به‌صورت موازی اجرا شوند، اهمیتی ندارد. ما این دو مشکل را با استفاده از الگوریتم خوشه‌بندی زیر فضای سلسله‌مراتبی مبتنی بر کاهش نگاشت با نام PAPU و با استفاده از روش بخش‌بندی داده مبتنی بر LSH حل کرده‌ایم. PAPU منجر به بخش‌بندی یک مجموعه داده بزرگ به تعداد زیادی از مجموعه داده‌های مستقل شده است که اشیاء داده‌ای مشابه به درون آن‌ها نگاشت شده‌اند. با پشتیبانی از محاسبات موازی، PAPU قادر به دستیابی به زیر خوشه‌هایی متناظر با زیر فضای ویژگی‌های به‌دست‌آمده از بخش‌های مستقل، در فاز خوشه‌بندی محلی است. به‌منظور افزایش دقت نتایج تقریبی خوشه‌بندی، PAPU خوشه‌هایی با مقیاس‌های بزرگ را از طریق اعمال طرح خوشه‌بندی سلسله‌مراتبی به‌منظور ادغام تکراری زیر خوشه‌ها در طول فاز خوشه‌بندی سراسری، مورد سنجش قرار می‌دهد. ما PAPU را بروی یک پلت فرم محاسباتی هادوپ با 24 گره پیاده‌سازی کرده‌ایم. نتایج آزمایشات نشان می‌دهند که خوشه‌بندی زیر فضای سلسله‌مراتبی ترکیب شده با استراتژی بخش‌بندی داده، می‌تواند به بهره‌وری خوشه‌بندی بالایی در مجموعه داده‌هایی بزرگ واقعی و ساختگی دست یابد. علاوه بر این، آزمایشات نشان می‌دهند که PAPU می‌تواند به کارایی چشمگیری در مقیاس‌پذیری و توسعه‌پذیری دست یابد.

کلمات کلیدی: خوشه‌بندی زیر فضای سلسله‌مراتبی، بخش‌بندی داده مبتنی بر LSH، داده‌های طبقه‌بندی‌شده، هادوپ.

دانلود رایگان مقاله انگلیسی

تعداد صفحات انگلیسی:14 صفحه

تعداد صفحات فـارسـی:35 صفحه

طراحی سایت

	پاورپوینت شبکه های نرم افزار مح... پاورپوینت شبکه های نرم افزار محور در 24 اسلاید
	پاورپوینت رایانش ابری ... پاورپوینت رایانش ابری در 27 اسلاید
	پاورپوینت اینترنت اشیا و کاربرد... اینترنت اشیا و کاربردهای آن (در قالب پاورپوینت)