مقالات فارسی

مقالات ترجمه شده

دانلود فایل با شمار فاکتور

لطفا شماره فاکتور خود را درج نمایید

جدیدترین لغات واژه‌نامه

Nordic countries

کشورهای شمال اروپا

wildfires

آتش سوزی های جنگلی

ambidextrous

دوسویه

flout

نادیده گرفتن، دست انداخ�

inexorable

اجتناب ناپذیر، بی شفقت،

آمار بازدیدکنندگان

بازدید امروز :4
بازدید روز گذشته :52
بازدید این هفته :62
بازدید این ماه :101
مجموع آمار بازدید ها :849499

عنوان محصول: استفاده از یادگیری ماشین برای بهینه‌سازی موازی‌سازی در برنامه‌های کاربردی کلان داده‌ها

دسته‌بندی: مقالات ترجمه شده رشته کامپیوتر

تاریخ انتشار: سه شنبه 17 مهر 1398

استفاده از یادگیری ماشین برای بهینه‌سازی موازی‌سازی در برنامه‌های کاربردی کلان داده‌ها

توضیحات مختصر: در سال‌های اخیر، چارچوب‌های محاسبات خوشه‌ای حافظه به دلیل توانایی بالایشان در تجزیه‌وتحلیل موازی حجم بزرگی از داده‌ها، توجهات زیادی را به خود جلب کرده‌اند. این چارچوب‌ها بسیار پیچیده بوده و استفاده از آن‌ها برای مدیریت محیط اطراف دشوار است. علاوه بر این، کمبودهایی در راستای درک بهتر و بهینه‌سازی چنی...

استفاده از یادگیری ماشین برای بهینه‌سازی موازی‌سازی در برنامه‌های کاربردی کلان داده‌ها

قیمت : 50000 تومان

تخفیف: 5000 تومان

تخفیف ویژه : 10 درصد

قیمت نهایی: 40000 تومان

566 بازدید

کد مقاله: TTC- 3795

نوع فایل : docx

خرید و دانلود

لینک دانلود فایل خریداری شده بلافاصله بعد از خرید موفق فعال خواهد شد.

Journal: Elsevier 2017,

Using machine learning to optimize parallelism in big data applications

Abstract

In-memory cluster computing platforms have gained momentum in the last years, due to their ability to analyse big amounts of data in parallel. These platforms are complex and difficult-to-manage environments. In addition, there is a lack of tools to better understand and optimize such platforms that consequently form the backbone of big data infrastructure and technologies. This directly leads to underutilization of available resources and application failures in such environment. One of the key aspects that can address this problem is optimization of the task parallelism of application in such environments. In this paper, we propose a machine learning based method that recommends optimal parameters for task parallelization in big data workloads. By monitoring and gathering metrics at system and application level, we are able to find statistical correlations that allow us to characterize and predict the effect of different parallelism settings on performance. These predictions are used to recommend an optimal configuration to users before launching their workloads in the cluster, avoiding possible failures, performance degradation and wastage of resources. We evaluate our method with a benchmark of 15 Spark applications on the Grid5000 testbed. We observe up to a 51% gain on performance when using the recommended parallelism settings. The model is also interpretable and can give insights to the user into how different metrics and parameters affect the performance.

Keywords: Machine learning, Spark, Parallelism, Big data

چکیده

در سال‌های اخیر، چارچوب‌های محاسبات خوشه‌ای حافظه به دلیل توانایی بالایشان در تجزیه‌وتحلیل موازی حجم بزرگی از داده‌ها، توجهات زیادی را به خود جلب کرده‌اند. این چارچوب‌ها بسیار پیچیده بوده و استفاده از آن‌ها برای مدیریت محیط اطراف دشوار است. علاوه بر این، کمبودهایی در راستای درک بهتر و بهینه‌سازی چنین چارچوب‌هایی که درنهایت منجر به ایجاد ستون فقرات تکنولوژی‌ها و زیر ساخت‌های کلان داده‌ها می‌شوند، وجود دارد. این روند به‌صورت مستقیم منجر به کمبود توانایی استفاده از منابع در دسترس و ایجاد خطاهای برنامه‌های کاربردی در چنین محیط‌هایی می‌شود. یکی از جنبه‌های مهمی که باید در این مسئله ارزیابی نمود، بهینه‌سازی فرآیند موازی‌سازی برنامه‌های کاربردی در چنین محیط‌هایی است. در این مقاله، ما یک روش مبتنی بر یادگیری ماشین پیشنهاد می‌دهیم که پارامترهای بهینه‌ای را برای روند موازی‌سازی وظایف در بارهای کاری کلان داده‌ها پیشنهاد می‌دهد. با نظارت و جمع‌آوری پارامترهای موجود در سطح سیستم و کاربرد، قادر به یافتن یک همبستگی آماری خواهیم بود که به ما امکان می‌دهد تا تأثیرات تنظیمات مختلف موازی‌سازی در کارایی و عملکرد را مشخص و پیش‌بینی نماییم. این پیش‌بینی‌ها به‌منظور ارائه توصیه‌ها و پیکربندی‌های بهینه برای کاربران قبل از شروع جریان‌های کاری آن‌ها در خوشه‌ها استفاده می‌شود و درنتیجه از ایجاد خطاهای ممکن، کاهش کارایی و هدر رفت منابع جلوگیری به عمل می‌آید. ما روش پیشنهادی خود را با استفاده از یک نمونه 15 موردی از برنامه‌های کاربردی اسپارک بر روی گرید 5000 گرهی ارزیابی کرده‌ایم. مشاهدات نشان داده‌اند که با استفاده از تنظیمات پیشنهادی برای روند موازی‌سازی، کارایی به میزان 51 درصد افزایش یافته است. این مدل پیشنهادی قابلیت تفسیر بالایی داشته و می‌تواند بصیرت روشنی برای کاربران به‌منظور ارزیابی تأثیرات پارامترها و معیارهای مختلف بر روری کارایی ارائه دهد.

کلمات کلیدی: یادگیری ماشین، اسپارک، موازی‌سازی، کلان داده‌ها.

دانلود رایگان مقاله انگلیسی

تعداد صفحات انگلیسی:17 صفحه

تعداد صفحات فـارسـی:41 صفحه

طراحی سایت

	پاورپوینت شبکه های نرم افزار مح... پاورپوینت شبکه های نرم افزار محور در 24 اسلاید
	پاورپوینت رایانش ابری ... پاورپوینت رایانش ابری در 27 اسلاید
	پاورپوینت اینترنت اشیا و کاربرد... اینترنت اشیا و کاربردهای آن (در قالب پاورپوینت)