دانلود فایل با شمار فاکتور
لطفا شماره فاکتور خود را درج نمایید
جدیدترین لغات واژهنامه
آمار بازدیدکنندگان
بازدید روز گذشته :70
بازدید این هفته :374
بازدید این ماه :1117
مجموع آمار بازدید ها :800742
عنوان محصول: ارزیابی کارایی یادگیری ویژگی عمیق برای دستهبندی تصاویر/ ویدیوی RGB-D
توضیحات مختصر:
شبکه¬های عصبی عمیق بهمنظور دسته¬بندی تصاویر/ ویدیوها، به موفقیت بالایی در کاربردهای بینایی ماشین دست یافتهاند. الگوریتمهای یادگیری عمیق بهصورت گستردهای در تصاویر و یا دادههای ویدیویی RGB به کار گرفته میشوند. بااینحال، با توسعه حسگرهای RGB-D کمهزینه (از قبیل مایکروسافت Kinect و Xtion Pro... |
ارزیابی کارایی یادگیری ویژگی عمیق برای دستهبندی تصاویر/ ویدیوی RGB-D |
Deep Neural Networks for image/video classification have obtained much success in var- ious computer vision applications. Existing deep learning algorithms are widely used on RGB images or video data. Meanwhile, with the development of low-cost RGB-D sensors (such as Microsoft Kinect and Xtion Pro-Live), high-quality RGB-D data can be easily ac- quired and used to enhance computer vision algorithms [14]. It would be interesting to investigate how deep learning can be employed for extracting and fusing features from RGB-D data. In this paper, after briefly reviewing the basic concepts of RGB-D informa- tion and four prevalent deep learning models (i.e., Deep Belief Networks (DBNs), Stacked Denoising Auto-Encoders (SDAE), Convolutional Neural Networks (CNNs) and Long Short- Term Memory (LSTM) Neural Networks), we conduct extensive experiments on five popular RGB-D datasets including three image datasets and two video datasets. We then present a detailed analysis about the comparison between the learned feature representations from the four deep learning models. In addition, a few suggestions on how to adjust hyper- parameters for learning deep neural networks are made in this paper. According to the extensive experimental results, we believe that this evaluation will provide insights and a deeper understanding of different deep learning algorithms for RGB-D feature extraction and fusion.
شبکه¬های عصبی عمیق بهمنظور دسته¬بندی تصاویر/ ویدیوها، به موفقیت بالایی در کاربردهای بینایی ماشین دست یافتهاند. الگوریتمهای یادگیری عمیق بهصورت گستردهای در تصاویر و یا دادههای ویدیویی RGB به کار گرفته میشوند. بااینحال، با توسعه حسگرهای RGB-D کمهزینه (از قبیل مایکروسافت Kinect و Xtion Pro-Live) بهراحتی میتوان دادههای RGB-D را با کیفیت بالا جمعآوری نموده و از آنها برای افزایش کارایی الگوریتمهای بینایی ماشین استفاده نمود. درنتیجه ارزیابی چگونگی استفاده از رویکردهای یادگیری عمیق بهمنظور استخراج و همجوشی ویژگی¬های به دست آمده از دادههای RGB-D، میتواند بسیار جذاب باشد. در این مقاله، بعد از ارزیابی مختصر مفاهیم پایه دادههای RGB-D و 4 مدل یادگیری عمیق متداول (یعنی شبکههای باور عمیق (DBNs), خود رمزنگاری حذف نویز پشتهای (SDAE)، شبکههای عصبی کانولوشن و شبکههای عصبی با حافظه کوتاه مدت (LSTM))، ما آزمایشات مختلفی را بر روی پنج پایگاه داده RGB-D مشهور انجام میدهیم که شامل سه پایگاه داده تصویری و دو پایگاه داده ویدیویی است. پس از آن، ما یک آنالیز از جزییات مقایسه بین ویژگیهای یادگیری به دست آمده از 4 مدل یادگیری عمیق را ارائه میکنیم. علاوه بر این، پیشنهاداتی در زمینه ساخت ابرپارامترهای مختلف برای یادگیری شبکههای عصبی عمیق ارائه میشوند. مطابق نتایج به دست آمده از آزمایشات مختلف، ما اعتقاد داریم که این ارزیابی قادر به ارائه بصیرت و درک عمیق از انواع مختلف الگوریتمهای یادگیری عمیق برای همجوشی و استخراج ویژگیهای RGB-D است.
- آدرس: تبریز، آبرسان، مهرگان چهارم
- تلفن تماس: 09016347107
- تلفن ثابت : 35250068-041
- Mailttcenterاین آدرس ایمیل توسط spambots حفاظت می شود. برای دیدن شما نیاز به جاوا اسکریپت دارید : آدرس ایمیل
- @zoodyab :آدرس تلگرام
مرکز تخصصی تلاش ترجمه از سال 1385 شروع به کار نموده است و تا کنون بیش از ده هزار ترجمه در رشته ها و زمینه های مختلف توسط متخصصین این مرکز انجام شده است.
تمامی ترجمههای انجام شده توسط موسسه تخصصی تلاش ترجمه، به صورت دستی (غیرماشینی) بوده و توسط مترجمین با سابقه انجام میشوند. ترجمههای انجام شده توسط موسسه تلاش ترجمه در قالب فایل Word و به صورت کاملا روان و بازخوانی شده و با ضمانت بازگشت وجه 72 ساعته (در صورت عدم رضایت از ترجمه) خدمت مشتریان محترم ارائه میشود.