فناوری

هوش‌ مصنوعی شرکت دیپ مایند درحال یادگیری پارکور

شرکت دیپ‌مایند deepminde که جزء زیرمجموعه هوش مصنوعی گوگل می‌باشد، با انتشار مقاله‌ای با عنوان «پدیدار شدن رفتار‌های حرکتی در محیط‌های غنی» از تحقیقاتی در زمینه‌ی چگونگی استفاده از یاد‌گیری تقویتی (RL) در آموزش یک کامپیوتر برای مسیر‌یابی در محیط‌های پیچیده و غیر آشنا بیان کرد. این مورد از جمله زمینه‌های اساسی مطرح در هوش مصنوعی می‌باشد که در حال حاضر در محیط‌های مجازی مورد آزمون قرار می‌گیرد؛ اما در آینده‌ای نزدیک منجر به ساخت ربات‌هایی خواهد شد که مسیر خود را از طریق راه‌پله تا منزل شخصی صاحبشان پیدا خواهند کرد.

تمام حرکت‌هایی که این ربات مجازی انجام می‌دهد، به‌صورت اتوماتیک یادگرفته است. پرش، جهش و حرکت کردن از زیر موانع، تمام این‌ها حرکاتی می‌باشند که این سیستم به‌تنهایی به‌عنوان بهترین روش برای جابجایی از یک نقطه به نقطه‌ی دیگر آموخته است. تمام کاری که برنامه‌نویسان دیپ‌مایند انجام داده‌اند، اتصال تعدادی سنسور مجازی به این ربات بوده است. سپس این ربات برای حرکت به جلو تشویق می‌شود. دیگر کار‌ها توسط هوش مصنوعی صورت می‌گیرد که با آزمون و خطا، بهترین راه را برای حرکت پیدا می‌کند.

سیستمی که در این برنامه انجام‌ شده، بدین صورت است که محققان توسط این آزمایش می‌توانند بررسی نمایند که شرایط سخت چگونه می‌تواند به رفتار پیچیده و حرکات مشخص ربات‌ها منجر گردد. به‌طور معمول، یادگیری بواسطه تقویت و اصلاح رفتار‌های پیشین می‌تواند منجر به حرکات غیر معمولی بشود که با تغییر جزئی شرایط، منجر به خطا و شکست شوند. مانند کودکی که نحوه‌ی استفاده از پله‌ی معمولی خانه را می‌داند؛ اما در دفعات اول استفاده از پله‌برقی شکست می‌خورد. این آزمایش ثابت کرد که تحت این شرایط، یادگیری تقویت می‌تواند برای حرکات پیچیده بکار گرفته شود.

نمایش بیشتر

نوشته‌های مشابه

دکمه بازگشت به بالا