هوش مصنوعی شرکت دیپ مایند درحال یادگیری پارکور
شرکت دیپمایند deepminde که جزء زیرمجموعه هوش مصنوعی گوگل میباشد، با انتشار مقالهای با عنوان «پدیدار شدن رفتارهای حرکتی در محیطهای غنی» از تحقیقاتی در زمینهی چگونگی استفاده از یادگیری تقویتی (RL) در آموزش یک کامپیوتر برای مسیریابی در محیطهای پیچیده و غیر آشنا بیان کرد. این مورد از جمله زمینههای اساسی مطرح در هوش مصنوعی میباشد که در حال حاضر در محیطهای مجازی مورد آزمون قرار میگیرد؛ اما در آیندهای نزدیک منجر به ساخت رباتهایی خواهد شد که مسیر خود را از طریق راهپله تا منزل شخصی صاحبشان پیدا خواهند کرد.
تمام حرکتهایی که این ربات مجازی انجام میدهد، بهصورت اتوماتیک یادگرفته است. پرش، جهش و حرکت کردن از زیر موانع، تمام اینها حرکاتی میباشند که این سیستم بهتنهایی بهعنوان بهترین روش برای جابجایی از یک نقطه به نقطهی دیگر آموخته است. تمام کاری که برنامهنویسان دیپمایند انجام دادهاند، اتصال تعدادی سنسور مجازی به این ربات بوده است. سپس این ربات برای حرکت به جلو تشویق میشود. دیگر کارها توسط هوش مصنوعی صورت میگیرد که با آزمون و خطا، بهترین راه را برای حرکت پیدا میکند.
سیستمی که در این برنامه انجام شده، بدین صورت است که محققان توسط این آزمایش میتوانند بررسی نمایند که شرایط سخت چگونه میتواند به رفتار پیچیده و حرکات مشخص رباتها منجر گردد. بهطور معمول، یادگیری بواسطه تقویت و اصلاح رفتارهای پیشین میتواند منجر به حرکات غیر معمولی بشود که با تغییر جزئی شرایط، منجر به خطا و شکست شوند. مانند کودکی که نحوهی استفاده از پلهی معمولی خانه را میداند؛ اما در دفعات اول استفاده از پلهبرقی شکست میخورد. این آزمایش ثابت کرد که تحت این شرایط، یادگیری تقویت میتواند برای حرکات پیچیده بکار گرفته شود.