توهمات دیداری فریب دادن شبکه های عصبی

توهمات دیداری فریب دادن شبکه های عصبی

توهمات دیداری فریب دادن شبکه های عصبی

توهمات دیداری فریب دادن شبکه های عصبی: محققان بر این باورند که با استفاده از توهمات دیداری فریب دادن شبکه های عصبی دقیقا مانند شیوه ای که انسان ها اغوا می شوند، امکان پذیر است. آیا شبکه های عصبی توهم بصری می بینند؟

این سوالی است که بسیاری از محققان را درگیر خود کرده و به دنبال پاسخ دادن به آن هستند. شبکه عصبی کانولوشن نوعی شبکه عصبی مصنوعی است که در آن سلولهای عصبی به صورت کاملاً مشابه با سلول های عصبی در قشر بینایی مغز بیولوژیکی در میدانهای پذیرایی سازمان یافته اند. این توهمات دیداری فریب شبکه های عصبی در بسیاری از فناوری هایی که خود تشخیص هستند استفاده می شوند.

 با توهمات دیداری فریب دادن شبکه های عصبی چگونه امکان پذیر است؟

شبکه های کانولوشنال از رفتار سیستم بینایی انسان الهام گرفته اند ، به ویژه ساختار اساسی آن که با اتصال واحدهای ترکیبی متشکل از یک عملیات خطی و به دنبال آن یک عملیات غیرخطی شکل گرفته است.

یک مطالعه منتشر شده در نسخه پیشرفته آنلاین مجله Vision Research ، پدیده توهمات بینایی در شبکه های کانولوشن را در مقایسه با تأثیر آنها بر بینایی انسان بررسی می کند.

مطالعه ای توسط الكساندر گومز ویلا ، آدریان مارتین ، خاویر واسكز-كورال و مارسلو برتالمیو ، اعضای گروه فناوری های اطلاعات و ارتباطات (DTIC) با مشاركت محقق ژسوس مالو از دانشگاه والنسیا صورت گرفته است. در این مطالعه ، نویسندگان CNN ها را برای کارهای ساده ای که با دید انسان نیز انجام می شود ، مانند خنثی سازی و رفع خط ، آموزش دادند.

آنچه مشاهده کردند این است که این CNN ها که تحت این شرایط آزمایشی آموزش دیده اند نیز توسط فریبندگی و توهمات بصری رنگی “فریب” می خورند ، دقیقا به همان روشی که توهمات بصری انسان را فریب می دهد.

گومز می کوید که برخی از این توهمات دیداری فریب دادن شبکه های عصبی و انسان ها متفاوت هستند. نتایج این مطالعه با فرضیه دیرینه سازگار است که توهمات بصری سطح پایین را به عنوان محصول جانبی بهینه سازی محیط های طبیعی (که انسان در زندگی روزمره خود می بیند) در نظر می گیرد.

در همین حال ، این نتایج محدودیت ها و تفاوت های بین سیستم بینایی انسان و توهمات دیداری فریب دادن شبکه های عصبی مصنوعی CNNs را برجسته می کند.

این مطالعه با استفاده از پنج توهم دیداری کلاسیک سیاه و سفید و همتا های رنگی آنها که به طور کلی 10 عدد بودند انجام شد و نشان داد که این توهمات دیداری  فریب دادن شبکه های عصبی را باعث شوند.

علاوه بر این ، با مطالعه توهمات CNN از طریق تجارب تطبیق رنگ نامتقارن که قبلاً توسط انسان انجام شده بود ، مقایسه کمی را ارائه داده شد. در این آزمایشات محققان به بررسی معماری ساده CNN (با 2 یا 4 لایه پنهان) آموزش داده شده برای خنثی سازی تصاویر ، رفع اشکال و ترمیم تصاویر پرداختند.

و همچنین رفتار CNN اخیر و بسیار عمیق تری را که برای همان نوع کار آموزش دیده است مورد مطالعه قرار داده اند: معماری 17 لایه ژانگ و همکاران که برای آبراهه سازی آموزش دیده اند.

تجزیه و تحلیل کیفی نشان می دهد که شبکه های ساده تر در اکثر موارد پاسخ خود را در همان جهت انسان تغییر می دهند. با این حال ، شبکه 17 لایه منجر به توهمات ناچیز می شود (تغییرات ناچیز در پاسخ). از سوی دیگر ، نتایج کمی در مورد تطبیق نامتقارن (تنظیم ساده محیط اطراف) نشان می دهد که توهمات در شبکه ها با 4 لایه پنهان ، همان مرتبه اندازه انسانها است.

با این حال ، رنگ های درک شده بیش از کنتراست از جذب برخوردار هستند (در مقابل انسان). جذب در تنظیمات مرکز فراگیر نیز رفتار شبکه های لایه 2 پنهان است اگرچه با یک توهم ضعیف تر.

سرانجام ، شبکه 17 لایه در آزمایش جفت مربوطه به طور مداوم با تغییرات ناچیز موجود در پاسخ توهم تقریبا ناچیزی را نشان می دهد. بنابراین ، تجزیه و تحلیل کمی نشان می دهد که شبکه های ساده در تنظیمات مرکز اطراف توهمات اساسی دارند ، اما شبیه انسان نیستند.

در نتیجه توهمات دیداری  فریب دادن شبکه های عصبی همانند انسان ها نیست.

با ویرا سگال کارو همراه باشید
  • برگشت به مقالات
ارسال نظر

آدرس ایمیل شما منتشر نخواهد شد.

برچسب ها