چکیده:
در این مقاله مروری، سعی ما بر آن است که اصول بازشناسی اشیاء و نحوه ی انجام آن توسط سیستم بینایی بیولوژیکی (زیستی) را به اختصار بیان کنیم؛ که این مورد یکی از اهداف رایانه و هوش مصنوعی[1] نیز می باشد. در همین حال نگاهی به تئوریها و مدلهای محاسباتی بازشناسی اشیاء خواهیم داشت که در آنها ایده اصلی به نوعی از سیستم بینایی گرفته شده است یا به عبارتی دیگر از مدلها و تئوریهایی که از نگاه بیولوژیکی، قابل باور هستند.
کلمات کلیدی:
بازشناسی اشیاء؛ سیستم بینایی بیولوژیک تئوریها؛ مدلها؛
1 معرفی
بینایی کامپیوتر[2]، به خوبی می تواند نمونه های محدودی از بازشناسی اشیاء را، هم دسته بندی[3] و هم شناسایی[4] کند. در عین حال سیستمی که قادر به دسته بندی اقسام اشیاء در تصاویر پیچیده باشد و هم چنین بتواند تصاویری همانند چهره انسان را در سطحی برابر با توانایی بشر، در شرایط مختلف نور و زاویه دید بازشناسی کند، قادر به گذراندن تست «Turing» برای بینایی می باشد. جای تعجب نیست که آن چنان سیستم منعطف و جامعی هنوز موضوع چشم انداز علم است. باز شناسی اشیاء، در بالاترین نقطه سلسله مراتب اعمال بینایی قرار دارد و در حالت کلی یک مسئله محاسباتی پیچیده است، که نقش مهمی در ساختار نهایی ماشین های هوشمند خواهد داشت. بدون اغراق، این مسئله موضوع پیچیده تر و بدون جوابی برای علوم اعصاب شناختی نیز می باشد.
شناسایی و دسته بندی دو عمل مهم در بازشناسی هستند. کدام یک از عمل آسانتر و انجام آن در اولویت است؟ جواب این سؤال در علوم اعصاب شناختی متفاوت از پاسخ آن در بینایی کامپیوتر است. معمولاً تکنیک های بینایی کامپیوتر شناسایی را بسیار آسانتر دریافتند همچنان که کمپانی های بسیاری، سیستم های شناسایی چهره را به راحتی می فروشند ولی امر دسته بندی را تقریباً غیر ممکن می داند. حال آنکه روانشناسان و علوم اعصاب شناسان این داستان را بر عکس بیان می کنند: بدین صورت که در سیستم های بینایی بیولوژیک، طی پروسه بازشناسی، دسته بندی به نظر مرحله ای ساده تر و مقدم تر
نسبت به شناسایی به شمار می رود.
تئوری های بازشناسی اشیاء، بر یک پدیده مشترک تحت عنوان بازنمایی[5] استوارند. باور عمومی بر این است که، یک بازنمایی خوب، منجر به بازشناسی کامل می شود و دیگر امور مربوط به بینایی را نیز تسریع می کند. برای حل مسئله بازنمایی نوعی تطابق بین مجموعه اشیاء بیرونی و اجزاء داخلی باید در نظر گرفته شود.
در میان مدلهای بیولوژیکی بازشناسی اشیاء، تفاوت اصلی بین سیستم های پیشرو [6] و فیدبک [7] و بین سیستم های «object - centered» و «view - centered» است. تمرکز این مقاله بازنگری، بر روی مدلهای پیشرو «view - centered» است، که با شواهد نورو بیولوژیکی سازگاری بیشتری دارند. بخش 2 و 3 پیش زمینه ای برای سیستم های بینایی بیولوژیکی و بازنمایی های ممکن برای اجسام خارجی در یک سیستم بازشناسی را ارائه می دهد. بخش 4 سه نوع مختلف تئوری های بازشناسی اشیاء بررسی می کند. بخش 5 مدلهای بازشناسی اشیاء، مبتنی بر تئوریهای ذکر شده را شرح می دهد و بخش 6 خلاصه ای از مقاله را ارائه می کند.
2 بازشناسی اشیاء در مغز:
سیستم بینایی انسان سلسله مراتب از نواحی چند گانه مغزی[8] است که محاسبات نورونی پیشرو بر روی سیگنالهای بینایی ورودی را انجام می دهند. در مراحل اولیه، قشرهای بینایی V1 و V2 عمل شناسایی خط و لبه را انجام می دهند. در مرحله بالاتر پردازش، ناحیه V4 ، اشکال تقریباً پیچیده را با اطلاعاتی درباره توضیحات ساختاری ویژگی های حاصل شده، بازنمایی می کنند. مرحله نهایی پردازش بینایی، «IT» یا قشر تحتانی می باشد که گمان می رود بازشناسی بینایی اشیاء را انجام می دهد.
3 بازنمایی:
بازنمایی و اهداف[9] آن به طور کلی می توانند دو دسته در نظر گرفته شوند. در نتیجه بازنمایی به یک نوع نگاشت تبدیل می شود. این نگاشت، تطابقی بین ویژگی های خارجی و دسته اجزاء داخلی می باشد؛ ولی این تطابق از کدام گونه از ارتباطات باید باشد؟
31 تناظر درجه اول و دوم:[10]
دو نوع نگاشت مختلف بین دامنه و برد بازنمایی ها وجود دارد. بهترین حالت، تطابق یک به یک (Isomorphism) است. یک حالت نا مطلوب اما
اجتناب ناپذیر، نگاشت چند به یک (Homomorphism) است. اجتناب ناپذیر است، زیرا از سیستم هایی با منابع محدود سر چشمه می گیرد که توانایی بازنمایی تمامی خواص محرک های فیزیکی را با دقیق ترین جزئیات ندارد. یک نکته مهم این است که، تناظر باید بین الف: یک شیء خاص و ب: بازنمایی های داخلی متقابل آن برقرار شود (روابط درجه اول). اما در روابط درجه دوم تناظر بین الف) روابط میان اشیاء خارجی و ب) روابط میان بازنمایی های خارجی متقابل آنها است. بنابراین، محققان به این نتیجه رسیده اند که تناظر درجه اول مانند بازنمایی به وسیله تشابه، در سیستم هایی با منابع محدود ما برای پیاده سازی مناسب نمی باشند. در همین راستا، تئوریسین ها تناظر را نه بین اجزاء خاص بلکه بین ساختارها بیان می کنند (تناظر درجه دوم) به طور خلاصه، در بازنمایی تناظر درجه دوم فقط روابط خاص بین اشیاء، نیاز به بازنمایی دارد؛ نه شکل ظاهری خود اشیاء