تست ImageNet، همان بازی تشخیص اشیا در تصاویر، یکی از دلایل قویتر بودن انسانها و هوش انسانی نسبت به هوش کامپیوتری بوده است. برای اینکه به حقیقت این حرف پی ببرید کافی است که یکبار با فتوشاپ کار کرده باشید و بخواهید که قسمتی از تصویر که یک شی خاص است را برش دهید. اما حالا گویی این دوران هم قرار است به پایان برسد. با آریامونز همراه باشید.
بنابر گفته محققان ضریب خطای انسان در تست ImageNet برابر با 5.1 درصد است و انسان با این ضریب خطا میتواند اشیا موجود در تصویر را شناسایی کند و طبقهبندی آنها را به درستی انجام دهد. اما حال ردموندیها مدعی شدهاند که موفق به توسعه اولین سیستم کامپیوتریای شده اند که ضریت خطایی برابر 4.9 درصد دارد و این یعنی اینکه ما از کامپیوترها شکست خوردهایم. :-?
شاید برایتان جالب باشد در مورد تاریخچه اخیر رقابت انسان و کامپیوتر در این چالش را بدانید: سال 2014 یک تیم از گوگل با ساخت سیستم یادگیری بسیار پیچیده توانستند درصد خطایی برابر 6.66 درصد را به ثبت برسانند. اما بعد از آن و تقریبا همین یک ماه پیش کمپانی چینی Baidu یک ابر کامپیوتر مبتنی بر معماری انحصاری خودش را توسعه داده بود که میتوانست این چالش را با ضریب خطای 5.98 درصد پشت سر بگذارد. اما حال ردموندیها علاوه بر گوگل و Baidu، بلکه انسانها را نیز شکست دادهاند البته دقت داشته باشید که فقط در تست ImageNet :-)
مایکروسافت در گزارش خود گفته است:
نتایج به دست آمده از این سیستم برای اولین بار موفق شده است که انسان را در یک چالش شناخت تصویری شکست دهد. البته این سیستم و الگوریتم آن هنوز در شناسایی و طبقهبندی برخی موارد که برای انسانها اصلا هم دشوار نیست با خطا مواجه میگردد. نتایج مطلوببی که این الگوریتم داشته اصلا بدان معنا نیست که انسان در رقابت با تکنولوژی شناخت تصیویری از کامپیوتر شکست خورده است. ما فقط در بعضی زمینهها توانی برابر انسان به دست آوردهایم و این میتواند پتانسیل ماشینها را در این زمینه به ما نشان دهد.
یکی از محققین مایکروسافت برای درک بیشتر این موضوع و اینکه کامپیوترها در چه زمنیهای از انسانها پیشی گرفتهاند پست جالبی را به زبان ساده روی وبلاگ خود قرار داده است که میگوید:
انسانها قادرند به راحتی در یک تصویر، گاو را از گوسفند تشخیص دهند اما کامپیوترها در انجام این کار مشکلی اساسی دارند و در موارد زیادی آن را به درستی انجام نمی دهند. ولی کامپیوترها قادرند در یک عکس از یک گله گوسفند، نژاد گوسفندهای آن را به درستی حدس بزنند و در این زمینه میتوانند انسان را شکست دهند چراکه کامپیوتر می تواند جزئیاتی مانند بافت ها، شکل ها و… را به سادگی در تصاویر شناسایی کرده و بر اساس آنها مواردی را تشخیص دهد که برای انسان بسیار دشوار و حتی در برخی مواقع غیر ممکن است.”
بدون شک نتایج این تحقیقات بر روی آینده نرمافزارهای ویرایش عکس و تصویر تاثیر خواهد گذاشت. نظر شما چیست؟