زیبایی شناسی رباتیک؛ کمک عکاسان حرفه‌ای به طراحان هوش مصنوعی دوربین گوگل کلیپس

زیبایی شناسی رباتیک؛ کمک عکاسان حرفه‌ای به طراحان هوش مصنوعی دوربین گوگل کلیپس

مهرماه امسال گوگل در مراسم ویژه‌ای دوربین جدید «گوگل کلیپس» (Google Clips) را معرفی کرد که با بهره مندی از هوش مصنوعی، امکان ضبط تصاویر ویژه چند ثانیه‌ای بدون صدا به نام «Motion Photos» یا تصاویر متحرک را فراهم می‌کرد. حال ساکنین مانتین ویو اعلام کردند‌ برای طراحی هوش مصنوعی این گجت ناچار به کمک گرفتن از عکاسان حرفه‌ای شدند.

اخیراً شرکت گوگل با انتشار مطلبی در بلاگ رسمی خود، روند تولید و طراحی هوش مصنوعی گوگل کلیپس را تشریح کرده و توضیح می‌دهد که این گجت چگونه بهترین لحظات کاربران و خانواده‌هایشان را تشخیص داده و نشان می‌دهد که گوگل به چه روشی کلیپ‌هایش را می‌گیرد!

یک عکاس هنری،یک فیلمساز مستند و یک عکاس خبری به گوگل کمک کرده‌اند

مهندسان این شرکت برای تولید محتوای تصویری جهت تغذیه و تمرین شبکه‌‌ی عصبی دوربین یاد شده مجبور شدند که یک فیلمساز مستند، یک عکاس خبری و یک هنرمند که در حوزه‌‌ی عکاسی هنرهای زیبا فعالیت می‌کرد، استخدام کنند.

آنها با تولید محتوای تصویری سعی کردند که به این هوش مصنوعی قابلیت تشخیص جزییات را داده و پروسه عکاسی اتوماتیک را بدین روش ایجاد کنند چرا که نرم‌افزار برای اینکه قادر باشد یک عکس خوب را از یک تصویر بد متمایز کند باید مثال‌های زیادی در اختیارش قرار گرفته باشد تا بتواند آنها را بررسی کرده و یاد بگیرد.

بدین روش هوش مصنوعی توانایی انتخاب تصاویر تار یا تاریک را داشته و سعی می‌کند زمانی که شیئی جلوی لنز را گرفته چیزی ضبط نکند.

مثالی از نمونه های نامطلوب فیلم برداری برای هوش مصنوعی گوگل کلیپس

برنامه نویسان نه تنها مثال‌های آشکار مناسب نبودن عکس‌ها را مدنظر قرارداده‌اند بلکه تلاش کرده‌اند شاخص‌های انتزاعی نظیر زمان ضبط تصاویر را نیز در نظر بگیرند.

هوش مصنوعی هیچ‌گاه نمی‌تواند ارزش لحظات را درک کند

گوگل در انتهای بلاگ خود اعتراف کرده که تمرین دادن یک هوش مصنوعی این چنینی نمی‌تواند روند بی نقص و بدون اشتباهی باشد چرا که هوش مصنوعی توانایی تشخیص کامل تصاویر با ارزش را نخواهد داشت. شاید با بررسی محتوا و تمرین بتواند قاب صحیحی بسته، درست فوکوس گرفته و روشنایی عکس‌ها را تأمین کند اما مشخصاً قادر نیست اهمیت و ارزش اولین دوچرخه‌سواری فرزند شما را درک کرده و با فیلم‌برداری محتوایی هرچند تاریک و مبهم، خاطره‌ای مهمی برای شما به ارمغان بیاورد.

این کمپانی در‌این‌باره می‌گوید:

«در محبث پیاده‌ سازی زیبایی شناسی انسانی و شخصی، بی نقص بودن ممکن نیست و نمی‌توان آن را به عنوان هدف اصلی تعیین نمود. بر خلاف برنامه‌های سنتی، زبان برنامه نویسی Meta Language (فوق زبان) نمی‌تواند بدون اشکال باشد چرا که پیش بینی، ذاتاً علم نامعلومی است.»

سازندگان این گجت با کمک عکاسان حرفه‌ای کوشیده‌اند توانایی انتخاب درست را به هوش مصنوعی داده و رابط کاربری را تا حد ممکن منطقی طراحی کنند. البته هنوز این دوربین ۲۵۰ دلاری عرضه نشده و باید دید در رسیدن به هدف‌های جاه‌طلبانه‌ی ساکنین مونتین ویو چقدر مطلوب عمل خواهد کرد.

نظرات ۱

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود

Digiato

رمزتان را گم کرده‌اید؟

Digiato