جدیدترین اخبار و مقالات دنیای بازی و سینما در ویجیاتو

فیسبوک چگونه با استفاده از هوش مصنوعی تصاویر را برای نابینایان قابل درک می کند؟

ترور توماس، یک گردشگر حرفه ایست و همراه با سگ خود تنلی حدودا شش ماهی می شود که از مشهورترین نقاط دیدنی دنیا بازدید می کند و در حین سفر شگفت انگیزش هم عکس ها و ویدئوهایی بی نظیر از مناظر دیدنی این کشور را برای طرفداران خود در شبکه های اجتماعی به اشتراک می گذارد.

اما تنها یک نکته در رابطه با این فرد وجود دارد که قابل تامل است: او نابیناست.

خودش می گوید: زمانی که برای نخستین بار حرف از فیسبوک نقل محافل شد، برای من که نابینا بودم درک آن غیرممکن بود. با خود گفتم: چرا باید از این شبکه استفاده کنم. من که نمی توانم عکس ها را ببینم. اما حالا تنها چیزی که نمی دانم این است: بدون فیسبوک باید چه کار می کردم؟

در ادامه این مطلب با دیجیاتو همراه باشید.

بسیاری از شرکت های اینترنتی با سطوح و درجات مختلفی از موفقیت این امکان را برای نابینایان فراهم کرده اند تا با دیگر سرویس ها تعامل داشته باشند که البته این کار نیز عموما با تبدیل نمودن متن به کلام برای این افراد صورت می پذیرد که از آنها تحت عنوان اسکرین ریدرها یا خوانندگان صفحه یاد می شود.

چهار سال پیش، فیسبوک طرحی به نام Accessibility یا دسترسی را راه اندازی کرد که سرپرستی آن را جف ویلند بر عهده داشت. در این مدت، تیم تحت سرپرستی او روی روش هایی برای بهبود سودمندی فیسبوک برای افراد نابینا، ناشنوا و آنهایی کار کرد که از دیگر ناتوانی هایی جسمی رنج می برند.

زمانی که حرف از کار کردن افراد نابینا با فیسبوک به میان می آید، اصلی ترین مساله ترجمه منوها و ساختار دکمه ای این شبکه اجتماعی برای چنین افرادی خواهد بود.

ویلند می گوید: تصمیم ما این است که در تمامی کارهای خود، دسترسی این افراد را مد نظر قرار دهیم. ما همکاری نزدیکی نیز با تیم زیرساخت خود داشتیم تا مطمئن شویم که [اجزا و قسمت های اصلی شامل منوها، دکمه ها و لینک ها] با در نظر داشتن دسترسی افراد نابینا طراحی شده اند.

فیسبوک تحت تسلط محتوی بصری

Lexus-Facebook-Page-600x485

زمانی که فیسبوک نخستین بار در سال 2004 میلادی معرفی شد، بیشتر به اشترک گذاری اطلاعات متنی اختصاص داشت. طی این سال ها اما شبکه یاد شده به بزرگ ترین مجموعه عکس دنیا بدل شد و بخش اعظمی از فیدهای خبری 1.5 میلیارد جمعیت کاربری این سایت حالا مملو از انواع عکس و ویدئو است. تا همین اواخر اما افراد نابینا و حتی با مهارت ترین آنها هیچ استفاده ای از این شبکه اجتماعی نمی بردند.

حالا فیسبوک شروع کرده به استفاده از هوش مصنوعی تا از این طریق تجربه کاربران نابینای خود را بهبود ببخشد و برای این منظور الگوریتم هایی را طراحی کرده است که به صورت خودکار برخی عکس ها و ویدئوها را به کلمات شفاهی تفسیر می کنند و در نتیجه امکان درک محتویی را برای کاربران نابینا فراهم می کند که تا پیش از آن غیر ممکن بود.

برای نمونه، با وجود آنکه یک فرد معمولی هیچگونه مشکلی برای درک اثر فوق العاده غروب آفتاب در خلیج سانفرانسیسکو ندارد یک فرد نابینا بدون در اختیار داشتن اطلاعات و محتوی اضافه هیچ درک درستی از آن تصویر پیدا نمی کند.

اما به لطف تکنولوژی هوش مصنوعی فیسبوک، این افراد حالا می توانند بگویند که به عنوان مثال تصویر در برگیرنده طبیعت، فضای باز، ابر، چمن، افق، گیاه یا یک درخت است.

3052194-inline-s-3-facebook-for-the-blind

نمونه دیگر تصویر زوجی است که همراه با کودک خود بیرون از رستورانی در کالیفرنیا ایستاده اند و درست در پشت آنها نیز یک آسیاب بادی مشهور قرار دارد. سیستم هوش مصنوعی فیسبوک چنین محتوایی را برای این عکس پیشنهاد می دهد: این عکس ممکن است شامل سه انسان باشد که لبخندی بر لب دارند و در یک فضای باز ایستاده اند.

این تعبیرها قطعا کل داستان را برای ما تعریف نمی کنند اما بدون کمک یا مداخله انسانی دیگر برخی از نقاط خالی ذهن افراد نابینا را پر می کنند و از نظر توماس یا مت کینگ، نخستین مهندس نابینای فیسسبوک و یکی از اعضای تیم Accessibility این قابلیت می تواند دنیایی تفاوت ایجاد کند.

توماس که ویدئوی اخیرش در فیسبوک به ماجراجویی های اخیرش در مسیر آپالاچی مربوط می شود، در این رابطه می گوید: برای مدت های طولانی، اگر مطلبی در این شبکه اجتماعی به اشتراک گذاشته می شد، فیسبوک کاری برای من و امثال من انجام نمی داد تا از آن محتوی سر در بیاوریم.

او ادامه می دهد: حالا اما اگر کسی مطلب یا محتویی را در این سایت به اشتراک بگذارد تنها کاری که باید انجام دهم این است که روی آن کلیک کنم تا تصویر را برای من شرح دهد. این امکان بسیار نیروبخش است و دیگر نیازی نیست که از دیگران بخواهم آنچه برایم ارسال شده را توضیح دهند.

کینگ قطعا به عنوان یکی از کارکنان فیسبوک روی چنین امکانی تعصب دارد و آن را در نوع خود بهترین می داند اما به عنوان یک کاربر نابینای این شبکه اجتماعی و همچنین از اعضای کنسرسیوم جهانی وب دوست دارد که این تجربه بهبود پیدا کند و باید بگوییم که به خاطر کاربرد هوش مصنوعی در طرح accessibility بارها و بارها مورد تقدیر و ستایش قرار گرفته است.

کینگ می گوید: هوش مصنوعی لذت تماشای تصاویر را برای افراد نابینا از صفر به دست کم نصف میزان کلی افزایش داد و به تعبیر خودش برای تعامل او از طریق روش هایی که تا پیش از این با آنها کاری نداشت کفایت می کند.

دریچه ای برای نابینایان

3052194-inline-i-1-facebook-for-the-blind

اگر تا به حال حرف های مارک زاکربرگ در مورد ماموریت این شرکت (یعنی متصل کردن کل دنیا به هم) را شنیده اید، باید بگوییم که به کار گیری هوش مصنوعی برای ارائه سرویس این شبکه به نابینایان و دیگر افراد معلول و کم توان قطعا یکی از گام های مهم برای عملیاتی کردن این ایده است.

گینگ می گوید، اگر دسترسی را برای 20 درصد از جمعیت کره زمین فراهم نکنید، این ایده یعنی متصل کردن کل دنیا به هم عملیاتی نمی شود. این بیست درصد بیش از یک میلیارد نفر از کل مردم دنیا را تشکیل می دهند و این مساله دقیقا مخالف ماموریت و استراتژی کلی ماست. اینکه این دسته از کاربران را به کلی نادیده بگیریم اشتباهی بسیار بزرگ است.

کینگ بعد از دو دهه کار کردن در IBM در ماه ژوئن به فیسیبوک پیوست و اخیرا در سمت مدیر ارشد فنی پروژه IT Accessibility مشغول به کار است و بهتر از هر فرد دیگری می داند که ناتوانی تا چه اندازه می تواند باعث انزوای افراد و گوشه گیری آنها در جامعه شود.

تردیدی نیست که فیسبوک و دیگر شرکت های اینترنتی نیز از بهبود سرویس هایشان برای نابینایان منتفع خواهند شد چراکه در این صورت بر تعداد کاربران آنها اضافه می گردد و این مساله درآمدهای کلی شان را نیز به میزان چشم گیری بالا می برد. از همین رو ویلند تایید می کند که اهداف کلی تیم تحت سرپرستی اش صرفا بشردوستانه نیست و مسائل مالی را هم شامل می شود. هرچند که این مساله از دیدگاه کینگ اهمیتی ندارد.

او می گوید: تصور نمی کنم کسی بگوید که نخستین عامل محرک ما کسب و کار یا نوع دوستی بوده است. چراکه اصلی ترین هدف ما هوشمند سازی هرچه بیشتر و متصل کردن بخش های مختلف دنیا به یکدیگر است و عملیاتی سازی این ماموریت بدون ایجاد دسترسی برای نابینایان و افراد کم توان میسر نخواهد شد. یا اگر بخواهم به شکل دیگری بگویم، نمی توان بدون فراهم کردن دسترسی همه افراد این امر را محقق کرد.

خروج از انزوا

3052194-inline-i-2-how-facebook-is-using-ai-to-help-bring-photos-to-life-for-the-blind

به گفته جاشوآ میل، مدیر مرکز توسعه و تحقیق توضیحات ویدئویی، ایجاد دسترسی برای این گروه از کاربران با موانعی همراه است. او می گوید برخی امکانات و قابلیت های کوچک هستند که یا نمی توان از آنها استفاده کرد یا اینکه کاربردشان بیش از اندازه دشوار است، همان جیزهایی که رفتاری غیر منتظره و پیش بینی نشده دارند و اگر بخواهیم ساده بگوییم نمی توان آنها را به افراد نابینا انتقال داد. این مساله به مراتب از به کار گیری هوش مصنوعی و برچسب گذاری عکس ها و ویدئوها دشوارتر است.

ویلند که از او درباره نگرانی های میل راجع به ثبات قابلیت های دسترسی به فیسبوک سوال شد پاسخ داد که این شرکت مرتبا در تلاش است تا تجربه کاربران نابینای خود را بهبود ببخشد و در همین راستا طیف گسترده ای از امکانات را در اختیار آنها قرار داده که از آن جمله می توان به تیترهای معنایی و شورتکات های صفحه کلید برای کاربران اپل و ویندوز اشاره نمود.

ویلند می گوید: ما می دانیم که تعامل و تجربه کاربری کاربرانمان به اندازه ای که باید ساده نیست و هنوز هم با مشکلاتی روبروست و به همین منظور یک نقشه راه را ترسیم کرده ایم تا سطح یکسانی از لذت کاربری را برای تمامی افرادی که دوست دارند از محصولاتمان بهره مند شوند ایجاد نماییم.

میل که در یک حادثه دردناک در زمان کودکی اش نابینا شد، بر این باور است که قدرت واقعی فیسبوک در قابلیت های اجتماعی و جامعه گسترده اش نهفته است و استدلالش این است که زیبایی تصویر کودکی که لبخند می زند هنوز هم که هنوز است با استفاده از تکنولوژی قابل انتقال نیست.

او باور دارد که فیسبوک با بهبود شیوه های افزودن توضیحات به تصاویر توسط کاربران، یا درخواست توضیحات و حتی راه اندازی گفتگو در مورد توضیحات تصاویر می تواند تجربه بهتری را برای کاربران نابینای خود به ارمغان بیاورد.

میل می گوید: آنچه ما در موردش صحبت می کنیم این است که از چنین شبکه اجتماعی برای ایجاد توضیحات مربوط به تصاویر و محتوی بصری بیشترین بهره را ببریم. قطعا هیچکسی دوست ندارد که یک سیستم خودکار توضیحاتی را برای این آثار هنری اجتماعی دریافت کند. در واقع هدف این است که مردم، مشتریان اجتماعی و دوستان مالک این رسانه، نظرات و توضیحاتشان را ارائه نمایند.

کینگ می گوید فیسبوک از اینکه کاربران بیشتری برای محتوی بصری خود یا دوستانشان توضیحات ارائه کنند استقبال می کند.

او ضمن اینکه هشدار می دهد نباید صرفا به یک راهکار برای این منظور متکی بود، می گوید: ما راهکارهای دیگری که این نوع خدمات را امکان پذیر می کند مورد بررسی قرار داده ایم.

او ادامه می دهد: چنین رویکردهایی با وجود آنکه سودمند هستند، اما محدودیت هایی هم در مورد نحوه کاربردشان وجود دارد و مشخص نیست که چطور می توانند دسترسی افراد نابینا برای کاربران شبکه بزرگی با مقیاس فیسبوک را فراهم نمایند.

3052194-inline-i-1-how-facebook-is-using-ai-to-help-bring-photos-to-life-for-the-blind

کینگ اضافه می کند، تکنولوژی هوش مصنوعی که می تواند به صورت خودکار توضیحاتی را به عکس و محتوی بصری اضافه نماید با آنکه در این مرحله کامل نیست به نقطه ای رسیده است که می تواند مکملی برای ابزارهای اجتماعی باشد و می توان آن را یکی از کلیدهای امیدوار کننده برای آینده ای خواند که در آن تمام محتواها کاملا برای افراد ناتوان قابل دسترس هستند.

توماس در ویدئوی اخیر خود اینطور می گوید که توانایی اشتراک گذاری فیلم و عکس و اظهار نظر در مورد آنها آن هم بدون درخواست کمک از دیگران تجربه ای به شدت لذت بخش  برایش بوده است.

او می گوید اگر فیسبوکی نبود و من هم طرفداران و دنبال کننده هایی نداشتم که محتواهایم را تماشا کنند شاید هیچگاه خود را در این سفرها به چالش نمی کشیدم.

مطالب مرتبط

طراحی لپ تاپ ها تا کجا باید به سوی باریک شدن پیش برود؟

لپ تاپ ها چهار دهه پیش و در سال ۱۹۸۱، چشم به این جهان گشودند. در آن زمان، این دسته از محصولات مورد استفاده افراد خاصی بودند اما حال، طرافدارانشان از کامپیوترهای دسکتاپ نیز بیشتر شده است؛ اگرچه کامپیوترهای خانگی معمولا از قدرت بالاتری برخوردارند، اما کاربران در هر صورت ترجیح می دهند از رایانه... ادامه مطلب

به نظر می رسد Galaxy S7 Sport به عنوان عضو جدیدی از این خانواده محصولات سامسونگ در راه باشد

مدتی از عرضه ی جدیدترین پرچمداران سامسونگ با نام های Galaxy S7 (بررسی دیجیاتو) و Galaxy S7 Edge (بررسی دیجیاتو) می گذرد و بر همین اساس کاربران حدس زدن در مورد نسخه های جانبی که قرار است مثل همیشه از پرچمداران تازه ساخته شود را آغاز کرده اند. این نسخه ی تازه می تواند Galaxy... ادامه مطلب

سامسونگ احتمالا قصد ادغام کهکشانی های سری S و Note را دارد

ظاهراً قرار است پس آزادی فرزند موسس کمپانی بزرگ سامسونگ شاهد اتفاقات بسیار مهمی در زیرشاخه موبایل این شرکت باشیم. اگر از معرفی قریب الوقوع نخستین موبایل تاشوی این شرکت بگذریم، به طور حتم بمب خبری بعدی این شرکت ادغام احتمالی دو سری از موبایل های پرچمدار کمپانی یعنی سری S و ‌Note خواهد بود. در تمام... ادامه مطلب

لنوو دو کامپیوتر جدید Yoga 900 Convertible و Yoga Home 900 را معرفی کرد

در سالیان گذشته اگر دانشجوی طراحی بودید، احتمال بالایی وجود داشت که مجبور باشید هر روز یک تبلت نه چندان ظریف مجهز به استایلوس USB را در کنار لپ تاپ ضخیم و سنگین همراه خود به کلاس ببرید. اکنون اما فناوری آنقدری پیشرفت کرده که سازندگان می توانند قابلیت های این دو محصول را در یک ابزار... ادامه مطلب

سرویس محتوای تلویزیونی فیسبوک احتمالاً در ماه آتی میلادی معرفی می شود

این موضوع بر هیچ کس پوشیده نیست که فیسبوک در تلاش است تا شانس خود را در صنعت تلویزیون هم محک بزند. حال بر اساس گزارشی که در وبسایت Business Insider منتشر شده، کمپانی مورد اشاره در ماه آینده میلادی برنامه هایش برای ورود به این حوزه را معرفی می کند. بر اساس گزارشات دریافتی از... ادامه مطلب

نوکیا مسئولیت تولید تلفن هوشمند جدیدش را به فاکسکان می سپارد [شایعه]

چند هفته پیش نوکیا به شکلی کاملاً غیر منتظره اعلام کرد قصد دارد در سال ۲۰۱۶ با ارائه ی محصولی تحت برند خودش رسماً به بازار تلفن های هوشمند بازگردد و مجدداً رقابت در این عرصه را تجربه نماید. کمپانی فنلاندی روزگاری سلطان بلامنازع دنیای موبایل محسوب می شد و بر حسب اینکه بسیاری از کاربران... ادامه مطلب

نظرات ۳

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود
x