کامپیوترهای سخنگو؛ بزرگ ترین کمپانی های حوزه فناوری چه برای ارائه دارند
در شش ماه گذشته، تمامی کمپانی های بزرگ حوزه تکنولوژی، از نوع نگاه شان به آینده فناوری سخن گفتند. و جالب است که همه شان یک حرف مشترک دارند: در آینده، ما قرار است با ...
در شش ماه گذشته، تمامی کمپانی های بزرگ حوزه تکنولوژی، از نوع نگاه شان به آینده فناوری سخن گفتند. و جالب است که همه شان یک حرف مشترک دارند: در آینده، ما قرار است با کامپیوترهای مان صحبت کنیم و آن ها هم قرار است به ما پاسخ دهند.
مایکروسافت به این اتفاق «مکالمه به عنوان یک پلتفرم» می گوید و گوگل می خواهد کامپیوترها با کاربران «دیالوگ دو طرفه» داشته باشند. هر دوی این ادعا به نوعی هم استعاره هستند و هم نیستند. دستیارهای دیجیتال که ما با آن ها صحبت می کنیم مثل سیری، الکسا و کورتانا، بسیار عادی شده اند اما ساختن کامپیوترهایی که جواب ما را می دهند، معنایی فراتر دارد: استفاده از یادگیری ماشینی برای ارائه پیشنهاد به کاربران.
مارک زاکربرگ می گوید: «هدف ما با واقعیت مجازی ساخت سیستم هایی است که در درک کردن بهتر از انسان ها هستند.»
زبان کلید اصلی خواهد بود. صحبت کردن با کامپیوترها چندین دهه است که سوژه داستان های علمی-تخیلی بوده است اما فقط چند سال است که به شکلی واقعی قادر شده ایم با آن ها صحبت کنیم. پیشرفت در هوش مصنوعی (به خصوص یادگیری عمیق) به شدت پردازش زبانی را ارتقا بخشیده در حالی که ترکیب کلود و اسمارت فون هایی که حالا از همیشه قدرتمند تر شده اند، زیرساختی مناسب برای دستیارهای سخنگو ایجاد کرده.
اگر می خواهید بدانید که صحبت کردن با کامپیوترها چقدر همه گیر شده، این را در نظر داشته باشید که دومینوز پیتزا (رستوران زنجیره ای آمریکایی) سال ها است که از دستیاری صوتی به نام Dom برای ثبت سفارش ها استفاده می کند. مدیر بخش بازاریابی دومینوز می گوید که او با مزه است ولی فقط روی تجربه ثبت سفارش پیتزا تمرکز دارد.
تمرکز Dom روی ثبت سفارش پیتزا نیز بیانگر یک ویژگی کلیدی دنیای کامپیوترهای سخنگوی امروزی است: آن ها به شدت گیج کننده اند.
همه جور ابزار و فناوری مکمل و اساسی توسط کمپانی های مختلف توید می شود اما با ظهور الگوهای پردازشی جدید (چه دسکتاب، وب یا موبایل)، هیچ طرح مشترک یا استراتژی بزرگی وجود ندارد. فقط یادگیری ماشینی و خیال پردازی انسانی است که تکه های جذابی از یک پازل ناکامل را می سازند. 20 سال آینده چگونه قرار است همه این ها کنار هم جمع شوند را کسی نمی داند. دست کم می توانیم نگاهی به امروز داشته باشیم.
به مدل جدید مکالمات انسان و ماشین سلام کنید
بنابراین، مهم ترین بازیکنان در این دنیای جدید دستیارهای صوتی هستند: سیری، الکسا، کورتانا، فیسبوک اِم، دستیار گوگل و بسیاری دیگر از هوش مصنوعی های تولید شده توسط شرکت های شخص ثالث. به گفته سازندگان شان، این ها خانواده کامپیوتری ما هستند، برنامه هایی که بیشتر زمان مان را با آن ها سپری می کنیم.
روی پلتفرم های مختلف (تلفن، ساعت، ماشین، هاب های خانگی و...) در دسترس هستند اما حواس شان به تمامی داده های شخصی ما، قرارهای ملاقات و... در سراسر شبکه هست. و به لطف یادگیری ماشینی، حالا بهتر از هر زمان و کامپیوتر دیگری می توانند حرف انسان ها را بفهمند، ضرب المثل ها و اصطلاحات عامیانه را متوجه شده و احساسات و مقاصد را درک کنند.
دستیارهایی این چنینی به ما پردازش محیطی ارائه می دهند. ما لزوما از طریق یه نمایشگر یا کنسول به آن ها دسترسی نداریم. در عوض معلق در هوا هستند، فقط صحبت می کنند و پاسخ می گیرند. اما پیش از این که دستیارها را همه جا داشته باشیم، باید در مناطقی خاص به آن ها دسترسی داشته باشیم. آمازون با اکو، دات و تپ وارد خانه ها شد در حالی که اپل و گوگل چند-پلتفرمی هستند: در دسترس روی تلفن، درون ماشین و روی مچ دست. رویکرد مایکروسافت و فیسبوک تعریف واضحی مثل سه شرکت نام برده ندارد اما باز هم، جایگاه بسیاری برای گسترش فعالیت وجود دارد.
و بات ها و اپلیکیشن ها فضای بین حوزه تاثیرگذاری دستیارها را پر می کنند. آن ها بسیار ساده تر از سیری و بسیار سودمندتر هستند. در حالت پایه، آن ها فقط یک جایگزین برای رابط های کاربری گرافیکی هستند، جایی که شما در یک باکس ساده درخواست تان را تایپ می کنید. برخی اوضاع شان کمی بهتر است (آیا واقعا لازم است که یک بات برای شما بلیت سینما بخرد؟) اما مدل های پیچیده تر، پتانسیل های بیشتری هم دارند (مثل چت بات در Slack یا جیمیل که می تواند همه اسناد ارسالی توسط یک شخص خاص را طی ماه گذشته پیدا کند).
در ماه مارس، مایکروسافت مجموعه ابزار هوش مصنوعی محوری را معرفی کرد که به کاربران اجازه می دهد، هوش مصنوعی خودشان را بسازند و در آوریل، فیسبوک بات ها را به مسنجر آورد. مارک زاکربرگ گفت «دیگر لازم نیست به 1-800-FLOWERS زنگ بزنید» در حالی که ساتیا نادلا چت بات ها را «اپلیکیشن های جدید» توصیف کرد.
نادلا گفت که در آینده، دستیارهای شخصی مثل کورتانا و الکسا همانند رئیس همه بات ها عمل خواهند کرد و با دیگران از سوی کاربر ارتباط می گیرند. با این حال، تعریف وی بسیار خلاصه و ساده انگارانه است، در صورتی که واقعیت بسیار پیچیده تر خواهد بود. دستیارها به همان طریقی با بات ها صحبت خواهند کرد که با API ها صحبت می کنند؟ چگونه همه این برنامه های متنوع به صورت امن داده کاربران را رد و بدل می کنند؟ چه نرم افزاری قرار است اصطلاحات به کار رفته در نوشته شما با دوستان تان را جمع آوری کرده و به خورد برنامه ای دهد که ایمیل های کاری تان را می نویسد؟ و چگونه به آن می گویید که کار خود را متوقف کند؟ عجیب و مشکل به نظر می رسد ولی تا به اینجا چنین می دانیم:
آمازون
الکسای آمازون تبدیل به یک بنچمارک برای تمام دستیارهای دیجیتالی داخل خانه شده است. در حالی که عملکرد اولین اکو تقریبا فقط به اجرای موسیقی با فرمان صوتی محدود بود اما توانایی های الکسا با سرعت پیشرفت کرد. الکسا حالا با بیش از هزار سرویس مشترکا کار می کند و آمازون می گوید کمپانی ها برای آنکه خود را با آن هماهنگ کنند فقط به 60 دقیقه زمان نیازمند هستند.
اکو عالی عمل کرده چون اصول پایه را به درستی رعایت می کند. الکسا به سرعت پاسخ می دهد و ورودی شما را درک می کند، حتی اگر با آن فاصله زیادی داشته باشید. آمازون حالا با عرضه اکو دات (که با هر اسپیکری کار می کند)، حضور آن را قوت بیشتری می بخشد و اجازه می دهد تا کمپانی های دیگر سخت افزارهای الکسا محور خودشان را بسازند.
و در حالی که تقریبا به موفقیت خود دست یافته، الکسا به اندازه دیگر دستیارها باهوش نیست. اطلاعات شخصی اندکی دارد و برای اتصال به یکی از سرویس های متصل آن، شما باید کلمه کلیدی درست را بدانید. جف بزوس، مدیرعامل آمازون می گوید که کمپانی اش عمیقا به هوش مصنوعی تعهد دارد و بیش از هزار نفر در حال کار روی الکسا هستند. حتی گزارش هایی رسیده که نشان می دهد الکسا در آینده قرار است هوش احساسی داشته باشد و در هر وضعیتی، حال شما را تشخیص دهد.
اپل
علی رغم پیشتاز بودن شان در حوزه رابط صوتی، اپل حالا از همه عقب افتاده. سیری به خوبی شناخته شده است اما قدرت تشخیص صدایش بسیار ضعیف و عملکردش بسیار محدود است. در WWDC امسال، اپل چندین تغییر امید بخش را اعلام کرد: حضور سیری در macOS و اجازه دادن به سرویس های شخص ثالث برای برقراری ارتباط با آن. تا پیش از این، سیری یکی از پتانسیل هایی بود که قدرتش حیف و میل شده بود.
سوال بزرگ این است که آیا رویکرد اپل در ترکیب اپلیکیشن هایش با هوش مصنوعی (یا همان سیری) آیا موفق تر از ساخت بات های معمولی خواهد بود؟ اپل در گذشته با اپلیکیشن ها شاهکار کرده، آیا چنین چیزی در آینده هم رخ می دهد؟
به لطف CarPlay، اپل واچ و آیفون، دستیار شخصی اپل پتانسیل آن را دارد که همراهی همیشگی باشد اما در حال حاضر، هنوز درگیر یکپارچه سازی تمام چیزهایی است که در مورد شما می داند.
با این حال، اگرچه سیری به کامپیوترهای Mac آمده، ولی ویژگی های جدیدی ندارد که در خانه جدید از آن ها استفاده کند. و در سوی دیگر شایعات اسپیکر سیری (رقیبی برای اکو) نیز شنیده می شود که هنوز رنگ واقعیت به خود نگرفته اند. لازم به ذکر است که همین حالا هم می توان در خانه از طریق HomeKit با سیری صحبت کرد.
اپل قادر است تا یکی از بزرگ ترین نقاط ضعف خود را در این حوزه به بازویی قدرتمند تبدیل کند. پیشرفت در توسعه هوش مصنوعی توسط این شرکت به سبب دفاع آن ها از حریم شخصی بسیار محدود بوده است. اپل به اندازه کافی اطلاعات از کاربران خود دریافت نمی کند (حداقل به اندازه ای که رقبا این کار را انجام می دهند). بنابراین اطلاعات کمتری دارد که در اختیار سیری قرار دهد.
باز هم اما در WWDC، کوپرتینویی ها تغییری به این شیوه جمع آوری اطلاعات دادند و متود جدیدی معرفی کردند که ادعا دارند حریم خصوصی کاربر را به خطر نمی اندازد. برای کسانی که به حریم شخصی اهمیت می دهند و در کنارش دستیارهای هوشمند را هم می خواهند، رویکرد اپل ممکن است در طولانی مدت جوابگو باشد، البته اگر آنطور که اپل ادعا می کند باشند.
فیسبوک
حضور فیسبوک در حوزه کامپیوترهای سخنگو احتمالا از همه محدودتر است. شما فقط می توانید با تایپ کردن و نوشتن خواسته های تان با Facebook M ارتباط برقرار کنید. هنوز هیچ رابط صوتی وجود ندارد که با آن به صورت کلامی سخن گفته و پاسخ بشنوید. حتی فیسبوک اِم ممکن است چند دقیقه شما را معطل پاسخ نگه دارد.
فیسبوک اما قدرت های خاص خود را دارد. تیم یادگیری ماشینی آن ها کار فوق العاده ای در زمینه تشخیص تصاویر انجام داده اند و همچنین اپلیکیشن مسنجر هم به تنهایی یک قدرت بزرگ است. با مسنجر، فیسبوک می تواند صدها میلیون مکامله را بخواند و خوراک هوش مصنوعی اش کند. اما در حال حاضر، بات های فیسبوک بسیار کند هستند، هیچ کس ربات های کند را دوست ندارد، خصوصا حالا که گوگل هم می تواند تمام کارهای شان را انجام دهد.
گوگل
صحبت از گوگل شد، آن ها قدرتمند ترین موتور جستجوی اینترنتی را دارند و به همین سبب بیشترین پتانسیل برای ساخت یک کامپیوتر سخنگو هم در اختیارشان است. در Google IO که ماه مه برگزار شد، کمپانی از Google Home پرده برداشت (رقیبی برای اکو) و نشان داد که چطور فناوری دستیار هوشمندش به تار و پود دیگر محصولات نظیر Allo تنیده می شود.
در مقایسه با دیگر کمپانی ها، گوگل جایگاه بسیار ویژه ای برای متخصصین یادگیری ماشینی در نظر گرفته و طی یک سال گذشته، تلاش بسیاری جهت خلق اکوسیستمی برای ابزارهای هوش مصنوعی خود کرد. در نوامبر گذشته، نرم افزار یادگیری ماشینی Tensor Flow، متن باز شد و به ارائه دوره های رایگان درسی پرداخت.
امسال، مشخص شد پردازنده دستکاری شده شان برای یادگیری ماشینی، که در پیروزی AlphaGo در برابر قهرمان جهانی بازی Go چه موفقیت هایی می تواند کسب کند.
همه این ها نشان می دهد که گوگل می تواند به هر سویی که می خواهد در این حوزه پیش رود. بگذارید فقط یکی از آن ها را در نظر بگیریم، برای مثال Google Springboard، ابزاری برای کسب و کارهای سازمانی که این ماه رونمایی شد. تمرکز اولیه آن روی جستجو خواهد بود اما گوگل می گوید Springboard می تواند در ارائه اطلاعات و پیشنهادهای قابل اجرا و به درد بخور نیز به کار آید.
مایکروسافت
مایکروسافت اما حالا کورتانا را در اختیار دارد. از میان تمامی دستیارهای دیجیتالی موجود، کورتانا از همه بهتر روی کامپیوترها عمل کرده است. مایکروسافت ضعف بالایی در حوزه موبایل دارد اما اول از همه کورتانا روی موبایل عرضه شد. روی ویندوز 10، کورتانا می تواند قرارهای ملاقات را مرتب و منظم و ساعت ها و روزهای خاصی را هم یادآور کند، به سوالات واقعی بدون باز کردن مرورگر پاسخ دهد و حتی ایمیلی ارسال کند. مایکروسافت حتی می خواهد کورتانا را با اکس باکس وان به تلویزیون ها بیاورد.
و از میان تمامی کمپانی ها، مایکروسافت بزرگ ترین گام را در جهت چت بات ها بر می دارد. در کنفرانس توسعه دهندگان بیلد که ماه مارس برگزار شد، مایکروسافت از Bot Framework پرده برداشت، بسته ای از ابزارهای هوش مصنوعی محور که به هر کسی اجازه می دهد تا چت بات مخصوص خودش را بسازد. مثل آن می ماند که مایکروسافت در معدن طلا شروع به فروختن کلنگ کند. اما ساتیا نادلا قانع کننده ترین نگاه به آینده کامپیوترهای سخنگو را با عبارت «مکالمه به عنوان یک پلتفرم» ارائه داد.
باقی شرکت ها
و در کنار این بازیکنان بزرگ، کمپانی های کوچک با همان رویای بزرگ وجود دارند که فعالیت های خود را به جد پی می گیرند. از جمله آن ها می توان به Hound ،Amy و Viv (که توسط توسعه دهندگان اسبق سیری ساخته شده).
بات های ساده تری نظیر Howdy هم هستند که درون Slack کار می کند و قرار است با مرتب کردن میتینگ ها و سفارش غذا، روز کاری تان را ساده تر سازند. یک سری بات و ابزار دیگر مانند Charfuel ،Msg.ai ،Luka و... نیز هستند.
چالش بزرگ برای این کمپانی ها، به خصوص آن هایی که در حال ساخت دستیار خودشان هستند، شناخته شدن است. بازیگران بزرگ این حوزه پلتفرم های خودشان را دارند اما کمپانی های کوچک تر باید ویژگی های منحصر به فردی داشته باشند تا کاربران به استفاده از آن ترغیب شوند خصوصا حالا که دو پلتفرم اپل و گوگل به خوبی با همه پلتفرم های مان عجین شده اند.
بنابراین، در آینده این شرکت ها چه ارائه می دهند؟ کدام یک را شما استفاده خواهید کرد؟
در نهایت چه خواهد شد؟
احتمالا درگیری بزرگی رخ می دهد.
با وجود کمپانی های بسیاری که تلاش می کنند کامپیوترهای سخنگو را به پیش رانند، ابهامات بسیاری در نتیجه این آشوب بین پلتفرم ها رخ خواهد داد. از طرفی، بسیاری از تکنولوژی ها هم آنقدر خوب نیستند (به خصوص چت بات ها) و شاید هیچ گاه هم قدرت پیدا نکنند که منجر به از بین رفتن سرمایه و اعتماد کاربر خواهد شد.
همچنین، مشکلات بسیاری پیرامون امنیت اطلاعات وجود دارد. دستیارهای شخصی لازم است که اطلاعات بسیاری راجع به شما داشته باشند تا کارآمد شوند و بسیاری از ما مخالف نفوذ کمپانی ها به درون زندگی مان هستیم. مشکلات عملی بسیاری وجود دارد، نظیر اینکه چه کسی دوست دارد با یک کامپیوتر صحبت کند، وقتی که غریبه ها مشغول گوش کردن هستند؟ شاید در خانه و ماشین بخواهید این کار را انجام دهید اما در محیط باز دفتر کار چطور؟ دستیارهای صوتی باید آنقدر باهوش باشند که به شما اطلاعات چکیده را در این شرایط ارائه دهند.
لازم به ذکر است که دستیارهای سخنگو الان بیشتر از آنکه واقعیت باشند، یک تمایل عمومی و همگانی هستند. چون کمپانی ها با به روزترین تکنولوژی و دانش بشری دست به تولید این محصولات می زنند، به نحوی نمایش داده می شود که بهتر از این نیست اما قرار نیست این ها به کار آیند و فقط یک سری محصول تجاری برای پول درآوردن هستند. هنوز بسیاری از کمپانی ها نمی دانند که چه چیزی درست است.
با توجه به اینکه دیده ایم طی دهه های گذشته محصولات مشتری محور چگونه پیشرفت کرده اند، صحبت کردن با کامپیوترها در نهایت نقطه پایانی منطقی و طبیعی به نظر می رسد. به محض اینکه دستیارهای هوشمند در مکان های بیشتری دیده شوند، به مرتب کردن امور کاری کمک کنند، مراقب خانه باشند یا سرگرم تا کنند، رابط هایی که لازم است با آن ها سر و کله بزنید کم و کمتر می شوند و فقط صداها باقی می ماند. در آن زمان، صحبت کردن با کامپیوترها بسیار ساده تر خواهد بود.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.