مایکروسافت نوعی تکنولوژی تبدیل کلام به متن نظیر کورتانا را برای توسعه دهندگان ارائه کرده است

روز گذشته مایکروسافت خبر داد که نسخه پیش نمایش خصوصی از سرویس تشخیص هوشمند بهینه خود موسوم به CRIS (برگرفته از سرواژه های Custom Recognition Intelligence Service ) را ارائه کرده که ابزاری با قابلیت شخصی سازی بالاست و می تواند کارکردی هم سطح با سیری را در زمینه تبدیل کلام به متن به اپلیکیشن ها بیافزاید.

روز گذشته همچنین، این شرکت مستقر در ردموند نسخه های پیش نمایش عمومی برای دو API دیگر را ارائه کرد که به واسطه بهره گیری از نوعی تکنولوژی پیشرفته اش قابلیت تشخیص هویت فردی که در یک فایل صوتی صحبت می کند و آنچه در فایل های ویدئویی نمایش داده می شود را در اختیار توسعه دهندگان قرار می دهد.

در ادامه این مطلب با دیجیاتو همراه باشید.

همه این تکنولوژی ها در قالب پروژه ای تخت عنوان آکسفورد ارائه خواهند شد؛ طرحی که به توسعه دهندگان شخص ثالث امکان می دهد به هوش مصنوعی توسعه یافته توسط مایکروسافت دسترسی پیدا کنند. گفتنی است که گوگل هم با ارائه Cloud Vision API قصد دارد مسیری مشابه را طی کند.

ماه گذشته نیز مایکروسافت نوعی ابزار تشخیص احساسات را در قالب همین پروژه معرفی کرد و اعلام داشت که نسخه بتای عمومی تکنولوژی تشخیص گوینده آن تا پایان سال ارائه می گردد.

حالا براساس خبری که از سوی رایان گالگن مدیر ارشد واحد تحقیقات و تکنولوژی های مایکروسافت منتشر شده، این نسخه بتا آماده است و APIهای کلامی آن می توانند گوینده ها را تشخیص داده و تایید کنند و APIهای ویدئویی نیز می توانند چهره ها را دنبال نموده، احساسات را در پس زمینه های ثابت تشخیص دهند و محتواهای ویدئویی را تثبیت نمایند.

اما جالب ترین ابزار ارائه شده CRIS است که در این بخش توجه شما را به توضیحات ارائه شده از سوی مایکروسافت در رابطه با آن جلب می کنیم:

این ابزار بهینه سازی شده، تشخیص کلام در محیط های چالش برانگیز نظیر اماکن عمومی پر سر و صدا را راحت تر می کند. برای نمونه، شرکت ها می توانند از طریق آن امکانی را برای افراد و گروه ها فراهم آورند که همزمان با فعالیت در یک فروشگاه پرسر و صدا و مراکز خرید پرازادحام از ابزارهای تشخیص کلام نیز بهترین و بیشترین بهره را ببرند. از طریق این ابزار همچنین می توان اپلیکیشن هایی را ارائه کرد که بهتر می توانند صحبت های کاربرانشان را درک کنند و مشکلات سابق برای تشخیص کلام افراد غیر بومی یا افراد دارای معلولیت را نخواهند داشت.

پس از آنکه توسعه دهندگان برای استفاده از این سرویس ثبت نام کردند، مایکروسافت از آنها سوال می کند که آیا با تکنولوژی های تبدیل کلام به متن نظیر HTK، Kaldi و SRILM آشنایی دارند یا اینکه صرفا کاربر نرم افزارهای دیجیتالی شخصی نظیر موارد ارائه شده توسط گوگل، اپل یا خود مایکروسافت هستند.

آنطور که گالگن در صحبت های خود مطرح کرده: در سال های اخیر، پیشرفت های عظیمی در عملکرد سیستم های تشخیص کلام رخ داده و حالا توسعه دهندگان می توانند از تکنولوژی هایی که به لطف زحمات مایکروسافت در این حوزه ارائه شده، بهره بگیرند.

مطالب مرتبط

بیل گیتس: خرید تیک ‌تاک توسط مایکروسافت جام زهر است

مایکروسافت و توییتر به دنبال تصاحب بخشی از فعالیت‌های تیک تاک هستند و اخیرا هم‌بنیانگذار غول نرم افزار آمریکایی، بیل گیتس قرارداد میان این شرکت و پلتفرم اشتراک ویدیو را جام زهر توصیف کرده است.بیل گیتس اخیرا در مصاحبه‌ای با Wired، به این موضوع اشاره کرده که فروش بخشی از تیک تاک به مایکروسافت آسان... ادامه مطلب

انتقاد مایکروسافت از اپل به خاطر عدم انتشار xCloud در اپ استور: تبعیض قائل می‌شوید

سرویس استریم بازی xCloud که مایکروسافت ماه آینده آن را منتشر می‌کند، به خاطر محدودیت‌های اپ استور در دسترس کاربران آیفون و آیپد قرار نمی‌گیرد.سرویس Xbox Game Pass و قابلیت xCloud آن به کاربران اجازه استریم صدها بازی روی گوشی را می‌دهد. حال اپل می‌گوید چون امکان بررسی تمام بازی‌های موجود در Game Pass وجود... ادامه مطلب

چرا مایکروسافت به دنبال خرید تیک‌تاک است؟

تلاش مایکروسافت برای تصاحب تیک‌تاک در نگاه اولی کمی عجیب به نظر می‌رسد. ردموندی‌ها در این سال‌ها نه تنها به سرویس‌های کاربر محور چندان تمایلی نداشته‌اند، بلکه از خیر بعضی از آنها مثل سرویس استریم موسیقی «گروو موزیک»، لوازم جانبی «کینکت»، گجت مایکروسافت بند، ویندوز فون و سرویس «میکسر» گذشته است. این شرکت در عوض... ادامه مطلب

سهم‌خواهی ترامپ از خرید تیک‌تاک توسط مایکروسافت: یا بفروشید یا تحریم شوید

دونالد ترامپ که چند روز پیش به خبرنگاران از ممنوعیت استفاده از تیک تاک در ایالات متحده آمریکا گفته بود، هم اکنون می‌خواهد بخشی از هزینه قرارداد مایکروسافت و بایت دنس در اختیار دولت قرار بگیرد.تیک تاک توسط شرکت چینی «بایت دنس» مدیریت می‌شود و همین موضوع نگرانی‌های زیادی در میان مقامات آمریکایی در پی... ادامه مطلب

سلطه کروم بر بازار مرورگرها؛ مایکروسافت اج جدید هرروز محبوب‌تر از قبل می‌شود

مایکروسافت با معرفی نسل جدید مرورگر اج (Edge) مبتنی بر موتور کرومیوم توانسته نظر مخاطبین زیادی را به خودش جلب کند و در فاصله‌ای کوتاه فایرفاکس را کنار بزند. حالا شواهد حاکی از آن هستند که اج موفق شده جایگاه خودش را به عنوان دومین مرورگر محبوب دسکتاپی تثبیت کند، و در عین حال فایرفاکس... ادامه مطلب

مایکروسافت از تصاحب تیک تاک تا قبل از ۲۵ شهریور خبر می‌دهد

مایکروسافت گزارشاتی که در مورد خرید تیک تاک توسط این شرکت منتشر شده‌اند را تأیید کرد و از مذاکره با ByteDance (مالک تیک تاک) خبر داد.مایکروسافت با انتشار بیانیه‌ای مطبوعاتی اعلام کرد که ساتیا نادلا، مدیرعامل این شرکت در مورد خرید تیک تاک با دونالد ترامپ صحبت کرده و قصد دارد قرارداد تصاحب این شبکه... ادامه مطلب

نظرات ۰

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود

رمزتان را گم کرده‌اید؟