مایکروسافت نوعی تکنولوژی تبدیل کلام به متن نظیر کورتانا را برای توسعه دهندگان ارائه کرده است

روز گذشته مایکروسافت خبر داد که نسخه پیش نمایش خصوصی از سرویس تشخیص هوشمند بهینه خود موسوم به CRIS (برگرفته از سرواژه های Custom Recognition Intelligence Service ) را ارائه کرده که ابزاری با قابلیت شخصی سازی بالاست و می تواند کارکردی هم سطح با سیری را در زمینه تبدیل کلام به متن به اپلیکیشن ها بیافزاید.

روز گذشته همچنین، این شرکت مستقر در ردموند نسخه های پیش نمایش عمومی برای دو API دیگر را ارائه کرد که به واسطه بهره گیری از نوعی تکنولوژی پیشرفته اش قابلیت تشخیص هویت فردی که در یک فایل صوتی صحبت می کند و آنچه در فایل های ویدئویی نمایش داده می شود را در اختیار توسعه دهندگان قرار می دهد.

در ادامه این مطلب با دیجیاتو همراه باشید.

همه این تکنولوژی ها در قالب پروژه ای تخت عنوان آکسفورد ارائه خواهند شد؛ طرحی که به توسعه دهندگان شخص ثالث امکان می دهد به هوش مصنوعی توسعه یافته توسط مایکروسافت دسترسی پیدا کنند. گفتنی است که گوگل هم با ارائه Cloud Vision API قصد دارد مسیری مشابه را طی کند.

ماه گذشته نیز مایکروسافت نوعی ابزار تشخیص احساسات را در قالب همین پروژه معرفی کرد و اعلام داشت که نسخه بتای عمومی تکنولوژی تشخیص گوینده آن تا پایان سال ارائه می گردد.

حالا براساس خبری که از سوی رایان گالگن مدیر ارشد واحد تحقیقات و تکنولوژی های مایکروسافت منتشر شده، این نسخه بتا آماده است و APIهای کلامی آن می توانند گوینده ها را تشخیص داده و تایید کنند و APIهای ویدئویی نیز می توانند چهره ها را دنبال نموده، احساسات را در پس زمینه های ثابت تشخیص دهند و محتواهای ویدئویی را تثبیت نمایند.

اما جالب ترین ابزار ارائه شده CRIS است که در این بخش توجه شما را به توضیحات ارائه شده از سوی مایکروسافت در رابطه با آن جلب می کنیم:

این ابزار بهینه سازی شده، تشخیص کلام در محیط های چالش برانگیز نظیر اماکن عمومی پر سر و صدا را راحت تر می کند. برای نمونه، شرکت ها می توانند از طریق آن امکانی را برای افراد و گروه ها فراهم آورند که همزمان با فعالیت در یک فروشگاه پرسر و صدا و مراکز خرید پرازادحام از ابزارهای تشخیص کلام نیز بهترین و بیشترین بهره را ببرند. از طریق این ابزار همچنین می توان اپلیکیشن هایی را ارائه کرد که بهتر می توانند صحبت های کاربرانشان را درک کنند و مشکلات سابق برای تشخیص کلام افراد غیر بومی یا افراد دارای معلولیت را نخواهند داشت.

پس از آنکه توسعه دهندگان برای استفاده از این سرویس ثبت نام کردند، مایکروسافت از آنها سوال می کند که آیا با تکنولوژی های تبدیل کلام به متن نظیر HTK، Kaldi و SRILM آشنایی دارند یا اینکه صرفا کاربر نرم افزارهای دیجیتالی شخصی نظیر موارد ارائه شده توسط گوگل، اپل یا خود مایکروسافت هستند.

آنطور که گالگن در صحبت های خود مطرح کرده: در سال های اخیر، پیشرفت های عظیمی در عملکرد سیستم های تشخیص کلام رخ داده و حالا توسعه دهندگان می توانند از تکنولوژی هایی که به لطف زحمات مایکروسافت در این حوزه ارائه شده، بهره بگیرند.

hamrah-mechanic بلیط هواپیما

مطالب مرتبط

گیت‌هاب اکنون قادر به شناسایی زودهنگام حفره‌های امنیتی در کدهای کاربران است

گیت‌هاب، ابزار مدیریت پروژه‌های کدنویسی متعلق به مایکروسافت، اخیرا از قابلیتی رونمایی کرده که احتمالا به امنیت هرچه بیشتر نرم‌افزارهای موجود در آن منجر شود. این پلتفرم بعد از پشت سر گذاشتن ماه‌ها آزمون و خطا، حالا از یک سیستم اسکن کد رونمایی کرده که می‌تواند با بررسی کدهای نوشته شده برای نرم‌افزارها، رخنه‌های امنیتی... ادامه مطلب

مایکروسافت از سرفیس پرو X با پردازنده SQ2 مبتنی بر ARM رونمایی کرد

سرفیس پرو X با پردازنده SQ2 و سخت ‌افزار مطلوب جان تازه‌ای به ویندوز مبتنی بر ARM می‌بخشد. همانطور که انتظار داشتیم مایکروسافت امروز از نسخه جدید سرفیس پرو X با پردازنده SQ2 رونمایی کرد؛ تراشه‌ای مبتنی بر معماری ARM که در کنار مصرف بسیار پایین انرژی عملکرد را نیز تا حد زیادی بهبود می‌بخشد. چپیست SQ2 در واقع با همکاری کوالکام... ادامه مطلب

آپدیت جدید ویندوز ۱۰ پیش از خراب شدن حافظه به کاربر هشدار می‌دهد

آخرین به روز رسانی ویندوز  10 بیلد 20266 با ارائه قابلیتی جدیدی، زمان نزدیک شدن به پایان عمر SSD و خرابی احتمالی آن را به کاربران هشدار دهد. جدیدترین بتای ویندوز که در «Dev Channel» به دست تسترها رسیده شامل قابلیتی است که پیش از خراب شدن حافظه‌های SSD از نوع NVMe به کاربر هشدار می‌دهد. زمانی... ادامه مطلب

شبیه‌ساز جدید مایکروسافت اپ‌های بیشتری را به ویندوز مبتنی بر ARM می‌آورد

مایکروسافت در حال توسعه شبیه ساز x64 برای ویندوز مبتنی بر پردازنده ARM است که امکان اجرای اپ‌های ۶۴ بیتی در این پلتفرم‌ را میسر می‌کند. در حال حاضر، دستگاه‌‌های ویندوزی مبتنی بر این معماری مانند «سرفیس پرو ایکس»، تنها می‌توانند اپلیکیشن‌های 32 و 64 بیتی ARM را در کنار اپلیکیشن‌های 32 بیتی x86 اجرا کنند... ادامه مطلب

نخستین سرفیس 5G مایکروسافت احتمالا فردا معرفی می‌شود

«سرفیس Duo»  محصولی منحصر به فرد از سوی مایکروسافت بود اما حتی این دستگاه هم با بهره‌مندی از دو نمایشگر لمسی و قیمت قابل توجه 1400 دلاری از اتصال به شبکه 5G پشتیبانی نمی‌کند. مایکروسافت اما برای ورود به این حوزه خود را آماده کره و ظاهرا ردموندی‌ها فردا اولین عضو سازگار با 5G‌ سری... ادامه مطلب

اختلال در سیستم‌های اپل دسترسی کاربران به اپ استور و آیکلود را قطع کرد

بسیاری از سرویس‌های اپل دیشب با مشکل قطعی مواجه شدند که از میان آن‌ها می‌توان به اپل موزیک، اپ استور و اپل تی‌وی پلاس اشاره کرد. در حالی که بسیاری از سرویس‌های اپل با مشکل مواجه شدند، این کمپانی اعلام کرد که تنها روی برخی از کاربران تاثیر گذاشته است. با وجود چنین گفته‌ای، این غول... ادامه مطلب

نظرات ۰

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود

رمزتان را گم کرده‌اید؟