گوگل برای تقویت سیستم تشخیص گفتار از کاربران Reddit کمک می گیرد

امروزه قابلیت تشخیص صدا نقش مهمی در فناوری های مختلف، از جمله دستیارهای صوتی همچون Siri و Google Now ایفا می کند. با این حال، تمام این تکنولوژی ها با یکی از پایه ای ترین ...

نوشته شده توسط حمید مقدسی | ۲۸ مرداد ۱۳۹۵ | ۰۱:۰۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

تازه‌های تکنولوژی

ویدئوی مرتبط

تک‌تاک تک‌تاک اپیزود ۸۱؛ گوگل پولی می‌شود، یک ممنوعیت دیگر و محدودیت سوخت‌گیری

امروزه قابلیت تشخیص صدا نقش مهمی در فناوری های مختلف، از جمله دستیارهای صوتی همچون Siri و Google Now ایفا می کند. با این حال، تمام این تکنولوژی ها با یکی از پایه ای ترین ویژگی های گفتار انسان یعنی «لهجه» مشکل دارند و نمی توانند گفتار لهجه دار را به خوبی درک نمایند.

یکی از راه های رفع این مشکل و بهبود قابلیت تشخیص گفتار، جمع آوری داده های بیشتر است و کمپانی هایی همچون گوگل با یکپارچه کردن نرم افزارها و سخت افزارهایشان مدت هاست که این روند را آغاز کرده اند.

در همین رابطه ظاهراً ساکنین مانتن ویو کمپانی ثالثی با نام Appen را برای جمع آوری انواع نمونه های صوتی با لهجه های مختلف از کاربران اینترنت به کار گرفته اند.

طبق اخبار منتشر شده، کمپانی Appen در تعدادی از انجمن های reddit از کاربران خواسته تا نمونه های صوتی برخی فرامین معتبر در سیستم عامل اندروید را ضبط کرده و در ازای تحویل آنها دستمزد دریافت نمایند، به گونه ای که هر کاربر می تواند در ازای تحویل 2000 نمونه صوتی مبلغ 35 دلار درآمد کسب کند.

گفتنی است افزودن داده های مربوط به لهجه های متعدد زبان انگلیسی، گامی بزرگ در جهت پیشبرد قابلیت تشخیص گفتار به شمار می آید. خوشبختانه سخت ترین قسمت ماجرا نیز همین مرحله جمع آوری نمونه های صوتی است، و پس از آن سیستم های یادگیری ماشینی به راحتی می توانند آنها را تجزیه و تحلیل نموده و به داده های معنادار دست یابند.

FastCompany

ردیت گوگل

اشتراک گذاری:

کپی لینک