ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

گوگل برای تقویت سیستم تشخیص گفتار از کاربران Reddit کمک می گیرد

امروزه قابلیت تشخیص صدا نقش مهمی در فناوری های مختلف، از جمله دستیارهای صوتی همچون Siri و Google Now ایفا می کند. با این حال، تمام این تکنولوژی ها با یکی از پایه ای ترین ...

حمید مقدسی
نوشته شده توسط حمید مقدسی | ۲۸ مرداد ۱۳۹۵ | ۰۱:۰۰

امروزه قابلیت تشخیص صدا نقش مهمی در فناوری های مختلف، از جمله دستیارهای صوتی همچون Siri و Google Now ایفا می کند. با این حال، تمام این تکنولوژی ها با یکی از پایه ای ترین ویژگی های گفتار انسان یعنی «لهجه» مشکل دارند و نمی توانند گفتار لهجه دار را به خوبی درک نمایند.

یکی از راه های رفع این مشکل و بهبود قابلیت تشخیص گفتار، جمع آوری داده های بیشتر است و کمپانی هایی همچون گوگل با یکپارچه کردن نرم افزارها و سخت افزارهایشان مدت هاست که این روند را آغاز کرده اند.

در همین رابطه ظاهراً ساکنین مانتن ویو کمپانی ثالثی با نام Appen را برای جمع آوری انواع نمونه های صوتی با لهجه های مختلف از کاربران اینترنت به کار گرفته اند.

طبق اخبار منتشر شده، کمپانی Appen در تعدادی از انجمن های reddit از کاربران خواسته تا نمونه های صوتی برخی فرامین معتبر در سیستم عامل اندروید را ضبط کرده و در ازای تحویل آنها دستمزد دریافت نمایند، به گونه ای که هر کاربر می تواند در ازای تحویل 2000 نمونه صوتی مبلغ 35 دلار درآمد کسب کند.

گفتنی است افزودن داده های مربوط به لهجه های متعدد زبان انگلیسی، گامی بزرگ در جهت پیشبرد قابلیت تشخیص گفتار به شمار می آید. خوشبختانه سخت ترین قسمت ماجرا نیز همین مرحله جمع آوری نمونه های صوتی است، و پس از آن سیستم های یادگیری ماشینی به راحتی می توانند آنها را تجزیه و تحلیل نموده و به داده های معنادار دست یابند.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی