سیستم تشخیص گفتار جدیدی با دقت ۹۷ درصد توسعه یافت

سیستم تشخیص گفتار جدیدی با دقت ۹۷ درصد توسعه یافت

سیستم تشخیص گفتار جدیدی با دقت ۹۷ درصد توسعه یافت

اصولاً یادگیری ماشینی به کمک سیستم‌های تشخیص گفتار می آید و موجب می‌شود که چنین مکانیزم‌ هایی با تجزیه لایه‌های صدای انسان و تقلید جزء به جزء با استفاده از الگوریتم‌های ریاضی بتوانند عملکرد مناسبی از خود بر جای بگذارند.

البته باید در نظر داشت که چنین سیستمی به سرور‌های قدرتمندی نیاز دارد که بتواند حجم عظیمی از پردازش را انجام دهد تا نتایج دقیقی بدست آورد. حال پژوهشگران دانشگاه واترلو کانادا و استارتاپ DarwinAI مدعی شده‌اند که استراتژی جالبی برای طراحی شبکه‌های تشخیص گفتار توسعه داده که نه تنها دقت فوق العاده‌ای در تشخیص صدای افراد و کلمات مختلف دارد، بلکه به علت استفاده از مدل‌ها پردازشی قدیمی و ضعیف می‌توان آن را روی تلفنهای هوشمند اقتصادی نیز اجرا نمود.

این محققان مدعی شده اند که متد آنها بر اساس تلاش‌های تیم یادگیری ماشینی دیگر بوده است که می توان به این ۳ تیم اشاره نمود؛

۱- تیم یادگیری آلکسای آمازون موفق به طراحی سیستمی شده که می‌تواند بدون اتصال به سخت افزاری قوی، جهت دهی، کنترل دما و پخش موسیقی را پردازش نماید.

۲- کوالکام نیز اردیبهشت ماه مدعی شد که سیستم تشخیص گفتارش اکنون می‌تواند با دقت ۹۵ درصدی فعالیت خود را به انجام رساند.

۳- استارتاپ ایرلندی Voysis در شهریور ماه، یک مدل تشخیص صدای آفلاین طراحی کرده که می‌تواند روی تلفن‌های هوشمند اجرا شود.

حال پژوهشگران سیستم جدیدی بر اساس یادگیری ماشینی طراحی کنند که سه ویژگی‌ مکانیزیم تیم‌های قبلی را با یکدیگر ترکیب کرده و عملکرد فوق العاده‌ی از خود بر جای می‌گذارد. بدین ترتیب سیستم جدید هم می‌تواند روی یک سخت افزار ضعیفتر اجرا شود، با دقت ۹۵ درصدی به تشخیص گفتار انسان بپردازد و نیازی به اتصال اینترنتی نداشته باشد.

این تیم در ابتدا سعی کرد تا یک نمونه‌ی اولیه‌ای برای تشخیص گفتار بر اساس  لغت واژگان محدودی تهیه کند و پس از آن گستره‌ی سیستم خود را کم کم افزایش دهد.

نظرات ۰

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود

Digiato

رمزتان را گم کرده‌اید؟ ورود با گوگل

Digiato

ورود با گوگل