سیستم تشخیص گفتار جدیدی با دقت ۹۷ درصد توسعه یافت
اصولاً یادگیری ماشینی به کمک سیستمهای تشخیص گفتار می آید و موجب میشود که چنین مکانیزم هایی با تجزیه لایههای صدای انسان و تقلید جزء به جزء با استفاده از الگوریتمهای ریاضی بتوانند عملکرد مناسبی ...
اصولاً یادگیری ماشینی به کمک سیستمهای تشخیص گفتار می آید و موجب میشود که چنین مکانیزم هایی با تجزیه لایههای صدای انسان و تقلید جزء به جزء با استفاده از الگوریتمهای ریاضی بتوانند عملکرد مناسبی از خود بر جای بگذارند.
البته باید در نظر داشت که چنین سیستمی به سرورهای قدرتمندی نیاز دارد که بتواند حجم عظیمی از پردازش را انجام دهد تا نتایج دقیقی بدست آورد. حال پژوهشگران دانشگاه واترلو کانادا و استارتاپ DarwinAI مدعی شدهاند که استراتژی جالبی برای طراحی شبکههای تشخیص گفتار توسعه داده که نه تنها دقت فوق العادهای در تشخیص صدای افراد و کلمات مختلف دارد، بلکه به علت استفاده از مدلها پردازشی قدیمی و ضعیف میتوان آن را روی تلفنهای هوشمند اقتصادی نیز اجرا نمود.
این محققان مدعی شده اند که متد آنها بر اساس تلاشهای تیم یادگیری ماشینی دیگر بوده است که می توان به این ۳ تیم اشاره نمود؛
۱- تیم یادگیری آلکسای آمازون موفق به طراحی سیستمی شده که میتواند بدون اتصال به سخت افزاری قوی، جهت دهی، کنترل دما و پخش موسیقی را پردازش نماید.
۲- کوالکام نیز اردیبهشت ماه مدعی شد که سیستم تشخیص گفتارش اکنون میتواند با دقت ۹۵ درصدی فعالیت خود را به انجام رساند.
۳- استارتاپ ایرلندی Voysis در شهریور ماه، یک مدل تشخیص صدای آفلاین طراحی کرده که میتواند روی تلفنهای هوشمند اجرا شود.
حال پژوهشگران سیستم جدیدی بر اساس یادگیری ماشینی طراحی کنند که سه ویژگی مکانیزیم تیمهای قبلی را با یکدیگر ترکیب کرده و عملکرد فوق العادهی از خود بر جای میگذارد. بدین ترتیب سیستم جدید هم میتواند روی یک سخت افزار ضعیفتر اجرا شود، با دقت ۹۵ درصدی به تشخیص گفتار انسان بپردازد و نیازی به اتصال اینترنتی نداشته باشد.
این تیم در ابتدا سعی کرد تا یک نمونهی اولیهای برای تشخیص گفتار بر اساس لغت واژگان محدودی تهیه کند و پس از آن گسترهی سیستم خود را کم کم افزایش دهد.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.