
این فناوری هدفون جدید میتواند صدای چند سخنگو را بهطور سهبعدی کلون و ترجمه کند
این هدفون میتواند صدای افراد را سهبعدی و همزمان کلون و ترجمه کند.
محققان آمریکایی سیستم هدفون پیشرفتهای ساختهاند که ضمن حفظ جهت و خصوصیت صدای افراد میتواند صدای چند سخنگو را همزمان ترجمه کند.
این سیستم که محققان دانشگاه واشنگتن آن را ساختهاند، «ترجمه گفتار فضایی» (Spatial) نام گرفته و با استفاده از هدفونهای نویز کنسینگ موجود در بازار همراه چند میکروفون ساخته شده است. الگوریتمهایی که تیم تحقیقاتی برای این هدفون توسعه دادهاند، میتواند سخنگوهای مختلف را در فضا تفکیک و سخنان ترجمهشده آنها را با تأخیری ۲ تا ۴ ثانیهای پخش کند.
این سیستم فعلاً فقط از موضوعات عمومی پشتیبانی میکند

«شیم گولاکوتا»، نویسنده ارشد این مقاله تحقیقاتی و استاد دانشکده علوم و مهندسی کامپیوتر پل جی آلن دانشگاه واشنگتن، دراینباره گفت سایر فناوریهای ترجمه بر پایه این فرض ساخته شدهاند که فقط یک نفر درحال صحبت است اما در دنیای واقعی نمیتوانید فقط یک صدای رباتیک داشته باشید که برای چندین نفر حاضر در اتاق صحبت کند.
گولاکوتا گفت تیم تحقیقاتی آنها اولین بار صدای هر فرد را با حفظ ویژگیهای منحصربهفردش و جهتی که از آن میآید، حفظ کردهاند. همچنین وقتی سخنگویان سر خود را تکان میدهند، این سیستم همچنان جهت و ویژگیهای صدای آنها را دنبال میکند.
به گفته پژوهشگران، این سیستم ۳ نوآوری اساسی دارد؛ اولین آنها این است که بهمحض فعال شدن، تشخیص میدهد چند نفر در فضای داخلی یا خارجی حضور دارند. محققان میگویند سیستم توسعه داده شده شبیه رادار عمل میکند و با اسکن ۳۶۰ درجه، تعداد افراد حاضر در محیط را پیوسته تشخیص میدهد.
تیم پژوهشی تأکید کرد این سیستم پس از شناسایی گفتار، آن را ترجمه میکند و درعینحال ویژگیهای بیانی و بلندی صدای هر گوینده را موقع اجرا روی دستگاهی مانند گوشیهای هوشمند حفظ میکند. بااینحال، تیم توسعهدهنده بهدلیل نگرانیهای مربوط به حریم خصوصی و شبیهسازی صدا، از استفاده از رایانش ابری خودداری کرده است. به گفته محققان، عملکرد این هدفون در آزمایشهایی که در ۱۰ محیط داخلی و خارجی انجام شده، موفق بوده است.
نتایج این پژوهش مدتی قبل منتشر شده است.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.