
هوش مصنوعی جدید گوگل برای رمزگشایی صدای دلفینها معرفی شد
این هوش مصنوعی به اندازهای کوچک است که محققان میتوانند آن را روی گوشی پیکسل خود اجرا کنند.

گوگل بهتازگی از مدل هوش مصنوعی متنباز DolphinGemma رونمایی کرد که هدف آن تسهیل رمزگشایی صدای کلیک و صوت دلفینهاست. این هوش مصنوعی به اندازه کافی کوچک است تا محققان بتوانند آن را روی گوشی پیکسل خود اجرا کنند. همچنین رونمایی این هوش مصنوعی مصادف با روز ملی دلفینها در آمریکا بوده است.
براساس اعلام گوگل، DolphinGemma یک مدل زبانی بزرگ است که به دانشمندان کمک میکند درباره چگونگی ارتباط با دلفینها تحقیق کنند تا شاید روزی متوجه شویم این جانوران باهوش چه میگویند. این مدل با مشارکت مؤسسه فناوری جورجیا و پروژه دلفین وحشی (WDP) ایجاد شده است و میتواند ساختار آوایی دلفینها را یاد بگیرد و صوتهای دلفینمانند تولید کند. مدل DolphinGemma با دادههای صوتی و تصویری تحقیقات گسترده درباره دلفینها آموزش دیده است؛ WDP این دادهها را از سال 1985 جمعآوری و برچسبگذاری کرده است.
هوش مصنوعی گوگل درباره رمزگشایی صدای دلفینها
گوگل میگوید با شناسایی الگوهای صوتی تکراری، خوشهها و توالیهای آوایی، این مدل میتواند به محققان کمک کند ساختارهای پنهان و معانی احتمالی را درباره دلفینها کشف کنند که قبلاً به تلاش انسانهای زیادی نیاز داشت.

مدل هوش مصنوعی گوگل تقریباً 400 میلیون پارامتر دارد و به اندازهای کوچک است که میتوان آن را روی گوشیهای پیکسل محققان اجرا کرد. این مدل صداهای دلفین را با توکنایزر SoundStream گوگل پردازش میکند و سپس برای تولید صدا در رشته آوایی صداها را پیشبینی میکند: دقیقاً مانند کاری که مدلهای زبانی بزرگ برای تولید جملات انسانها انجام میدهند. البته DolphinGemma بهتنهایی کار نمیکند. این مدل در کنار سیستم CHAT (تلهمتری تشدید شنوایی آببازسانان) عمل میکند تا بتواند کلیکها و آواهای معناداری تولید کند که دلفینها میشناسند.

درحالحاضر محققان در تحقیقات میدانی از گوشیهای پیکسل 6 برای تجزیهوتحلیل لحظهای صدای دلفینها استفاده میکنند. آنها قصد دارند برای فصل تحقیقاتی تابستان 2025 گوشیهای خود را به پیکسل 9 ارتقا دهند تا با بلندگو و میکروفون پیشرفتهتری مدلهای یادگیری عمیق و هوش مصنوعی را اجرا کنند.
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.