هرآنچه باید راجع به صدای Lossless، صدای High-Resolution و Spatial بدانید

هرآنچه باید راجع به صدای Lossless، صدای High-Resolution و Spatial بدانید

هرآنچه باید راجع به صدای Lossless، صدای High-Resolution و Spatial بدانید

کمپانی اپل اخیرا از گزینه صدای Lossless (بدون اتلاف) برای سرویس استریم موسیقی اپل موزیک رونمایی کرده. علاوه بر این، کمپانی مورد اشاره قرار است در کنار صدای بی‌اتلاف و رزولوشن بالا، صدای فراگیر را هم با انکود دالبی اتموس به دست مشتریان سرویس خود برساند. به این ترتیب اپل اکنون به کلوپ ارائه‌کنندگان صدای Lossless پیوسته، کلوپی که پیشتر میزبان تیدال، آمازون و دیزر بود. حتی اسپاتیفای هم که هنوز صدای بی‌اتلاف را به دست مشترکین خود نرسانده، با رونمایی از سرویس Spotify HiFi عملا زودتر از اپل دست به کار شد.

اپل اکنون صدای Lossless را روی پلتفرم خود عرضه کرده و به صورت اتوماتیک تبدیل به بزرگ‌ترین سرویس استریمی موسیقی جهان خواهد شد که چنین قابلیتی را در دسترس کاربران قرار می‌دهد. میلیون‌ها نفر در اقصی نقاط کره خاکی ناگهان به صدای Lossless دسترسی خواهند شد و نیازمند هیچ تلاش اضافه یا حتی پرداخت هزینه اضافه نخواهند بود.

بنابراین به سوالی مهم می‌رسیم: صدای Lossless چیست و چرا اصلا کسی باید به آن اهمیتی دهد؟ از سوی دیگر صدای رزولوشن بالا و دالبی اتموس چه معنایی دارند؟ زمانش رسیده که به این سوالات پاسخی واضح دهیم و برخی از افسانه‌های مربوط به تکنولوژی‌های مورد نظر را نیز از پیش رو برداریم.

قواعد بنیادین

صدایی که ما به طور معمول می‌شنویم، آنالوگ است. در گذشته، مدیایی که این صدا را برای ما توزیع می‌کرد هم آنالوگ بود. کاست‌های صدا و وینیل‌ها دو مثال برجسته از مدیای آنالوگ هستند. کاست‌ها تا گذشته‌ای نه‌چندان دور همچنان مورد استفاده قرار می‌گرفتند و وینیل‌ها هم کماکان میان کلکسیونرها محبوبیت دارند.

اما ضبط صدای آنالوگ باعث می‌شود با محدودیت‌های جدی از نظر کیفیت اطلاعات ضبط شده روبه‌رو شویم. علاوه بر این،‌ تکنولوژی‌های آنالوگ در جهانی که داشت روزبه‌روز دیجیتالی‌تر می‌شد، شکلی ناسازگار به خود گرفتند. اینجا بود که صدای دیجیتال وارد میدان شد.

سیگنال صدای آنالوگ را می‌توان یک موج سینوسی مداوم توصیف کرد. برای آوردن این سیگنال آنالوگ به قلمروی دیجیتال، از تکنیکی به نام Pulse-Code Modulation (یا PCM) استفاده می‌شود. امروز بخش اعظمی از اصوات دیجیتالی که به آن‌ها عادت کرده‌ایم از این متد بهره‌ می‌برند.

Pulse-Code Modulation یا ورژن جدیدترش، Linear-Pulse Code Modultion (به اختصار LPCM)، نمونه‌هایی مجزا از زمان و دامنه نوسان موج سینوسی آنالوگ که به آن اشاره کردیم، برمی‌دارند. کیفیت این تبدیل آنالوگ به دیجیتال، بستگی به نرخ نمونه‌برداری (Sampling Rate) و شمار مقادیر دیجیتالی که می‌توان از آن‌ها برای نمایاندن هر نمونه استفاده کرد (عمق بیت یا Bit Depth) دارد. در تئوری، هرچه این مقادیر بالاتر باشند، سیگنال دیجیتال دقیق‌تر قادر به نمایاندن صدای آنالوگ اصلی خواهد بود.

از آن‌جایی که نمونه‌ها از نقاط مجزایی از یک سیگنال برداشته می‌شوند، برای پر کردن حفره‌های میانی نیاز به پروسه‌ای به نام کمّی‌سازی (Quantization) داریم که در آن از تکنیک‌هایی مانند برش زدن (Truncation) استفاده می‌شود. اما این پروسه به ایجاد نویز منجر می‌شود و مقدار نویزی که درون سیگنال به وجود می‌آید، رابطه‌ای مستقیم و عکس با عمق بیت دارد. به همین ترتیب، با افزایش عمق بیت یک سیگنال دیجیتال می‌توان سطح نویز را کاهش داد و در نتیجه دامنه داینامیک را نیز بالا برد.

طبیعتا اکثر صداهای دیجیتالی که ما امروز می‌شنویم، پر از نویز پس‌زمینه نیستند. این بخاطر تکنیکی هوشمندانه به نام مبهم‌نهایی (Dithering) است. مبهم‌نهایی اساسا الگوی نویز طبیعی که به خاطر پروسه کمّی‌سازی به وجود آمده را از بین برده و نویز منتخب ما را جایگزین می‌کند. بنابراین می‌توانیم نویزی که می‌خواهیم را به صدا و به طیف فرکانس مدنظرمان اضافه کنیم. با مبهم‌نمایی می‌توان نویزهای کمّی‌سازی را از بین برد و در عوض از نویزی نرم‌تر و کمتر قابل شنیدن استفاده کرد که گوش‌هایمان حساسیت پایین‌تری نسبت به آن‌ها دارند.

کمّی‌سازی نویز

گوش‌های ما نسبت به آن دسته از امواج صوتی حساسیت نشان می‌دهند که در رنج ۲۰ هرتز الی ۲۰ هزار هرتز قرار دارند. البته این بازه‌ای بسیار سخاوتمندانه است و اکثر مردم به بازه‌ای پایین‌تر از این حساس هستند، خصوصا اگر به سراغ بخش‌های بالاتر طیف برویم. علاوه بر این، هرچه سن شما بالاتر می‌رود، این بازه هم به صورت طبیعی کاهش می‌یابد و نسبت‌ به رنج فرکانس‌های بالاتر ناشنوا می‌شوید. اما برای اینکه بتوانیم این مقاله را پیش ببریم، بیایید همان رنج ۲۰ الی ۲۰ هزار هرتز را مدنظر قرار دهیم.

برای حصول اطمینان از اینکه پروسه ضبط صدا فرکانس‌هایی تا حداقل ۲۰ هزار هرتز را پوشش می‌دهد، نرخ نمونه‌برداری باید حداقل دو برابر این رقم باشد که این هم با چیزی به نام قضیه نمونه‌برداری نایکوئیست-شنون دیکته می‌شود. بدین خاطر چنین کاری می‌کنیم تا هنگام بازپخش سیگنال دیجیتالی در قالب سیگنال آنالوگ، شاهد انعکاس فرکانس نباشیم. بنابراین برای دستیابی به ۲۰ هزار هرتز یا ۲۰ کیلوهرتر نیازمند نرخ نمونه‌برداری حداقل ۴۰ کیلوهرتزی هستید.

استاندارد اصلی امروزی در صدای دیجیتال، Audio CD است که از اطلاعات ۱۶ بیتی با نرخ نمونه‌برداری ۴۴.۱ کیلوهرتز در صدای غیرفشرده شده LPCM استفاده می‌کند. علی‌رغم گذشت ۴۰ سال از زمان ظهور این استاندارد، همچنان می‌توان آن را استاندارد طلایی صدای دیجیتال به حساب آورد. در همین راستا، از Audio CD برای سنجش دیگر استانداردها مانند موزیک رزولوشن بالا هم استفاده می‌شود.

با این وجود و اگرچه صدای CD همچنان استانداردی خوب باقی مانده، اما به خاطر حجم بالای فایل‌ها، گزینه‌ای مناسب برای استریم یا دانلود کردن به حساب نمی‌آید. این مشکل به صورت خاص در نخستین روزهای اینترنت و موسیقی آنلاین دامنگیر مردم شده بود، زیرا سرعت اینترنت در آن روزها به مراتب پایین‌تر از سرعت اینترنت امروزی بود. همین باعث شد که شاهد ابداع صدای فشرده شده باشیم که در نهایت جهان صدا را درنوردید.

فشرده‌سازی تکنیکی رایج در دنیای پردازش است که به کاهش حجم فایل‌ها منجر می‌شود. وقتی شما یک فایل ZIP می‌سازید، اساسا دارید فایل‌های درون آن را فشرده می‌کنید تا فضای کمتری درون دیسک اشغال شود. ZIP مثالی از فشرده‌سازی بدون اتلاف یا همان Lossless است. این یعنی شاهد حجم پایین‌تر فایل‌ها خواهید بود، اما نه آنقدرها محسوس و چشمگیر نسبت به ورژن اصلی. برای اینکه تفاوتی واقعی ایجاد شود، باید به سراغ فشرده‌سازی پر اتلاف یا لاسی (Lossy) بروید.

حالا اگر هنگام ساخت فایل زیپ، اپلیکیشن آرشیوسازی شما شروع به حذف کردن داده‌های رندوم کند احتمالا آنقدرها خوشحال نشوید. ولی اوضاع برای صدا متفاوت است. حتی استاندارد CD Audio هم انبوهی از اطلاعاتی را در خود جای می‌دهد که گوش انسان معمولا قادر به شنیدن آن‌ها نیست، هرچند که همه‌چیز بستگی به گوش شخص و تجهیزات مورد استفاده از سوی او دارد. این باعث می‌شود که فشرده‌سازی پراتلاف صدا آسان باشد و می‌توان بیت‌هایی که آنقدرها مهم نیستند را حذف کرد.

نخستین تکنیک‌های فشرده‌سازی آنقدرها معرکه نبودند. همه ما فایل‌های قدیمی MP3 را به یاد می‌رویم که مصنوعاتی کاملا قابل شنیدن و ناشی از فشرده‌سازی داشتند، حتی اگر روی بهترین تجهیزات ممکن به آن‌های گوش می‌سپردیم. آن موقع حتی اصلا نمی‌دانستید مصنوعات ناشی از فشرده‌سازی چه هستند، اما آنقدر واضح به گوش می‌رسیدند که هرکسی کیفیت پایین را حس می‌کرد.

به مرور زمان شرایط بهبود یافت. کدک‌های بهتر و بهینه‌تر از راه رسیدند و این یعنی می‌توانستیم داده‌های بیشتری را در فضای کمتر ذخیره کنیم. مهم‌تر از این انکدرهای بهتری بودند که گیرمان آمدند و می‌توانستیم داده را به شکلی بهینه‌تر پکیج کنیم. امروز صداهای فشرده‌ و پراتلاف را می‌توان در همه‌جا یافت. تمام سرویس‌های استریم موسیقی، سرویس‌های استریم ویدیو و حتی فرمت‌های دیگر مانند کتاب‌های صوتی و پادکست‌ها میزبان صدای لاسی هستند. تمام ویدیوهایی که با موبایل‌ هوشمند خود ضبط می‌کنید صدای فشرده دارند. این تکنولوژی به نقاطی آنقدر خوب رسیده که اکثر مردم اصلا متوجه فشرده‌سازی موزیک خود نمی‌شوند، حتی اگر صدای اورجینال را قبلا شنیده باشند. این تکنولوژی عالی کار می‌کند.

و این ما را می‌رساند به موضوع بعدی...

صدای Lossless چیست و چرا باید به آن اهمیت دهیم؟

لازم است یک چیز را از همین ابتدا روشن کنیم: Lossless بدین معنا نیست که هیچ‌گونه فشرده‌سازی اتفاق نیفتاده است. مردم معمولا از این دو مفهوم به عنوان مفهومی یکسان استفاده می‌کنند. اما غیر فشرده و بدون اتلاف دو معنای کاملا متفاوت دارند.

همانطور که پیش‌تر اشاره می‌کنیم، فایل‌ها را می‌توان به دو صورت فشرده‌سازی کرد: یا می‌توانید بخش اعظمی از داده را حذف کنید تا به حجم بسیار پایین‌تر فایل دست پیدا کنید یا اینکه تمام داده حفظ شود و حجم فایل به مقادیر بسیار محدودی کاهش یابد. مورد دوم همان فشرده‌سازی Lossless است.

صدای Lossless صدایی است که با استفاده از تکنیکی خاص فشرده شده که تمام داده موجود در فایل اصلی را حفظ می‌کند. نتیجه کار فایلی است که در قیاس با فایل‌های فشرده نشده، با سهولت بیشتری از طریق اینترنت استریم یا دانلود می‌شود اما در قیاس با فایلی که از فشرده‌سازی پراتلاف عبور کرده، همچنان حجم نسبتا زیادی دارد.

مزایای بهره‌گیری از این تکنیک واضح هستند. اگرچه تکنیک‌های فشرده‌سازی پراتلاف طی سال‌های اخیر آنقدر پیشرفت کرده‌اند که حتی هنگام استفاده از تجهیزات مدرن هم اکثر مردم تفاوت میان صدای پراتلاف و بی‌اتلاف را متوجه نمی‌شوند، اما در هر صورت همان فایل اصلی را تحویل نمی‌دهند. این یعنی برای آن دسته از افرادی که توانایی‌های شنوایی بسیار خوب یا تجهیزات عالی در اختیار دارند، همچنان امکان تمیز دادن صدای پراتلاف از صدای بی‌اتلاف مهیا خواهد بود. از سوی دیگر برخی کلکسیونر به حساب آمده و ترجیح می‌دهند فایل‌های اصلی و دست‌نخورده را در اختیار داشته باشند.

اصلی‌ترین دلیل ظهور کدک‌های لاسی این بوده که توزیع صدا را در سطح اینترنت آسان‌تر می‌کنند. اما با افزایش پهنای باند در اقصی نقاط جهان، دیوایس‌هایی که سریع‌تر پردازش می‌کنند و دسترسی به فضای ذخیره‌سازی بیشتر، بهره‌گیری از صدای اورجینال، بدون اینکه هیچ داده‌ای در پروسه فشرده‌سازی از دست برود راحت‌تر شده است. از سوی دیگر تکنولوژی استریمینگ هم مشکلات مربوط به فضای ذخیره‌سازی را کاملا از بین برده است. دیگر نیازی به ذخیره‌سازی محلی موسیقی نیست و می‌توان در هر لحظه به استریم آن پرداخت.

حتی اگر جزو افرادی باشید که شنوایی آنقدرها خوبی یا دانش چندانی نسبت به صدای باکیفیت یا تجهیزات مورد نیاز را ندارند، پهنای بالای اینترنت باعث می‌شود با خود فکر کنید که چرا باید به صدای فشرده‌ شده گوش سپرد؟ اگر بتوان صدای Lossless را همانطور مصرف کرد که پیشتر صدای لاسی مصرف می‌شد، چه دلیلی دارد که همچنان سراغ صدای لاسی برویم؟

این تمام منطق پشت صدای Lossless است. از لحاظ عملی لزوما با صدایی بهتر روبه‌رو نیستیم و صرفا به صدای اورجینالی گوش می‌دهیم که سال‌ها پیش با Audio CD امکان‌پذیر شده بود. بله، اساسا ما یک سیکل کامل را طی کرده‌ایم و برای همین مشاهده هیجان مردم برای صدای بدون اتلاف واقعا عجیب است. زیرا از نقطه نظر فنی، دوباره همان صدای CD را به دست آوردیم، اما بدون CD. روندی که بشریت طی می‌کند گاهی از اوقات واقعا خنده‌دار می‌شود.

البته صدای Lossless لزوما صدای CD نیست. وقتی با مشخصات مشابه به صدای CD روبه‌رو هستیم، کمپانی‌ها نام صدای «کیفیت CD یا CD-Quality» را برایش انتخاب می‌کنند. قطعا، در اکثریت مواقع این یعنی صدایی ۱۶ بیتی و ۴۴.۱ کیلوهرتزی گیرمان می‌آید. اما گاهی هم از این عبارت برای توصیف صدایی استفاده می‌شود که واقعا روی یک Audio CD آن را خواهید یافت. اما کیفیت CD دیگر برای برخی از مردم کافی نیست. اینجاست که غول پایانی در دنیای صدای دیجیتال وارد میدان می‌شود.

صدای رزولوشن بالا (High Resolution Audio)

درست مانند بخش قبلی مقاله، در این بخش هم کار را با شفاف‌سازی راجع به یک مسئله آغاز می‌کنیم: صدای رزولوشن بالا به معنای Lossless نیست و Lossless هم به معنای رزولوشن بالا نیست. صدای رزولوشن بالا را می‌توان در فرمت‌های لاسی یا Lossless یافت. صدای بی‌اتلاف می‌تواند رزولوشنی پایین یا بالا داشته باشد. بنابراین با دو مقوله کاملا متفاوت روبه‌رو هستیم.

اپل قرار است ترک‌های موسیقی رزولوشن بالا را با همان کدک بی‌اتلاف ALAC در فایل‌های Lossless کیفیت CD ارائه کند. آمازون به صورت خاص نگفته از چه کدکی استفاده می‌کند، اما به ارائه صدای بی‌اتلاف برای فایل‌های رزولوشن بالا و کیفیت CD خود می‌پردازد. تیدال از طرف دیگر به سراغ ترک‌های کیفیت CD در فرمت بی‌اتلاف FLAC رفته است.

تمام این‌ها ما را به یک پرسش اساسی می‌رساند: صدای رزولوشن بالا چیست؟ برای پاسخ به این سوال باید به سراغ رفقای قدیمی‌مان برویم: عمق بیت و نرخ نمونه‌برداری. یک صدای رزولوشن بالا، مقادیر بالاتری از این‌ها را در خود جای داده: بیت‌های بیشتر و نمونه‌های بیشتر.

صدای رزولوشن بالا معمولا رنج داینامیک ۲۴ بیتی و نرخ نمونه‌برداری ۸۸.۲ کیلوهرتز دارد، اما رقم دوم می‌تواند در برخی موارد به ۱۹۲ کیلوهرتز یا حتی ۳۸۴ کیلوهرتز هم برسد. صدای رزولوشن بالا گاهی تحت عنوان صدای پروضوح (High-Definition) هم شناخته می‌شود. بعد هم نوبت به Hi-Res Audio می‌رسد که برندی متعلق به شرکت سونی است و دیگران با خرید لایسنس آن، اساسا به مشتریان می‌گویند که دیوایس‌شان از صدای رزولوشن بالا پشتیبانی می‌کند. اما خرید این لایسنس ضروری نیست و می‌توان سخت‌افزارهایی عاری از این برند نیز داشت که به پخش صدای رزولوشن بالا می‌پردازند.

صدای رزولوشن بالا اکنون چند وقتی است که از راه رسیده و نقطه آغازش به روزهای Super Audio CD بازمی‌گردد. مسئله اصلی اینست که اکثر افراد -از جمله عاشقان صدا و مهندسین- ظاهرا نمی‌توانند به یک نتیجه‌گیری کلی بر سر این موضوع برسند که آیا صدای رزولوشن بالا واقعا کاربردی است یا زرقی و برقی اضافه. استاندارد طلایی ۱۶ بیت و ۴۴.۱ کیلوهرتز در Audio CD نه‌تنها تمام رنج شنوایی یک انسان معمولی را در خود جای می‌دهد، بلکه به قدری در انجام این کار موفق است که به زحمت قادر به بهبود عملکردش خواهیم بود.

بیایید به نخستین مزیت صدای رزولوشن بالا نگاهی بیندازیم که عمق بیت بیشتر است. وقتی شما عمق بیت را هنگام تبدیل سیگنال آنالوگ به دیجیتال کاهش می‌دهید، در پروسه کمّی‌سازی نویز بیشتری تولید خواهید کرد. با افزایش عمق بیت، طبیعتا نویز کاهش می‌یابد و در نتیجه دامنه داینامیک بالاتر می‌رود.

با این همه، حتی با ۱۶ بیت مبهم‌نگاری نشده هم دامنه داینامیک ۹۶ دسیبل گیرتان می‌آید که به بیشینه محدودیت‌های شنوایی انسان (۱۲۰ دسیبل) بسیار نزدیک است. اگر هم به سراغ ۲۴ بیت (۱۴۴ دسیبل) بروید اساسا از توانایی‌های اکثر تجهیزات امروزی هم فراتر خواهید رفت. به عبارت دیگر، قادر به شنیدن چنین صدایی نیستید.

به عنوان مزیت دوم، تکنیک‌های هوشمندانه‌ای مانند مبهم‌نگاری می‌توانند آن‌چنان به کاهش نویز حتی در سیگنال ۱۶ بیتی کمک کنند که نویز باقی‌مانده روی هیچ چیز به جز تجهیزات بسیار دقیق قابل شنیدن نیست. دامنه داینامیک در یک سیگنال داینامیک ۱۶ بیتی می‌تواند به آسانی فراتر از ۱۲۰ دسیبل برود و بنابراین نویز در دامنه غیر قابل شنیدن قرار می‌گیرد. این یعنی در تمام موارد عملی، ۱۶ بیت برای گوش‌های انسان کاملا بی‌نقص است.

مزیت دیگر صدای رزولوشن بالا، نرخ نمونه‌برداری بالاتر است. نرخ نمونه‌برداری ۱۹۲ کیلوهرتز به این معناست که صدا می‌تواند بیشینه پاسخ‌دهی فرکانسی به اندازه ۹۶ کیلوهرتز داشته باشد. همانطور که پیشتر اشاره کردیم، گوش انسان در بهترین حالت قادر به شنیدن ۲۰ کیلوهرتز است، تازه در دورانی از زندگی که بی‌نقص‌ترین شنوایی ممکن را داشته باشد. اکثر مردم پاسخ‌دهی فرکانسی پایین‌تری نسبت به این رقم دارند.

اینکه صدا فرکانسی فراتر از توانایی‌های شنیداری انسان داشته باشد، مثل این است که تلویزیونی بخریم که نورهایی فراتر از توانایی‌های بصری انسان به نمایش در می‌آورد. توانایی شما در شنیدن صدای ۹۶ کیلوهرتز مثل توانایی شما در دیدن اشعه ایکس است. ساده‌تر بگوییم، چنین توانایی ندارید.

بازتولید صدا با چنین فرکانسی ضمنا فشاری مضاعف به تجهیزات و درایورها وارد می‌کند و این خود به شکل‌گیری اعوجاج هرچه بیشتر منجر می‌گردد. این اعوجاج در دامنه قابل شنیدن قرار می‌گیرد و این یعنی در حال خراب کردن صدایی که می‌توانید بشنوید، در ازای صدایی که نمی‌توانید بشنوید خواهید بود.

برخی می‌گویند فرکانس‌های فراتر از توانایی شنیداری انسان، روی فرکانس‌هایی که می‌توانیم بشنویم تاثیر می‌گذارند و در نتیجه، استفاده از آن فرکانس‌های اضافه در نهایت موجب بهبود بیت‌هایی که می‌شنویم خواهند شد. اما هیچ مدرک مستدلی پشت این ادعا نیست.

موضوع اصلی این است که عمق بیت و نرخ نمونه‌برداری بالاتر واقعا مزیت‌هایی به همراه می‌آورند، اما در صورتی که مشغول به تولید موسیقی باشیم. همه‌چیز مثل فرمت تصویر RAW است. کار کردن روی ترکی صوتی که عمق بیت بیشتر دارد باعث می‌شود تنظیم سطوح صدا آسان‌تر شود. اصلی‌ترین مزیت سطح نویز کمتر است که اگر چندین ترک را لایه‌لایه روی هم بگذارید، افزایش می‌یابد. بنابراین اگر تمام ترک‌ها ۲۴ بیتی یا بالاتر از مقدار نرمال باشند، سطح نویز باز هم بسیار کم است. همین موضوع راجع به نرخ نمونه‌برداری و پاسخ‌دهی‌های فرکانسی بالاتر هم مصداق دارد. اما به محض اینکه کارتان با تولید ترک موسیقی تمام شد، می‌توانید از آن خروجی ۱۶ بیتی و ۴۴.۱ کیلوهرتزی بگیرید و همچنان یک خروجی بی‌نقص خواهید داشت.

گفتن اینکه صدای رزولوشن بالا مزایایی محسوس برای انسان‌ها و هنگام گوش سپردن به موسیقی به همراه می‌آورد، دشوار است. اکثر افرادی که مدعی شنیدن صدایی متفاوت می‌شوند، شاید خیلی ساده در حال گوش دادن به ورژنی متفاوت از ترک باشند: بسیاری از موسیقی‌هایی که با صدای رزولوشن بالا عرضه شده‌اند بعدا ریمستر هم شده‌اند که می‌تواند برخی اجزای صدا را شدیدا متفاوت کند. آنچه دارد در اینجا تفاوت به وجود می‌آورد، مسترینگ صدا است که در گذشته کمتر صورت می‌گرفت و این روزها شاهد بازنشر موسیقی‌ها بعد از ریمستر شدن‌شان هستیم. در چنین ترک‌هایی، صدا حتی از استاندارد CD هم بهتر خواهد بود. بنابراین هنگام مقایسه کیفیت صدا میان دو فرمت، باید اطمینان حاصل کرد که مستری واحد استفاده می‌شود.

صدای فضایی (Spatial Audio)

اپل علاوه بر انتشار خبر پشتیبانی از صدای Lossless در اپل موزیک، به تایید حضور تکنولوژی Spatial Audio یا صدای فضایی (فراگیر) هم پرداخته است. اگر بخواهیم دقیق باشیم، اپل مدعی شده که از صدای فضایی همراه با Dolby Atmos روی اپل موزیک پشتیبانی می‌شود. تمام این‌ها به چه معناست؟

بیایید ابتدا به صحبت راجع به دالبی اتموس بپردازیم. دالبی به در اختیار داشتن چندین کدک صدای فراگیر مشهور است و یکی از بزرگ‌ترین نام‌ها در دنیای صدای سینمایی به حساب می‌آید. اما فرمت‌های صدای فراگیر سنتی همواره به پشتیبانی از کانال‌هایی مجزا مانند ۵.۱ یا ۷.۱ پرداخته‌اند. این یعنی هنگام مسترینگ در این فرمت‌ها، بسته به جایی که کارگردان می‌خواست صدا از آن به گوش برسد، صدا باید در یکی از این کانال‌ها قرار می‌گرفت.

دالبی اتموس حالا صدای شی-محور را جایگزین صدای کانال-محور کرده است. این یعنی هنگام مسترینگ، مهندس صدا صرفا باید صدا را در محیطی سه‌بعدی و پیرامون شنونده قرار دهد و سپس سیستم خودش تشخیص می‌دهد که از کدام اسپیکر برای بازتولید آن استفاده کند. از سوی دیگر این بدان معناست که اتموس در تئوری بی‌نهایت کانال دارد، زیرا می‌توانید اسپیکرهای هرچه بیشتر را به محیط صدای کرده و حس غوطه‌وری ناشی از صدا را افزایش دهید. چنین کاری را نمی‌توان با فرمت‌های کانال-محور به انجام رساند.

اتموس حتی گام را از این فراتر گذاشته و به سراغ عنصر ارتفاع در صدا می‌رود. این یعنی می‌توانید اسپیکرهایی را روی سقف قرار دهید و صدا به گونه‌ای انکد می‌شود که گویی بالای سر شما قرار دارد. به این ترتیب غوطه‌وری میان صدا افزایش می‌یابد و اساسا می‌توان صدا را از هر جهتی پخش کرد: درست مانند زندگی واقعی.

دالبی اتموس در موسیقی هم به صورتی مشابه عمل می‌کند: تولیدکننده می‌تواند موزیکی بسازد که هنگام گوش سپردن به آن با اسپیکرهای فراگیر و کانال‌های ارتفاعی، صدایش از همه طرف به گوش می‌رسد. در نتیجه شما درون نوعی کره صوتی قرار گرفته و حس می‌کنید در جایی خاص هستید. مثلا فرض کنید که صدای یک اجرای زنده با این تکنیک ضبط شود و شما به آن گوش بسپارید.

حالا اپل این ترک صوتی را برداشته و آن را از میان تکنولوژی دیگری تحت عنوان صدای فضایی عبور می‌دهد. صدای فضایی پیشتر نیز برای محتویات ویدیویی و هنگام متصل کردن ایرپاد پرو و ایرپاد مکس به یکی از دیوایس‌های اپل در دسترس بوده است. هنگام پخش محتوای دالبی اتموس روی آیفون یا آیپد، ایرپاد پرو و ایرپاد مکس از داده موجود درون ترک صوتی برای شبیه‌سازی یک کره سه‌بعدی از صدا پیرامون شما استفاده می‌کنند. علاوه بر این، با استفاده از شتاب‌سنج و ژیروسکوپ موجود در این مدل‌های ایرپاد، حرکات سر شما پایش می‌شوند و صدا همراه با سر شما حرکت می‌کند. درست مانند دنیای واقعی.

صدای فضایی در اپل موزیک این‌طور کار می‌کند که حباب صوتی در اطراف شما شکل می‌گیرد، اما خبری از پایش حرکات سر نیست. از آن‌جایی که پایش حرکات سر صورت نمی‌گیرد، حالا می‌توان از این قابلیت در مدل‌های پایه ایرپاد هم استفاده کند. در واقع این قابلیت با تمام مدل‌های ایزپاد و بیتس مجهز به چیپ W1/H1 و همینطور اسپیکر داخلی تمام مدل‌های آیفون و آیپد مک که اسپیکر استریو دارند سازگار خواهد بود.

حالا این سوال مطرح می‌شود که آیا صدای نهایی اصلا خوب هست یا خیر. بخواهیم روراست باشیم، صدای فراگیر یک‌جورهایی افتضاح است. این مشکلی نیست که ناشی از فرمت باشد و بیشتر به موسیقی‌ها مربوط می‌شود. هر از چندگاهی به ترکی برمی‌خورید که به صورت خاص برای نمایش توانایی‌های صدای فراگیر طراحی شده و بسیار باحال ظاهر می‌شود. اما موزیکی که به صورت معمول به آن گوش می‌دهید، یعنی مسترهای صدای فراگیر ترک‌های محبوب که توسط استودیوهای مختلف عرضه می‌شوند، صدای آنقدرها خوبی تولید نمی‌کنند. این موضوع به صورت خاص راجع به آلبوم‌های استودیویی مصداق دارد که در اصل برای پخش روی اسپیکرهای استریو تولید شده‌اند و به صورت فراگیر بسیار عجیب و آشفته به گوش می‌رسند. این مشکل آنقدر شایع است که در نهایت ترجیح می‌دهید به سراغ ورژن استریوی استاندارد بروید.

می‌توان تصور کرد که این تکنولوژی چه مزایایی برای آلبوم‌های کنسرتی به ارمغان می‌آورد، اما نمونه‌های موجود چندان زیاد نیستند. در نهایت می‌توان به این تکنولوژی خوشبین بود، ولی اگر در حال حاضر به تجهیزات لازم برای گوش سپردن به صدای فضایی دسترسی ندارید نگران نباشید، چیز زیادی از دست نداده‌اید.

تکلیف صدای بلوتوثی چیست؟

تا به اینجای کار عمدتا درباره صدا در قلمروی سیمی صحبت کردیم. اما این روزها بسیاری از مردم به موسیقی‌های خود روی دیوایس‌های بلوتوثی گوش می‌سپارند. چه موضوع صحبت ایربادهای بلوتوثی مانند ایرپاد باشد، چه هدفون‌های بلوتوثی مثل سونی WH-1000XM4، چه اسپیکرهای بلوتوثی و چه صدای درون ماشین که با بلوتوث پخش می‌شود.

بلوتوث یک لایه به پیچیدگی شرایط اضافه می‌کند و هنگام استفاده از آن مجبور به سازش نیز خواهید شد. تمام اصواتی که از طریق بلوتوث انتقال می‌یابند، فشرده شده‌اند. تک‌تک کد‌ک‌های بلوتوثی که اکنون در اختیار داریم، از SBC و aptX گرفته تا LDAC و LHDC، کدک‌های لاسی هستند. تا داریم به این موضوع می‌پردازیم بیایید یک افسانه قدیمی را هم تکذیب کنیم: اگر موزیک شما فرمت AAC داشته باشد و هدفون‌ها و دیوایس بلوتوثی هم از AAC برای انتقال صدا استفاده کنند، موسیقی کماکان فشرده‌سازی و مجددا انکد می‌شود. بنابراین شاهد انتقال دقیقا همان موسیقی نیستیم.

این صرفا چگونگی کارکرد تکنولوژی بلوتوث در دوران کنونی است. بلوتوث به پهنای باند لازم برای مخابره صدای Lossless با کدک‌های کنونی دسترسی ندارد، مخابره فشرده‌سازی نشده که بماند. بعید نیست یک روز شاهد از راه رسیدن کدکی آنقدر بهینه باشیم که تمام داده اصلی را در خود جای دهد، هیچ حذفیاتی نداشته باشد و همچنان از پهنای باند ناچیز بلوتوث عبور کند. اما چنین کدکی هنوز در دسترس قرار نگرفته است.

نظرات ۳

وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

ورود

Digiato

رمزتان را گم کرده‌اید؟ ورود با گوگل

Digiato

ورود با گوگل