هرآنچه باید راجع به صدای Lossless، صدای High-Resolution و Spatial بدانید
کمپانی اپل اخیرا از گزینه صدای Lossless (بدون اتلاف) برای سرویس استریم موسیقی اپل موزیک رونمایی کرده. علاوه بر این، کمپانی مورد اشاره قرار است در کنار صدای بیاتلاف و رزولوشن بالا، صدای فراگیر را ...
کمپانی اپل اخیرا از گزینه صدای Lossless (بدون اتلاف) برای سرویس استریم موسیقی اپل موزیک رونمایی کرده. علاوه بر این، کمپانی مورد اشاره قرار است در کنار صدای بیاتلاف و رزولوشن بالا، صدای فراگیر را هم با انکود دالبی اتموس به دست مشتریان سرویس خود برساند. به این ترتیب اپل اکنون به کلوپ ارائهکنندگان صدای Lossless پیوسته، کلوپی که پیشتر میزبان تیدال، آمازون و دیزر بود. حتی اسپاتیفای هم که هنوز صدای بیاتلاف را به دست مشترکین خود نرسانده، با رونمایی از سرویس Spotify HiFi عملا زودتر از اپل دست به کار شد.
اپل اکنون صدای Lossless را روی پلتفرم خود عرضه کرده و به صورت اتوماتیک تبدیل به بزرگترین سرویس استریمی موسیقی جهان خواهد شد که چنین قابلیتی را در دسترس کاربران قرار میدهد. میلیونها نفر در اقصی نقاط کره خاکی ناگهان به صدای Lossless دسترسی خواهند شد و نیازمند هیچ تلاش اضافه یا حتی پرداخت هزینه اضافه نخواهند بود.
بنابراین به سوالی مهم میرسیم: صدای Lossless چیست و چرا اصلا کسی باید به آن اهمیتی دهد؟ از سوی دیگر صدای رزولوشن بالا و دالبی اتموس چه معنایی دارند؟ زمانش رسیده که به این سوالات پاسخی واضح دهیم و برخی از افسانههای مربوط به تکنولوژیهای مورد نظر را نیز از پیش رو برداریم.
قواعد بنیادین
صدایی که ما به طور معمول میشنویم، آنالوگ است. در گذشته، مدیایی که این صدا را برای ما توزیع میکرد هم آنالوگ بود. کاستهای صدا و وینیلها دو مثال برجسته از مدیای آنالوگ هستند. کاستها تا گذشتهای نهچندان دور همچنان مورد استفاده قرار میگرفتند و وینیلها هم کماکان میان کلکسیونرها محبوبیت دارند.
اما ضبط صدای آنالوگ باعث میشود با محدودیتهای جدی از نظر کیفیت اطلاعات ضبط شده روبهرو شویم. علاوه بر این، تکنولوژیهای آنالوگ در جهانی که داشت روزبهروز دیجیتالیتر میشد، شکلی ناسازگار به خود گرفتند. اینجا بود که صدای دیجیتال وارد میدان شد.
سیگنال صدای آنالوگ را میتوان یک موج سینوسی مداوم توصیف کرد. برای آوردن این سیگنال آنالوگ به قلمروی دیجیتال، از تکنیکی به نام Pulse-Code Modulation (یا PCM) استفاده میشود. امروز بخش اعظمی از اصوات دیجیتالی که به آنها عادت کردهایم از این متد بهره میبرند.
Pulse-Code Modulation یا ورژن جدیدترش، Linear-Pulse Code Modultion (به اختصار LPCM)، نمونههایی مجزا از زمان و دامنه نوسان موج سینوسی آنالوگ که به آن اشاره کردیم، برمیدارند. کیفیت این تبدیل آنالوگ به دیجیتال، بستگی به نرخ نمونهبرداری (Sampling Rate) و شمار مقادیر دیجیتالی که میتوان از آنها برای نمایاندن هر نمونه استفاده کرد (عمق بیت یا Bit Depth) دارد. در تئوری، هرچه این مقادیر بالاتر باشند، سیگنال دیجیتال دقیقتر قادر به نمایاندن صدای آنالوگ اصلی خواهد بود.
از آنجایی که نمونهها از نقاط مجزایی از یک سیگنال برداشته میشوند، برای پر کردن حفرههای میانی نیاز به پروسهای به نام کمّیسازی (Quantization) داریم که در آن از تکنیکهایی مانند برش زدن (Truncation) استفاده میشود. اما این پروسه به ایجاد نویز منجر میشود و مقدار نویزی که درون سیگنال به وجود میآید، رابطهای مستقیم و عکس با عمق بیت دارد. به همین ترتیب، با افزایش عمق بیت یک سیگنال دیجیتال میتوان سطح نویز را کاهش داد و در نتیجه دامنه داینامیک را نیز بالا برد.
طبیعتا اکثر صداهای دیجیتالی که ما امروز میشنویم، پر از نویز پسزمینه نیستند. این بخاطر تکنیکی هوشمندانه به نام مبهمنهایی (Dithering) است. مبهمنهایی اساسا الگوی نویز طبیعی که به خاطر پروسه کمّیسازی به وجود آمده را از بین برده و نویز منتخب ما را جایگزین میکند. بنابراین میتوانیم نویزی که میخواهیم را به صدا و به طیف فرکانس مدنظرمان اضافه کنیم. با مبهمنمایی میتوان نویزهای کمّیسازی را از بین برد و در عوض از نویزی نرمتر و کمتر قابل شنیدن استفاده کرد که گوشهایمان حساسیت پایینتری نسبت به آنها دارند.
کمّیسازی نویز
گوشهای ما نسبت به آن دسته از امواج صوتی حساسیت نشان میدهند که در رنج ۲۰ هرتز الی ۲۰ هزار هرتز قرار دارند. البته این بازهای بسیار سخاوتمندانه است و اکثر مردم به بازهای پایینتر از این حساس هستند، خصوصا اگر به سراغ بخشهای بالاتر طیف برویم. علاوه بر این، هرچه سن شما بالاتر میرود، این بازه هم به صورت طبیعی کاهش مییابد و نسبت به رنج فرکانسهای بالاتر ناشنوا میشوید. اما برای اینکه بتوانیم این مقاله را پیش ببریم، بیایید همان رنج ۲۰ الی ۲۰ هزار هرتز را مدنظر قرار دهیم.
برای حصول اطمینان از اینکه پروسه ضبط صدا فرکانسهایی تا حداقل ۲۰ هزار هرتز را پوشش میدهد، نرخ نمونهبرداری باید حداقل دو برابر این رقم باشد که این هم با چیزی به نام قضیه نمونهبرداری نایکوئیست-شنون دیکته میشود. بدین خاطر چنین کاری میکنیم تا هنگام بازپخش سیگنال دیجیتالی در قالب سیگنال آنالوگ، شاهد انعکاس فرکانس نباشیم. بنابراین برای دستیابی به ۲۰ هزار هرتز یا ۲۰ کیلوهرتر نیازمند نرخ نمونهبرداری حداقل ۴۰ کیلوهرتزی هستید.
استاندارد اصلی امروزی در صدای دیجیتال، Audio CD است که از اطلاعات ۱۶ بیتی با نرخ نمونهبرداری ۴۴.۱ کیلوهرتز در صدای غیرفشرده شده LPCM استفاده میکند. علیرغم گذشت ۴۰ سال از زمان ظهور این استاندارد، همچنان میتوان آن را استاندارد طلایی صدای دیجیتال به حساب آورد. در همین راستا، از Audio CD برای سنجش دیگر استانداردها مانند موزیک رزولوشن بالا هم استفاده میشود.
با این وجود و اگرچه صدای CD همچنان استانداردی خوب باقی مانده، اما به خاطر حجم بالای فایلها، گزینهای مناسب برای استریم یا دانلود کردن به حساب نمیآید. این مشکل به صورت خاص در نخستین روزهای اینترنت و موسیقی آنلاین دامنگیر مردم شده بود، زیرا سرعت اینترنت در آن روزها به مراتب پایینتر از سرعت اینترنت امروزی بود. همین باعث شد که شاهد ابداع صدای فشرده شده باشیم که در نهایت جهان صدا را درنوردید.
فشردهسازی تکنیکی رایج در دنیای پردازش است که به کاهش حجم فایلها منجر میشود. وقتی شما یک فایل ZIP میسازید، اساسا دارید فایلهای درون آن را فشرده میکنید تا فضای کمتری درون دیسک اشغال شود. ZIP مثالی از فشردهسازی بدون اتلاف یا همان Lossless است. این یعنی شاهد حجم پایینتر فایلها خواهید بود، اما نه آنقدرها محسوس و چشمگیر نسبت به ورژن اصلی. برای اینکه تفاوتی واقعی ایجاد شود، باید به سراغ فشردهسازی پر اتلاف یا لاسی (Lossy) بروید.
حالا اگر هنگام ساخت فایل زیپ، اپلیکیشن آرشیوسازی شما شروع به حذف کردن دادههای رندوم کند احتمالا آنقدرها خوشحال نشوید. ولی اوضاع برای صدا متفاوت است. حتی استاندارد CD Audio هم انبوهی از اطلاعاتی را در خود جای میدهد که گوش انسان معمولا قادر به شنیدن آنها نیست، هرچند که همهچیز بستگی به گوش شخص و تجهیزات مورد استفاده از سوی او دارد. این باعث میشود که فشردهسازی پراتلاف صدا آسان باشد و میتوان بیتهایی که آنقدرها مهم نیستند را حذف کرد.
نخستین تکنیکهای فشردهسازی آنقدرها معرکه نبودند. همه ما فایلهای قدیمی MP3 را به یاد میرویم که مصنوعاتی کاملا قابل شنیدن و ناشی از فشردهسازی داشتند، حتی اگر روی بهترین تجهیزات ممکن به آنهای گوش میسپردیم. آن موقع حتی اصلا نمیدانستید مصنوعات ناشی از فشردهسازی چه هستند، اما آنقدر واضح به گوش میرسیدند که هرکسی کیفیت پایین را حس میکرد.
به مرور زمان شرایط بهبود یافت. کدکهای بهتر و بهینهتر از راه رسیدند و این یعنی میتوانستیم دادههای بیشتری را در فضای کمتر ذخیره کنیم. مهمتر از این انکدرهای بهتری بودند که گیرمان آمدند و میتوانستیم داده را به شکلی بهینهتر پکیج کنیم. امروز صداهای فشرده و پراتلاف را میتوان در همهجا یافت. تمام سرویسهای استریم موسیقی، سرویسهای استریم ویدیو و حتی فرمتهای دیگر مانند کتابهای صوتی و پادکستها میزبان صدای لاسی هستند. تمام ویدیوهایی که با موبایل هوشمند خود ضبط میکنید صدای فشرده دارند. این تکنولوژی به نقاطی آنقدر خوب رسیده که اکثر مردم اصلا متوجه فشردهسازی موزیک خود نمیشوند، حتی اگر صدای اورجینال را قبلا شنیده باشند. این تکنولوژی عالی کار میکند.
و این ما را میرساند به موضوع بعدی...
صدای Lossless چیست و چرا باید به آن اهمیت دهیم؟
لازم است یک چیز را از همین ابتدا روشن کنیم: Lossless بدین معنا نیست که هیچگونه فشردهسازی اتفاق نیفتاده است. مردم معمولا از این دو مفهوم به عنوان مفهومی یکسان استفاده میکنند. اما غیر فشرده و بدون اتلاف دو معنای کاملا متفاوت دارند.
همانطور که پیشتر اشاره میکنیم، فایلها را میتوان به دو صورت فشردهسازی کرد: یا میتوانید بخش اعظمی از داده را حذف کنید تا به حجم بسیار پایینتر فایل دست پیدا کنید یا اینکه تمام داده حفظ شود و حجم فایل به مقادیر بسیار محدودی کاهش یابد. مورد دوم همان فشردهسازی Lossless است.
صدای Lossless صدایی است که با استفاده از تکنیکی خاص فشرده شده که تمام داده موجود در فایل اصلی را حفظ میکند. نتیجه کار فایلی است که در قیاس با فایلهای فشرده نشده، با سهولت بیشتری از طریق اینترنت استریم یا دانلود میشود اما در قیاس با فایلی که از فشردهسازی پراتلاف عبور کرده، همچنان حجم نسبتا زیادی دارد.
مزایای بهرهگیری از این تکنیک واضح هستند. اگرچه تکنیکهای فشردهسازی پراتلاف طی سالهای اخیر آنقدر پیشرفت کردهاند که حتی هنگام استفاده از تجهیزات مدرن هم اکثر مردم تفاوت میان صدای پراتلاف و بیاتلاف را متوجه نمیشوند، اما در هر صورت همان فایل اصلی را تحویل نمیدهند. این یعنی برای آن دسته از افرادی که تواناییهای شنوایی بسیار خوب یا تجهیزات عالی در اختیار دارند، همچنان امکان تمیز دادن صدای پراتلاف از صدای بیاتلاف مهیا خواهد بود. از سوی دیگر برخی کلکسیونر به حساب آمده و ترجیح میدهند فایلهای اصلی و دستنخورده را در اختیار داشته باشند.
اصلیترین دلیل ظهور کدکهای لاسی این بوده که توزیع صدا را در سطح اینترنت آسانتر میکنند. اما با افزایش پهنای باند در اقصی نقاط جهان، دیوایسهایی که سریعتر پردازش میکنند و دسترسی به فضای ذخیرهسازی بیشتر، بهرهگیری از صدای اورجینال، بدون اینکه هیچ دادهای در پروسه فشردهسازی از دست برود راحتتر شده است. از سوی دیگر تکنولوژی استریمینگ هم مشکلات مربوط به فضای ذخیرهسازی را کاملا از بین برده است. دیگر نیازی به ذخیرهسازی محلی موسیقی نیست و میتوان در هر لحظه به استریم آن پرداخت.
حتی اگر جزو افرادی باشید که شنوایی آنقدرها خوبی یا دانش چندانی نسبت به صدای باکیفیت یا تجهیزات مورد نیاز را ندارند، پهنای بالای اینترنت باعث میشود با خود فکر کنید که چرا باید به صدای فشرده شده گوش سپرد؟ اگر بتوان صدای Lossless را همانطور مصرف کرد که پیشتر صدای لاسی مصرف میشد، چه دلیلی دارد که همچنان سراغ صدای لاسی برویم؟
این تمام منطق پشت صدای Lossless است. از لحاظ عملی لزوما با صدایی بهتر روبهرو نیستیم و صرفا به صدای اورجینالی گوش میدهیم که سالها پیش با Audio CD امکانپذیر شده بود. بله، اساسا ما یک سیکل کامل را طی کردهایم و برای همین مشاهده هیجان مردم برای صدای بدون اتلاف واقعا عجیب است. زیرا از نقطه نظر فنی، دوباره همان صدای CD را به دست آوردیم، اما بدون CD. روندی که بشریت طی میکند گاهی از اوقات واقعا خندهدار میشود.
البته صدای Lossless لزوما صدای CD نیست. وقتی با مشخصات مشابه به صدای CD روبهرو هستیم، کمپانیها نام صدای «کیفیت CD یا CD-Quality» را برایش انتخاب میکنند. قطعا، در اکثریت مواقع این یعنی صدایی ۱۶ بیتی و ۴۴.۱ کیلوهرتزی گیرمان میآید. اما گاهی هم از این عبارت برای توصیف صدایی استفاده میشود که واقعا روی یک Audio CD آن را خواهید یافت. اما کیفیت CD دیگر برای برخی از مردم کافی نیست. اینجاست که غول پایانی در دنیای صدای دیجیتال وارد میدان میشود.
صدای رزولوشن بالا (High Resolution Audio)
درست مانند بخش قبلی مقاله، در این بخش هم کار را با شفافسازی راجع به یک مسئله آغاز میکنیم: صدای رزولوشن بالا به معنای Lossless نیست و Lossless هم به معنای رزولوشن بالا نیست. صدای رزولوشن بالا را میتوان در فرمتهای لاسی یا Lossless یافت. صدای بیاتلاف میتواند رزولوشنی پایین یا بالا داشته باشد. بنابراین با دو مقوله کاملا متفاوت روبهرو هستیم.
اپل قرار است ترکهای موسیقی رزولوشن بالا را با همان کدک بیاتلاف ALAC در فایلهای Lossless کیفیت CD ارائه کند. آمازون به صورت خاص نگفته از چه کدکی استفاده میکند، اما به ارائه صدای بیاتلاف برای فایلهای رزولوشن بالا و کیفیت CD خود میپردازد. تیدال از طرف دیگر به سراغ ترکهای کیفیت CD در فرمت بیاتلاف FLAC رفته است.
تمام اینها ما را به یک پرسش اساسی میرساند: صدای رزولوشن بالا چیست؟ برای پاسخ به این سوال باید به سراغ رفقای قدیمیمان برویم: عمق بیت و نرخ نمونهبرداری. یک صدای رزولوشن بالا، مقادیر بالاتری از اینها را در خود جای داده: بیتهای بیشتر و نمونههای بیشتر.
صدای رزولوشن بالا معمولا رنج داینامیک ۲۴ بیتی و نرخ نمونهبرداری ۸۸.۲ کیلوهرتز دارد، اما رقم دوم میتواند در برخی موارد به ۱۹۲ کیلوهرتز یا حتی ۳۸۴ کیلوهرتز هم برسد. صدای رزولوشن بالا گاهی تحت عنوان صدای پروضوح (High-Definition) هم شناخته میشود. بعد هم نوبت به Hi-Res Audio میرسد که برندی متعلق به شرکت سونی است و دیگران با خرید لایسنس آن، اساسا به مشتریان میگویند که دیوایسشان از صدای رزولوشن بالا پشتیبانی میکند. اما خرید این لایسنس ضروری نیست و میتوان سختافزارهایی عاری از این برند نیز داشت که به پخش صدای رزولوشن بالا میپردازند.
صدای رزولوشن بالا اکنون چند وقتی است که از راه رسیده و نقطه آغازش به روزهای Super Audio CD بازمیگردد. مسئله اصلی اینست که اکثر افراد -از جمله عاشقان صدا و مهندسین- ظاهرا نمیتوانند به یک نتیجهگیری کلی بر سر این موضوع برسند که آیا صدای رزولوشن بالا واقعا کاربردی است یا زرقی و برقی اضافه. استاندارد طلایی ۱۶ بیت و ۴۴.۱ کیلوهرتز در Audio CD نهتنها تمام رنج شنوایی یک انسان معمولی را در خود جای میدهد، بلکه به قدری در انجام این کار موفق است که به زحمت قادر به بهبود عملکردش خواهیم بود.
بیایید به نخستین مزیت صدای رزولوشن بالا نگاهی بیندازیم که عمق بیت بیشتر است. وقتی شما عمق بیت را هنگام تبدیل سیگنال آنالوگ به دیجیتال کاهش میدهید، در پروسه کمّیسازی نویز بیشتری تولید خواهید کرد. با افزایش عمق بیت، طبیعتا نویز کاهش مییابد و در نتیجه دامنه داینامیک بالاتر میرود.
با این همه، حتی با ۱۶ بیت مبهمنگاری نشده هم دامنه داینامیک ۹۶ دسیبل گیرتان میآید که به بیشینه محدودیتهای شنوایی انسان (۱۲۰ دسیبل) بسیار نزدیک است. اگر هم به سراغ ۲۴ بیت (۱۴۴ دسیبل) بروید اساسا از تواناییهای اکثر تجهیزات امروزی هم فراتر خواهید رفت. به عبارت دیگر، قادر به شنیدن چنین صدایی نیستید.
به عنوان مزیت دوم، تکنیکهای هوشمندانهای مانند مبهمنگاری میتوانند آنچنان به کاهش نویز حتی در سیگنال ۱۶ بیتی کمک کنند که نویز باقیمانده روی هیچ چیز به جز تجهیزات بسیار دقیق قابل شنیدن نیست. دامنه داینامیک در یک سیگنال داینامیک ۱۶ بیتی میتواند به آسانی فراتر از ۱۲۰ دسیبل برود و بنابراین نویز در دامنه غیر قابل شنیدن قرار میگیرد. این یعنی در تمام موارد عملی، ۱۶ بیت برای گوشهای انسان کاملا بینقص است.
مزیت دیگر صدای رزولوشن بالا، نرخ نمونهبرداری بالاتر است. نرخ نمونهبرداری ۱۹۲ کیلوهرتز به این معناست که صدا میتواند بیشینه پاسخدهی فرکانسی به اندازه ۹۶ کیلوهرتز داشته باشد. همانطور که پیشتر اشاره کردیم، گوش انسان در بهترین حالت قادر به شنیدن ۲۰ کیلوهرتز است، تازه در دورانی از زندگی که بینقصترین شنوایی ممکن را داشته باشد. اکثر مردم پاسخدهی فرکانسی پایینتری نسبت به این رقم دارند.
اینکه صدا فرکانسی فراتر از تواناییهای شنیداری انسان داشته باشد، مثل این است که تلویزیونی بخریم که نورهایی فراتر از تواناییهای بصری انسان به نمایش در میآورد. توانایی شما در شنیدن صدای ۹۶ کیلوهرتز مثل توانایی شما در دیدن اشعه ایکس است. سادهتر بگوییم، چنین توانایی ندارید.
بازتولید صدا با چنین فرکانسی ضمنا فشاری مضاعف به تجهیزات و درایورها وارد میکند و این خود به شکلگیری اعوجاج هرچه بیشتر منجر میگردد. این اعوجاج در دامنه قابل شنیدن قرار میگیرد و این یعنی در حال خراب کردن صدایی که میتوانید بشنوید، در ازای صدایی که نمیتوانید بشنوید خواهید بود.
برخی میگویند فرکانسهای فراتر از توانایی شنیداری انسان، روی فرکانسهایی که میتوانیم بشنویم تاثیر میگذارند و در نتیجه، استفاده از آن فرکانسهای اضافه در نهایت موجب بهبود بیتهایی که میشنویم خواهند شد. اما هیچ مدرک مستدلی پشت این ادعا نیست.
موضوع اصلی این است که عمق بیت و نرخ نمونهبرداری بالاتر واقعا مزیتهایی به همراه میآورند، اما در صورتی که مشغول به تولید موسیقی باشیم. همهچیز مثل فرمت تصویر RAW است. کار کردن روی ترکی صوتی که عمق بیت بیشتر دارد باعث میشود تنظیم سطوح صدا آسانتر شود. اصلیترین مزیت سطح نویز کمتر است که اگر چندین ترک را لایهلایه روی هم بگذارید، افزایش مییابد. بنابراین اگر تمام ترکها ۲۴ بیتی یا بالاتر از مقدار نرمال باشند، سطح نویز باز هم بسیار کم است. همین موضوع راجع به نرخ نمونهبرداری و پاسخدهیهای فرکانسی بالاتر هم مصداق دارد. اما به محض اینکه کارتان با تولید ترک موسیقی تمام شد، میتوانید از آن خروجی ۱۶ بیتی و ۴۴.۱ کیلوهرتزی بگیرید و همچنان یک خروجی بینقص خواهید داشت.
گفتن اینکه صدای رزولوشن بالا مزایایی محسوس برای انسانها و هنگام گوش سپردن به موسیقی به همراه میآورد، دشوار است. اکثر افرادی که مدعی شنیدن صدایی متفاوت میشوند، شاید خیلی ساده در حال گوش دادن به ورژنی متفاوت از ترک باشند: بسیاری از موسیقیهایی که با صدای رزولوشن بالا عرضه شدهاند بعدا ریمستر هم شدهاند که میتواند برخی اجزای صدا را شدیدا متفاوت کند. آنچه دارد در اینجا تفاوت به وجود میآورد، مسترینگ صدا است که در گذشته کمتر صورت میگرفت و این روزها شاهد بازنشر موسیقیها بعد از ریمستر شدنشان هستیم. در چنین ترکهایی، صدا حتی از استاندارد CD هم بهتر خواهد بود. بنابراین هنگام مقایسه کیفیت صدا میان دو فرمت، باید اطمینان حاصل کرد که مستری واحد استفاده میشود.
صدای فضایی (Spatial Audio)
اپل علاوه بر انتشار خبر پشتیبانی از صدای Lossless در اپل موزیک، به تایید حضور تکنولوژی Spatial Audio یا صدای فضایی (فراگیر) هم پرداخته است. اگر بخواهیم دقیق باشیم، اپل مدعی شده که از صدای فضایی همراه با Dolby Atmos روی اپل موزیک پشتیبانی میشود. تمام اینها به چه معناست؟
بیایید ابتدا به صحبت راجع به دالبی اتموس بپردازیم. دالبی به در اختیار داشتن چندین کدک صدای فراگیر مشهور است و یکی از بزرگترین نامها در دنیای صدای سینمایی به حساب میآید. اما فرمتهای صدای فراگیر سنتی همواره به پشتیبانی از کانالهایی مجزا مانند ۵.۱ یا ۷.۱ پرداختهاند. این یعنی هنگام مسترینگ در این فرمتها، بسته به جایی که کارگردان میخواست صدا از آن به گوش برسد، صدا باید در یکی از این کانالها قرار میگرفت.
دالبی اتموس حالا صدای شی-محور را جایگزین صدای کانال-محور کرده است. این یعنی هنگام مسترینگ، مهندس صدا صرفا باید صدا را در محیطی سهبعدی و پیرامون شنونده قرار دهد و سپس سیستم خودش تشخیص میدهد که از کدام اسپیکر برای بازتولید آن استفاده کند. از سوی دیگر این بدان معناست که اتموس در تئوری بینهایت کانال دارد، زیرا میتوانید اسپیکرهای هرچه بیشتر را به محیط صدای کرده و حس غوطهوری ناشی از صدا را افزایش دهید. چنین کاری را نمیتوان با فرمتهای کانال-محور به انجام رساند.
اتموس حتی گام را از این فراتر گذاشته و به سراغ عنصر ارتفاع در صدا میرود. این یعنی میتوانید اسپیکرهایی را روی سقف قرار دهید و صدا به گونهای انکد میشود که گویی بالای سر شما قرار دارد. به این ترتیب غوطهوری میان صدا افزایش مییابد و اساسا میتوان صدا را از هر جهتی پخش کرد: درست مانند زندگی واقعی.
دالبی اتموس در موسیقی هم به صورتی مشابه عمل میکند: تولیدکننده میتواند موزیکی بسازد که هنگام گوش سپردن به آن با اسپیکرهای فراگیر و کانالهای ارتفاعی، صدایش از همه طرف به گوش میرسد. در نتیجه شما درون نوعی کره صوتی قرار گرفته و حس میکنید در جایی خاص هستید. مثلا فرض کنید که صدای یک اجرای زنده با این تکنیک ضبط شود و شما به آن گوش بسپارید.
حالا اپل این ترک صوتی را برداشته و آن را از میان تکنولوژی دیگری تحت عنوان صدای فضایی عبور میدهد. صدای فضایی پیشتر نیز برای محتویات ویدیویی و هنگام متصل کردن ایرپاد پرو و ایرپاد مکس به یکی از دیوایسهای اپل در دسترس بوده است. هنگام پخش محتوای دالبی اتموس روی آیفون یا آیپد، ایرپاد پرو و ایرپاد مکس از داده موجود درون ترک صوتی برای شبیهسازی یک کره سهبعدی از صدا پیرامون شما استفاده میکنند. علاوه بر این، با استفاده از شتابسنج و ژیروسکوپ موجود در این مدلهای ایرپاد، حرکات سر شما پایش میشوند و صدا همراه با سر شما حرکت میکند. درست مانند دنیای واقعی.
صدای فضایی در اپل موزیک اینطور کار میکند که حباب صوتی در اطراف شما شکل میگیرد، اما خبری از پایش حرکات سر نیست. از آنجایی که پایش حرکات سر صورت نمیگیرد، حالا میتوان از این قابلیت در مدلهای پایه ایرپاد هم استفاده کند. در واقع این قابلیت با تمام مدلهای ایزپاد و بیتس مجهز به چیپ W1/H1 و همینطور اسپیکر داخلی تمام مدلهای آیفون و آیپد مک که اسپیکر استریو دارند سازگار خواهد بود.
حالا این سوال مطرح میشود که آیا صدای نهایی اصلا خوب هست یا خیر. بخواهیم روراست باشیم، صدای فراگیر یکجورهایی افتضاح است. این مشکلی نیست که ناشی از فرمت باشد و بیشتر به موسیقیها مربوط میشود. هر از چندگاهی به ترکی برمیخورید که به صورت خاص برای نمایش تواناییهای صدای فراگیر طراحی شده و بسیار باحال ظاهر میشود. اما موزیکی که به صورت معمول به آن گوش میدهید، یعنی مسترهای صدای فراگیر ترکهای محبوب که توسط استودیوهای مختلف عرضه میشوند، صدای آنقدرها خوبی تولید نمیکنند. این موضوع به صورت خاص راجع به آلبومهای استودیویی مصداق دارد که در اصل برای پخش روی اسپیکرهای استریو تولید شدهاند و به صورت فراگیر بسیار عجیب و آشفته به گوش میرسند. این مشکل آنقدر شایع است که در نهایت ترجیح میدهید به سراغ ورژن استریوی استاندارد بروید.
میتوان تصور کرد که این تکنولوژی چه مزایایی برای آلبومهای کنسرتی به ارمغان میآورد، اما نمونههای موجود چندان زیاد نیستند. در نهایت میتوان به این تکنولوژی خوشبین بود، ولی اگر در حال حاضر به تجهیزات لازم برای گوش سپردن به صدای فضایی دسترسی ندارید نگران نباشید، چیز زیادی از دست ندادهاید.
تکلیف صدای بلوتوثی چیست؟
تا به اینجای کار عمدتا درباره صدا در قلمروی سیمی صحبت کردیم. اما این روزها بسیاری از مردم به موسیقیهای خود روی دیوایسهای بلوتوثی گوش میسپارند. چه موضوع صحبت ایربادهای بلوتوثی مانند ایرپاد باشد، چه هدفونهای بلوتوثی مثل سونی WH-1000XM4، چه اسپیکرهای بلوتوثی و چه صدای درون ماشین که با بلوتوث پخش میشود.
بلوتوث یک لایه به پیچیدگی شرایط اضافه میکند و هنگام استفاده از آن مجبور به سازش نیز خواهید شد. تمام اصواتی که از طریق بلوتوث انتقال مییابند، فشرده شدهاند. تکتک کدکهای بلوتوثی که اکنون در اختیار داریم، از SBC و aptX گرفته تا LDAC و LHDC، کدکهای لاسی هستند. تا داریم به این موضوع میپردازیم بیایید یک افسانه قدیمی را هم تکذیب کنیم: اگر موزیک شما فرمت AAC داشته باشد و هدفونها و دیوایس بلوتوثی هم از AAC برای انتقال صدا استفاده کنند، موسیقی کماکان فشردهسازی و مجددا انکد میشود. بنابراین شاهد انتقال دقیقا همان موسیقی نیستیم.
این صرفا چگونگی کارکرد تکنولوژی بلوتوث در دوران کنونی است. بلوتوث به پهنای باند لازم برای مخابره صدای Lossless با کدکهای کنونی دسترسی ندارد، مخابره فشردهسازی نشده که بماند. بعید نیست یک روز شاهد از راه رسیدن کدکی آنقدر بهینه باشیم که تمام داده اصلی را در خود جای دهد، هیچ حذفیاتی نداشته باشد و همچنان از پهنای باند ناچیز بلوتوث عبور کند. اما چنین کدکی هنوز در دسترس قرار نگرفته است.
دیدگاهها و نظرات خود را بنویسید
برای گفتگو با کاربران ثبت نام کنید یا وارد حساب کاربری خود شوید.
یک مقاله عالی و یک ترجمه و تدوین عالی تر . تشکر از شایان ضیایی عزیز
واقعا اون قسمت مقاله که گفته کیفیت بیشتر از 16 بیت 44 کیلوهرتز نیاز نیست رو قبول دارم ... حقیقتا فرقی نمیکنه .. باز حالا شاید اگر 24 بیت باشه یک کم نویز ( دیتر ) کمتر بشه .. ولی ارزشش رو نداره ... این ها فقط و فقط بازی با اعداد هست .
کما اینکه شما یک ماینتور داشته باشه ، که 120 فریم در ثانیه باشه .. و مانیتور دیگه ای که 240 فریم ، ابدا فرقی بین اون حس نمیکنی ( حالا شاید بین 30 و 60 فریم و 120 تفاوت حس بشه .. ولی خدایی بین 120 و 240 تفاوتی نیست)
راستی .... اینم اضافه کنم ... گوش نود و نه درصد از انسانها ، نمیتونه فرق بین یک ام پی تری 320 و یک فایل فشرده نشده رو تشخیص بده ...
(حتی اونها که کار میکس و مسترینگ انجام میدند و گوشی بیسار دقیق دارند)
دیگه 16 و 24 بیت که جای خود دارد
ولی خوب ... به شخصه ، اصلا و ابدا ام پی تری که کمتر از 256 باشه رو گوش نمیدم و همیشه سعی میکنم آهنگ هایی که 320 هستند رو دانلود کنم
مهمترین مزیت فایل های فشرده نشده امکان ادیت کردن اونهاست
کما اینکه شما اگر یک فایل راو داشته باشی و ادیت اش کنی ، خیلی بهتر از فایل جی پی جی ادیت میشه ...
ولی بعد از اینکه کار ادیت ات تموم شد ، همون جی پی جی ساده هم
اپل اومد از یک طرف جک سه و نیم میلیمتری رو حذف کرد ، از اون طرف هم اومده و فایل های رس و فشرده نشده میده به مردم ... که بروند و با ایر پاد ( که فشرده میکنه صدا رو برای انتقال دادن ) گوش کنند
واقعا احمقانه بود حذف جک سه و نیم میلیمتری ..