نرمالایز صدا چیست؟
نرمالایز صدا یعنی تغییر حجم کلی آن به میزان ثابتی برای رسیدن به یک سطح هدف. این با فشرده سازی متفاوت است که حجم را در طول زمان در مقادیر مختلف تغییر می دهد. مانند فشردهسازی روی دینامیک تأثیر نمیگذارد و در حالت ایدهآل صدا را به هیچ وجه به جز تغییر صرفاً حجم آن تغییر نمیدهد.
چرا می خواهیم این کار را انجام دهیم، بهترین راه برای انجام آن چیست و چه خطرات پنهانی از نظر کاهش کیفیت صدا وجود دارد؟ بیایید دریابیم!
چرا صدا را نرمالایز کنیم؟
فقط دو دلیل خوب برای نرمالایز وجود دارد:
۱. به دست آوردن حداکثر حجم
اگر فایل صوتی آرامی دارید، ممکن است بخواهید آن را تا حد امکان بلند کنید (۰ dBFS) بدون تغییر دامنه دینامیکی آن. این فرآیند در زیر نشان داده شده است.
۲. تطبیق حجم
اگر گروهی از فایلهای صوتی با حجمهای مختلف دارید، ممکن است بخواهید همه آنها را تا حد امکان به یک صدا نزدیک کنید. ممکن است ضربه های انفرادی به دام یا حتی میکس کامل باشد.
نرمالایز را می توان به طور خودکار بدون تغییر صدا مانند فشرده سازی انجام داد. در حالی که این یک مزیت بزرگ است، نمیتواند جایگزین فشردهسازی شود، زیرا نمیتواند بر پیکها در ارتباط با حجم صدا تأثیر بگذارد.
این بدان معناست که شما کنترل بسیار کمتری دارید. معمولاً نرمالایز کردن صدا فقط برای مطابقت با سطوح صدا کار نمی کند، مهندسان مسلط نیازی به خواب ندارند.
بهترین روش برای نرمالایز صدا چیست؟
روش های مختلفی برای اندازه گیری حجم صدا وجود دارد. ابتدا باید تصمیم بگیریم که چگونه حجم را اندازه گیری کنیم قبل از اینکه بتوانیم نحوه تغییر آن را محاسبه کنیم، نتایج بسته به روشی که استفاده می کنیم بسیار متفاوت خواهد بود.
تشخیص اوج حجم
این فقط میزان صدای پیک شکل موج برای تعیین حجم کلی فایل را در نظر می گیرد. اگر می خواهید صدا را تا حد ممکن بلند کنید، این بهترین روش است.
در صدای دیجیتال نمیتوانید صدایی بلندتر از بالاترین پیک در ۰ dBFS داشته باشید، بنابراین با نرمال کردن این مقدار، بلندترین فایلی را که میتوانید ایجاد کنید.
تشخیص حجم RMS
این بلندی “کلی” یک فایل را در نظر می گیرد. ممکن است قله های بزرگ، اما بخش های نرم تر نیز وجود داشته باشد. میانگین می گیرد و آن را حجم صدا می کند.
این روش به نحوه عملکرد گوش انسان نزدیک تر است و نتایج طبیعی تری را در فایل های صوتی مختلف ایجاد می کند.
ما هنوز محدود به این واقعیت هستیم که صدای دیجیتال نمی تواند از ۰ dBFS بالاتر برود. این به این معنی است که برای ایجاد یک گروه از فایلهای صوتی با حجم یکسان، ممکن است لازم باشد همه آنها را کم کنیم تا هیچکدام از پیکهایشان کلیپ نشوند (بیش از ۰ dBFS). این ممکن است مطلوب نباشد، یک مثال می تواند در مسترینگ باشد.
مشکل دیگر این است که تشخیص صدای RMS واقعاً شبیه شنوایی انسان نیست. انسان ها فرکانس های مختلف را در حجم های مختلف درک می کنند. این در منحنی فلچر-مونسون در زیر نشان داده شده است.
اگر یک فایل صوتی فرکانس های زیادی بین ۱۰۰۰ تا ۶۰۰۰ هرتز داشته باشد همانطور که در نمودار نشان داده شده است، صدای آن بلندتر خواهد بود.
RMS این را در نظر نمی گیرد. خوشبختانه یک راه حل اخیر وجود دارد، استاندارد جدید در پخش صدا، EBU R 128 با عنوان جذاب.
تشخیص صدا EBU R 128
این روشی مشابه برای اندازه گیری حجم به عنوان RMS است، اما می توان آن را شبیه سازی گوش انسان در نظر گرفت. این صدا را هوشمندانه گوش می دهد و فکر می کند که چگونه آن را بشنویم. درک می کند که ما فرکانس های بین ۱۰۰۰ تا ۶۰۰۰ هرتز را بلندتر می شنویم و آن را در نظر می گیرد.
ما هنوز همان مشکل ۰ dBFS را داریم که برای RMS ذکر شد، اما اکنون فایلهای صوتی نرمالشده متفاوت باید از نظر حجم صدای بسیار سازگارتری داشته باشند.
خطرات پنهان چیست؟
نرمالایز را می توان در یک برنامه مستقل، معمولاً یک ویرایشگر صوتی (مانند Sound Forge)، یا در داخل DAW انجام داد. به خاطر این بخش، فرض می کنیم که از یک ویرایشگر صوتی استفاده می کنید.
در داخل یک پروژه DAW چند تراک، زمانی که فایلهای نرمالشده را بهصورت جداگانه صادر نمیکنید، احتمالاً از مشکلاتی که اکنون به آن اشاره میکنیم رنج نخواهید برد.
- نرمال سازی پیک تا ۰ dBFS ایده بسیار بدی برای هر قطعه ای است که در یک ضبط چند آهنگ استفاده می شود. ممکن است به خودی خود کلیپ نشود، اما به محض افزودن هر پردازش اضافی یا پخش آهنگ به طور همزمان ممکن است DAW یا افزونه های شما بیش از حد بارگذاری شوند. این موضوع تحت “بهبود مرحله بندی” قرار می گیرد، موضوع بزرگی که در آینده باید به آن پرداخته شود.
- این یک فرآیند مخرب است. انجام هر گونه پردازش دیجیتالی روی یک فایل، آن را تغییر می دهد. شهرت بد آن عمدتاً در روزهایی به دست آمد که پرونده های دیجیتال همه به صورت ۱۶ بیتی ذخیره می شدند. اگر صدا را کم کنید، عمق بیت را به طور موثر کاهش داده اید. فایل ۱۶ بیتی با کیفیت CD شما ممکن است به ۱۲ بیت یا کمتر برسد. حتی روشن کردن آن با اوج نرمال سازی باعث آسیب شد.
امروزه نرم افزار ویرایش صدا به صورت داخلی در عمق بیت بسیار بالاتر (اغلب ممیز شناور ۳۲ بیتی) کار می کند. این بدان معنی است که محاسبات بسیار دقیق تر انجام می شود و بنابراین کیفیت صدا را بسیار کمتر تحت تأثیر قرار می دهد. این فقط در صورتی است که فایل را پس از پردازش در وضوح بالاتر نگه داریم!
برای استفاده از کیفیت بالای عمق بیت بالا در نرم افزار ویرایش صدا ، مطمئن شوید که تمام فایل های موقت شما به صورت ممیز شناور ۳۲ بیتی ذخیره می شوند. همچنین اگر میخواهید پردازش بیشتری انجام دهید، آنها را در این قالب ذخیره کنید.
نکات مهم دیگری که باید در نظر گرفته شود
- مردم اغلب صدای خود را در اوج نرمال می کنند تا بتوانند شکل موج ها را واضح تر روی صفحه ببینند. این ایده بدی است، نرم افزار شما باید گزینه ای برای بزرگتر کردن شکل موج بدون استفاده از تغییر دائمی فایل صوتی داشته باشد.
- برای تطبیق سطوح صدا برای آهنگ های تمام شده نرمالایز مجازی در بسیاری از پخش کننده های رسانه (از جمله foobar2000) امکان پذیر است، که محبوب ترین آنها ReplayGain نام دارد. هدف ReplayGain این است که سعی کند تمام آهنگ های مختلف موسیقی را با همان میزان صدا بدون تغییر فایل واقعی پخش کند. این کار با اندازهگیری حجم RMS یا EBU R 128 یک فایل و سپس تصمیمگیری میزان کاهش آن برای مطابقت با سایر موسیقیها نیز با استفاده از سیستم ReplayGain کار میکند. این شکل در داخل فایل صوتی ذخیره می شود، هنگام پخش آن نرم افزار می تواند خودش صدا را کم کند. این کامل نیست، اما روش بسیار جالبی است که آهنگ های مختلف را در یک سطح صدا بشنوید و جنگ بلندی را به اتلاف زمان تبدیل کنید.
به طور خلاصه، نرمالایز سازی یک ابزار بسیار مفید است، اما همچنین می تواند به راحتی مورد سوء استفاده قرار گیرد و باعث از دست دادن غیر ضروری کیفیت صدا شود. درک تفاوت بین حجم پیک و RMS حیاتی است. با احتیاط استفاده کنید. پیشنهاد میکم برای اینکه کاملا این موضوع را یاد بگیرید آموزش میکس و مسترینگ را ببینید.
دیدگاهتان را بنویسید
برای نوشتن دیدگاه باید وارد بشوید.