کوانتیزه کردن
خطی
فواصل ثابت
مستقل از دامنه
غیر خطی
فواصل متغیر
افزایش فواصل در دامنه های بالا
نگاشت لگاریتمی
مدولاسیون داده
به جای کد کردن دامنه واقعی فقط افزایش یا کاهش را به کمک یک بیت کد کنیم
PCM Differential
Differential PCM = DPCM
تفاضل دامنه فعلی با دامنه قبلی توسط بیت های کمتر
ADPCM
Adaptive Differential PCM
بخش های ساکت بیت کمتر
بخش های شلوغ بیت بیشتر
فشرده سازی به روش Psycho-Acoustic
حذف بخش های غیر قابل شنود
تاثیرات ماسکها
یک سیگنال با دامنه زیاد سیگنالهای کم دامنه مجاور خود را ماسک میکند
MPEG AUDIO
فشرده سازی:
32 ، 64 ، 96 ، 128 یا 192 کیلو بیت درثانیه
کانالها:
تک باند (mono )
دو باند مستقل
استریو مشترک Joint Stereo
MPEG AUDIO
نرخ نمونه برداری :
32Khz
44.1 Khz
48 Khz
هر نمونه به صورت 16 بیتی
حداکثر تاخیر در گدگذاری و کدگشایی : 80 میلی ثانیه
استفاده از Psycho –acoustic در کوانتیزه کردن
کدگذار و کدگشای MPEG
تاریخچه MP3
Fraunhofer Institut
موسسه تحقیقاتی ( کشور آلمان )
بکارگیری خواص شنوایی انسان برای فشرده سازی صوت
استاندارد –ISO
حداکثر ضریب فشرده سازی برابر با 12
ISO کلیات را بیان کرده
جزئیات وابسته به نحوه پیاده سازی
لایه های صوت در MPEG
Frame ها
شامل 384 نمونه
این نمونه های مربوط به 32 Sub-Band هستند
برای هر sub-band 12 مقدار ذخیره میشود
لایه های صوت در MPEG
لایه 1: ماسک کردن فرکانس
استفاده از فیلتر DCT
بررسی فقط یک فریم
لایه 2 : ماسک موقتی
سه فریم ( قبلی ، فعلی ، بعدی )
شبیه سازی شنوایی انسان
لایه های صوت در MPEG
لایه 3 : ماسک غیرخطی :
فرکانس ها به باندهایی باپهنای متفاوت تقسیم میشوند
کانالهای استریو به صورت تفاضلی کدگذاری میشوند
فشرده سازی ضرایب به روش هافمن
لایه 1
تاثیرات Psycho- Acoustic
حساسیت گوش انسان
لایه 1
تاثیرات ماسک فرکانس
یک سیگنال با فرکانس 1KHz (فرکانس ماسک ) تولید میکنیم سپس سیگنالی با فرکانس نزدیک به آن مثلا 1.1KHz و با شدت کم تولید میکنیم دامنه این فرکانس را به تدریج افزایش میدهیم تا شنیده
لایه 1
فشرده سازی
سیگنال اصلی به 32 باند اصلی تقسیم میشود Critical Band
برای هر باند رویه ماسک تعریف میشود که نشان میدهد کدام سطح از سیگنال می تواند توسط باندهای مجاور ماسک شود .
لایه 1
الگوریتم :
محاسبه انرژی در هر باند
اگر انرژی آن کمتر از انرژی باند مجاور است آن را کدگذاری نکن
درغیراینصورت باند را کدگذاری کن
ضرایب را کوانتیزه کن
فاکتور کوانتیزه را به گونه ای انتخاب کن که خطای آن کمتراز فاکتور ماسک باشد ( هر بیت کوانتیزه معادل 6db است)
مثال
سطوح مربوط به 16 باند ازبین 32 باند اول
12
15
لایه 2 – فشرده سازی< >تاثیرات Psycho-Acoustic Temporal Masking : یک صدای قوی که ناگهان قطع میشودآزمایش :یک سیگنال قوی مثلا 60db با فرکانس 1kHz پخش میشود همراه با آن یک سیگنال ضعیف 40db با فرکانس 1.1KHz پخش میکنیم ( این سیگنال ماسک میشود)با قطع سیگنال تست برای مدت زمان مشخضی سیگنال ضعیف نیز شنیده نمیشود
لایه 2 – فشرده سازی
< >آزمایش بالا را با فرکانسهای مختلف تکرار میکنیم
(نمودار و تصاویر در فایل اصلی موجود است)