منابع پایان نامه درباره :غنی سازی سیگنال گفتار مبتنی بر روش تفریق طیفی و تجزیه مقادیر منفرد- ...

(۲-۲۹)

که I₁(y), I₀(y) ضرایب تابع بسل درجه صفر و درجه اول می باشند.
برخلاف متوسط گیری اندازه^[۸۱] ، که بدون توجه به اینکه فریم، نویز یا گفتار را داراست، متوسط گیری انجام می شود، تخمین گر MMSE پیشنهاد شده فقط زمانی که SNR کم است، یک نرم کننده غیر خطی را انجام می دهد. طبق این روش، مشاهده شده که نویز موزیکال کم رنگ تر است. این روش همچنین اغتشاش را نسبت به متوسط گیری کاهش می دهد.
۲-۴-۵- تفریق طیفی بر مبنای ویژگی های ادراکی^[۸۲] :
همانطور که قبلاً توضیح دادیم با بهسازی گفتار، سعی می کنیم تا کیفیت گفتار را با افزایش SNR افزایش دهیم اما هیچ افزایش مهمی در مفهوم بودن گفتار رخ نمی دهد که به علت خصوصیات نا ایستایی گفتار و دیگر ویژگی های آن می باشد. برای رفع این مشکل محققین تلاش کرده اند تا خصوصیات ادراکی^[۸۳] انسان را نیز در پردازش و بهسازی وارد کنند.

Virag ]3[ یک تکنیک بر مبنای خاصیت ماسک کردن سیستم شنوایی انسان پیشنهاد کرد، یعنی بر مبنای خصوصیتی که صداهای ضعیف با صداهای قوی تر که به شکل ناگهانی اتفاق می افتند، ماسک می شوند. مقدار آستانه^[۸۴] برای ماسک کردن محاسبه می شود که این امر با مدل کردن انتخاب فرکانس گوش انسان و خصوصیات ماسک کردن انجام می شود. تابع گین G(w) به شکل زیر محاسبه می شود:

(۲-۳۰)

که این تابع به عنوان یک فیلتر متغیر با زمان عمل می کند و با عبور گفتار آغشته به نویز از آن، خروجی، سیگنال غنی شده خواهد بود. در رابطه فوق فاکتور ، فاکتور تفریق بیش از حد و فاکتور نیز فاکتور کف طیفی می باشد که تابعی از آستانه ماسک کردن^[۸۵] T(w) هستند. توان های و سرعت انتقال G(w) را مشخص می کنند. آستانه ماسک کردن T(w) نیز با به کارگیری یک تابع گسترده در طول باندهای بحرانی^[۸۶] طیف سیگنال گفتار محاسبه می شود.
Kim و همکارانش ]۱۴[ یک روش مشابه بر مبنای خواص ماسک کردن و وابسته به فونتیک^[۸۷] را پیشنهاد کرد. این روش از تفریق وابسته به حالت^[۸۸] گفتار استفاده می کند و نویز موزیکال را با آستانه ماسک حذف می کند.
ثابت شده است که این روش ها کیفیت گفتار را در مقایسه با مدل های ریاضی خالص برای گفتار و سیگنال های نویز بهبود می دهند. اما در عین حال افزایش پیچیدگی در پیاده سازی نیز اجتناب ناپذیر است.
۲-۴-۶- روش های تفریق طیفی وابسته به فرکانس^[۸۹] :
Lockwood & Boudy ]15[ روش تفریق طیفی غیر خطی را پیشنهاد کردند که مبتنی بر تفریق طیفی خطی پیشنهاد شده توسطBerouti ]12[، می باشد. در این روش، فاکتور تفریق بیش از حد^[۹۰] در هر فریم از گفتار ورودی، وابسته به فرکانس است. بنابراین، تفریق روی رنج فرکانس های طیف، غیر خطی است. طیف گفتار غنی شده را می توان به شکل زیر بیان کرد:

(۲-۳۱)

که i اندیس فریم است و طیف گفتار نویزی هموار شده^[۹۱] مربوط به فریم i اُم می باشد و نیز فاکتور تخمین بیش از حد^[۹۲] وابسته به فرکانس است که به شکل زیر محاسبه می شود:

(۲-۳۲)

یا آنکه از رابطه زیر محاسبه می شود:

(۲-۳۳)

موضوعات: بدون موضوع لینک ثابت

فرم در حال بارگذاری ...

فید نظر برای این مطلب