پردازش گفتار
یاسر شکفته؛ فرشاد الماسگنج
دوره 6، شماره 1 ، خرداد 1391، ، صفحه 17-33
چکیده
تحقیقات اخیر نشان میدهد که تظاهرات غیرخطی و آشوبی سیگنال گفتار میتواند در حوزة فضای بازسازی شده فاز (RPS) مطالعه شود. تئوری جاسازی برمبنای محورهای تأخیری، ابزار مناسبی برای بررسی تراژکتورهای گفتاری در RPS است. تاکنون از مشخصههای تراژکتورهای گفتاری به ندرت در سیستمهای کاربردی بازشناسی گفتار استفاده شده است. از اینرو در این مقاله ...
بیشتر
تحقیقات اخیر نشان میدهد که تظاهرات غیرخطی و آشوبی سیگنال گفتار میتواند در حوزة فضای بازسازی شده فاز (RPS) مطالعه شود. تئوری جاسازی برمبنای محورهای تأخیری، ابزار مناسبی برای بررسی تراژکتورهای گفتاری در RPS است. تاکنون از مشخصههای تراژکتورهای گفتاری به ندرت در سیستمهای کاربردی بازشناسی گفتار استفاده شده است. از اینرو در این مقاله روش استخراج ویژگی جدیدی براساس پارامترهای مدلسازی خطی مبتنی بر روش AR برداری (VAR) پیشنهاد شده است. در این روش بوسیله ماتریس ضرایب فیلتر و یا ضرایب انعکاسی به دست آمده از اعمال روش VAR بر مشخصههای استاتیک و دینامیک تراژکتوری های گفتاری شکل یافته در RPS، یک بردار ویژگی با بُعد زیاد حاصل میشود که میتوان از روشهای نگاشت خطی برای کاهش بُعد مناسب آن استفاده کرد. نتایج آزمایشهای بازشناسی واج مجزا و پیوسته بر مجموعه دادگان گفتاری فارسدات نشان میدهد که کارایی این روش در مقایسه با دیگر روشهای متداول استخراج ویژگی مبتنی بر حوزة زمان مانند روش LPC و LPREF بیشتر است.