Sunday, 05 July, 2020

دسته: زبان‌شناسی رایانشی


برای ارزیابی MT و اندازه‌گیری کفایت (adequacy) به مقایسه با جمله مرجع نیاز است. مفهوم کفایت می‌تواند با «چه مقدار از معنا در متن منبع در ترجمه بیان شده است؟» منطبق شود. جواب این پرسش یک مقیاس ۵-نقطه‌ای _All/_Most/_Much/_little/_None را به دست می‌دهد. در جایی که جمله مرجع در دسترس نباشد اندازه‌گیری کفایت به جمله‌ی مرجع ندارد، این نوع از ارزیابی به وسیله زبان‌شناس معتبر انجام می‌گیرد اما می‌تواند به وسیله متخصص آموزش‌دیده دوزبانه هم انجام پذیرد.


در زبان‌های طبیعی واژه‌های بسیاری وجود دارند که بسته به بافتاری که در آن قرار گرفته‌اند، تفاسیر مختلفی از معنی آن‌ها به عمل می‌آید. این دسته از واژه‌ها در متن، مبهم شناخته می‌شوند. از این رو عمل تعیین معنای صحیح واژه را با توجه به بافتار، ابهام‌زدایی معنایی واژه (WSD) می‌نامند. واژه‌ها اجزای اولیه‌ی ساختار زبان طبیعی هستند، بنابراین درک و فهم آن‌ها لازمه‌ی پردازش خودکار زبان طبیعی است. ابهام‌زدایی معنایی واژه اصطلاحی است که به استخراج معنی صحیح و مناسب از واژه‌هایی که چندمعنایی هستند، گفته می‌شود. در هر زبان واژه‌هایی مبهم وجود دارند که دارای معانی متفاوتی هستند. مسأله‌ی یافتن معنای صحیح واژه‌ی دارای معانی متعدد، از مسایل جاری در حوزه‌ی پردازش زبان‌های طبیعی محسوب می‌شود. ابهام‌زدایی معنایی واژه‌ها یک عملیات میانی ضروری برای کاربردهای مختلفی نظیر ترجمه‌ی ماشینی، بازیابی اطلاعات، پرسش و پاسخ و خلاصه‌سازی محسوب می‌شود.


وردنت یک پایگاه داده‌ی بزرگ انگلیسی است. اسم‌ها، فعل‌ها، صفت‌ها و قیدها در مجموعه‌های مترادف شناختی (مجموعه‌مترادف‌ها) دسته‌بندی شده‌اند که هر کدام یک فاصله‌ی مفهومی را بیان می‌کنند. مجموعه‌مترادف‌ها به استفاده از روابط مفهومی‌ـ‌معماشناختی و واژگانی به‌هم پیوند داده شده‌اند.