ارائه روشی جدید مبتنی بر شبکه عصبی RWKV، برای تشخیص مقالات خودمتناقض در دانشنامه فارسی

نوع مقاله : مقاله علمی-ترویجی

نویسنده

sbejani@ihu.ac.ir

چکیده

در دانشنامه فارسی یکی از قابلیت‌های لازم تشخیص جملات متناقض در هر متن است تا از این طریق خدمات مناسب برای کاربران فراهم شود. تا کنون در داخل کشور برای تشخیص تناقض در متن‌های فارسی کارهای تحقیقاتی کمی انجام گرفته است که از دقت کافی برخوردار نیستند. این تحقیق به بررسی و ارزیابی یک روش نوین برای تشخیص جملات متناقض در یک متن‌ فارسی با استفاده از شبکه عصبی RWKV پرداخته است. هدف اصلی این تحقیق، تشخیص جملات متناقض در یک متن فارسی با استفاده از داده‌های مجموعه‌داده FarsTail با دقت بالا است. بر اساس روش تحقیق، شبکه عصبی مناسب RWKV به عنوان یک مدل یادگیری عمیق انتخاب شد. در ادامه تنظیم دقیق مدل یاد شده جهت وظیفه تشخیص تناقض در متن، بارگذاری مدل و داده‌ها، پیش‌پردازش داده‌ها، تنظیم دقیق مدل با داده‌های پیش پردازش شده و سپس ارزیابی مدل انجام گرفت. لازم به بیان است که داده‌ها به سه دسته‌ی استنتاجی ، متناقض و خنثی تقسیم‌بندی شده و پس از پیش‌پردازش، مدل آموزش‌دیده و برای تشخیص جملات متناقض در یک متن فارسی به کار گرفته شد. ارزیابی مدل با استفاده از ماتریس درهم‌ریختگی و محاسبه‌ی معیار‌های مختلفی از جمله دقت، دقت پیش‌بینی مثبت، بازخوانی و امتیاز F1 انجام شد. نتایج ارزیابی نشان داد که مدل RWKV با دقت ۰۶/۹۵% و امتیاز F1 برابر با ۰۳/۹۲%، توانایی بالایی در شناسایی جملات متناقض در یک متن، نسبت به کارهای مشابه قبلی دارد. مقایسه‌ی عملکرد مدل RWKV با مدل‌های دیگر مانند mBERT، ESIM، HBMP وDecompAtt حاکی از برتری RWKV در تفکیک کلاس‌های.

کلیدواژه‌ها