به گزارش تجارت آنلاین و به نقل از فارس، احتمالا برای شما هم پیش آمده است که برای یافتن پاسخ سوالات خود در مورد مسائل شرعی به عالمان دینی و رسالههای توضیحالمسائل مراجعه کنید. احتمالاً از نرمافزارهای رایانهای هم برای جستجو در متن توضیحالمسائلها استفاده کردهاید. اما نرمافزاری که دکتر ابوالقاسم میرروشندل و دانشجویان وی در گروه مهندسی کامپیوتر دانشگاه گیلان مشغول به توسعه آن هستند با برنامههای موجود متفاوت است. سوال شرعی از شما، پاسخ دقیق از نرمافزار. در همین خصوص گفتگوی کوتاهی با این استاد جوان دانشگاه انجام دادهایم که گزارش آن را در ادامه میخوانید.
فارس: «سامانه پرسش و پاسخ احکام» نام پروژهای است که در حال انجام هستید، درباره نرمافزار حاصل از این پروژه برایمان بگویید.
امروزه نسل جدید از خواندن کتاب گریزان هستند و رو به منابع دیجیتالی آوردهاند. عمل به شیوه سنتی در موضوعاتی چون آموزش احکام مانع یادگیری مسائل در این حوزه میشود. یکی از کارکردهای اصلی این نرمافزار این است که اگر افراد و به خصوص جوانان حال و حوصله مراجعه به کتابهایی چون توضیحالمسائل را ندارند، سوالات شرعی خود را به راحتی از این نرمافزار بپرسند و پاسخ آن را دریافت نمایند، حکم فلان مسئله چیست، آیا این کار حلال است یا حرام و سوالاتی از این قبیل.
فارس: تفاوت پرسش و پاسخ خودکار با جستجوهای معمولی چیست؟
جستجوهای معمولی عموماً بر اساس ظاهر کلمات انجام میپذیرد. یک کلمه یا در منابع مورد جستجو وجود دارد یا ندارد. برای مثال شخصی ممکن است عبارت «نماز در مسجدالحرام» را جستجو کند. برای بازگرداندن نتایج جستجو باید همان کلمات به همان ترتیب وجود داشته باشد، اما اگر شما کلمات مشابه را جستجو کنید، مثلاً به جای «نماز در مسجدالحرام» عبارت «نماز در مسجد مکه» را جستجو نمایید، سیستم جوابی را برنمیگرداند. مضاف بر اینکه موتورهای جستجوی فهرست بلندی از نتایج را نمایش میدهند که ممکن است بسیاری از آنها بیربط باشند. اما در پرسش و پاسخ خودکار با استفاده از هوش مصنوعی و یادگیری ماشین پاسخ دقیق و گاهی یک کلمهای را برمیگردانیم. در این سیستمها نقش ارتباطات معنایی را لحاظ میکنیم، کلمات مشابه را در نظر میگیریم، باهمآیی کلمات را بررسی میکنیم – ممکن است یک کلمه هنگامی که کنار کلمات دیگر قرار میگیرد معنای خاصی داشته باشد – سیستم چنین موارد را یکجا میبیند و سعی میکند مرتبطترین مطلب به سوال پرسیده شده را برگرداند. به زبان ساده میتوان گفت، پرسش و پاسخ نوعی جستجوی هوشمند خصوصیسازیشده است و نسبت به جستجویهای معمول بسیار دقیقتر عمل میکند.
فارس: از سیستمهای پرسش و پاسخ پیشرفته مانند سیستم واتسون آیبیام در حوزههای حساسی مانند تشخیص پزشکی استفاده میشود. حال، بحث مسائل دینی هم حساسیتهای خاص خود را دارد، از آن جهت که برای مثال مقلدین باید احکام دینی را به درستی انجام دهند، آیا ملاحظاتی در این زمینه وجود دارد؟
همینطور است، این مسئله حساس است و این سیستم به نوعی با اعتقادات افراد طرف است. ما برای این مسئله کارهای مختلفی انجام دادهایم. اول اینکه برای مثال هنگامی که کاربر سوال میکند «حکم خواندن نماز در مکان غصبی چیست؟» هم جواب دقیق و تککلمهای آن را برمیگردانیم مثلاً میگوییم «حرام است»، هم در سطح دیگر پاراگراف و به عبارتی مسئلهای که سیستم جواب تککلمهای را از آن استنباط کرده است را بر میگرداند، به عبارتی مسئله فرضاً 1550 نیز به عنوان پشتیبان برای جواب تککلمهای سیستم نمایش داده میشود و مرتبطترین عبارت یا جمله در مسئله نیز برجسته میشود تا کاربر با مطالعه آن اطمینان صددرصد حاصل نماید. علاوه بر این، همانطور که گفته شد سیستم پرسش و پاسخ مانند سیستمهای جستجوی معمولی فهرست بلند و بالایی از جوابها را بر نمیگرداند اما به خاطر همین بحث حساس بودن، دو سه مسئله به ترتیب احتمال درستی آنها به عنوان پاسخ نمایش داده میشوند. ضمناً ما به دنبال این هستیم که حدی از اطمینان را مشخص کنیم که اگر سیستم به آن حد نرسید، به جای آن که پاسخ غلط بازگرداند پاسخ دهد «نمیدانم!».
فارس: دشواریهای فنی این کار چیست؟ آیا مواد اولیه، یعنی زیرساختهای نرمافزاری و سختافزاری و دانش لازم برای انجام چنین پروژههایی در دسترس است؟
از نظر دانش و بحث فنی واقعاً مشکلی نداریم، تعدادی از بهترین دانشجویانم با نظارت مستقیم بنده در این پروژه مشغول هستند و از این لحاظ مشکلی را احساس نمیکنیم. اما یکی از مسائل اصلی همان بحث مواد اولیه است. برای انجام این کار مرکز تحقیقات کامپیوتری علوم اسلامی یک پیکره ارزشمند که شامل سوال و جوابهای شرعی است در اختیار ما قرار داد، اما این پیکره تمام جزئیاتی که مد نظر ماست را ندارد. اطلاعاتی چون نوع و سطح دشواری سوالات. بنابراین بخشی از زمان ما صرف ایجاد استاندارد و نرمافزار برای توسعه و برچسبگذاری این پیکره شد. بحث دیگری که وجود دارد، فقدان اطلاعات معنایی است. در زبان فارسی شبکههای معنایی عمومی وجود دارد، اما شاید نیاز باشد که ما وردنت مخصوصی را برای اهداف مد نظر در این پروژه ایجاد نماییم. در سطح نحو هم خدا را شکر کار خوبی با عنوان پیکره وابستگی نحوی زبان فارسی با حمایت شورای عالی اطلاعرسانی عرضه شده است، اما باید ما بررسی کنیم که آیا این پیکره که یک پیکره عمومی است در حوزه متون دینی هم به خوبی جواب میدهد یا خیر. اگر بخواهم وارد جزئیات شوم باید بگویم در سطوح اولیهای چون تشخیص مرز کلمات هم دشواریهای فراوانی در زبان فارسی وجود دارد، مثلاً در مواردی که کلمات چندبخشی که با فاصله یا نیمفاصله از هم جدا میشوند. به عبارتی از پائینترین سطح تا سطح معنا مشکلاتی برای پردازش زبان فارسی وجود دارد که ما پیشرفت خوبی در این زمینه داشتهایم. در حال حاضر سیستم پرسش و پاسخ ما مسئلههای حاوی جواب را باز میگرداند اما برای رسیدن به پاسخهای تککلمهای باید هنوز کار شود. در چنین سیستمهایی آنچه اهمیت دارد بالا بردن دقت پاسخگویی است که تولید دادههای مناسب کمک شایانی به این موضوع خواهد کرد.
فارس: سیستمهای پرسش و پاسخ خودکار چه کاربردهای دیگری میتوانند داشته باشند؟
کلاً سیستمهای پرسش و پاسخ یکی از سیستمهای سطح بالا در کنار سیستمهای دیگری چون خلاصهسازها و مترجمهای ماشینی هستند که سیستمهای سطح پایینتر چون تحلیلگرهای صرفی و نحوی در جهت بالا بردن کیفیت اینها توسعه مییابند. مطلبی که در خصوص نحوه توسعه سیستم ما وجود دارد این است که ما میتوانیم با اعمال تغییرات جزئی، در حد 20 تا 30 درصد، این سیستم را در حوزههای دیگر نیز به کار ببریم. برای مثال – اگر بخواهم در همین علوم اسلامی مثال بزنم – این سیستم را میتوان در مورد احادیث و قرآن هم به کار برد. به طور کلی میتوان گفت که در دنیای امروز میزان قابل توجهی از اطلاعات به شکل دیجیتال موجود است. پیدا کردن اطلاعات خاص مورد نیاز ما مهمترین کاری است که باید بر روی آن تمرکز کنیم. جستجوهای عادی برای دسترسی به اطلاعات مورد نظر کافی نیستند و سیستمهای پرسش و پاسخ هستند که میتوانند اطلاعات مدنظر کاربران را از میان حجم انبوه اطلاعات به صورت، دقیق، خلاصه، مختصر و مفید در اختیار آنّها بگذارند. در همین مرکز تحقیقات نور کلی کتاب داریم که اکنون به صورت دیجیتال موجوداند، مانند کتب تفسیر، احادیث و غیره که با داشتن یک سیستم پرسش و پاسخ خوب میتوانیم به سوالات مربوط به تمام اینها پاسخ دهیم. مثالی دیگری که به ذهنم میرسد تفسیر قرآن به قرآن به صورت خودکار است، یعنی استفاده از بخشی از قرآن برای ارائه توضیح در مورد بخش دیگر. افرادی چون علامه طباطبایی (ره) با تسلط کامل به قرآن قادر به انجام چنین کاری بودند. با توسعه یک سیستم پرسش و پاسخ قرآنی میتوان با کنار هم قرار دادن آیههای مرتبط، تفسیری از یک موضوع قرآنی ارائه کرد.
فارس: دیگر فعالیتهایتان در گروه مهندسی نرمافزار دانشگاه گیلان چیست؟
من نزدیک به دو سال است که در دانشگاه گیلان مشغول به فعالیت شدهام. حدود یک سال پیش گروه پردازش زبان طبیعی را راهاندازی کردهایم که با مراجعه به آدرس nlp.guilan.ac.ir میتوانید با فعالیتهای ما آشنا شوید. یکی از فعالیتهای اصلی ما در زمینه تحلیل خودکار احساسات است. اگر بخواهم با یک مثال این مورد را توضیح دهم، امروزه سایتهای فراوانی هستند که محصولاتی را معرفی میکنند و یا خبری را درج میکنند و کاربران نظرات خود را در خصوص آن محصول و یا خبر در سایت ثبت میکنند. برای مثال کاربری در زیر صفحه معرفی یک دوربین مینویسد «من استفاده کردم و راضیام». گاهی صدها نظر در خصوص مطلبی نوشته میشوند و میخواهیم در خصوص نظر کل کاربران یک جمعبندی داشته باشیم. اینجاست که سیستم آنالیز احساس به کار میآید. این سیستم با تحلیل نظرات به ما میگوید که کاربران نسبت به این خبر یا این محصول حس مثبت دارند یا منفی. برای این منظور ما پیکرهای را توسعه دادهایم که پیکره بزرگ و جامعی است. انشاءالله پس از انتشار مقاله مرتبط با این پیکره، آن را به صورت رایگان از طریق مرجع دادگان زبان فارسی منتشر خواهیم کرد. فعالیت دیگر ما در گروه پردازش زبان ایجاد خودکار هستانشناسی فارسی است که از صفحات ویکیپیدیا به این منظور استفاده میکنیم. دامنه فعلی که در ایجاد هستانشناسی استفاده میکنیم، دامنه جانورشناسی است که نتایج خوبی در این زمینه هم بدست آوردهایم. از کارهای دیگر میتوان به سیستمهای سطح پایین مانند تجزیهگرهای نحوی و استخراج روابط بین کلمات که به درد سیستمهای سطوح بالاتر میخورد اشاره کرد. همچنین علاقهمندیم که روی بحث خلاصهسازی خودکار متون فارسی هم کار کنیم.
اخیراً فعالیتهای خوبی در زمینه تولید داده برای برای پردازش زبان فارسی انجام گرفته است و این موضوع واقعاً جای سرمایهگذاری دارد چرا که همانطور که گفتم در کشور ما و حتی در مجموعههای کوچکی مانند گروه ما در دانشگاه گیلان دانش فنی خوبی داریم و ایجاد چنین منابعی موجب حمایت از فعالیتهای محققان خواهد بود و ما میتوانیم کارهایی را در زمینه پردازش زبان فارسی انجام دهیم که هیچ کم از نمونههای مشابه خارجی ندارد، چرا که تسلطی که ما به زبان خودمان داریم خارجیها ندارند. این مسئله بسیار مهم است چرا که در آیندهای نه چندان دور بخش عمدهای از فرهنگ و اعتقادات ما از طریق همین اطلاعاتی که در کامپیوترها موجود است ساخته میشود و به همین خاطر باید تلاش کنیم که بتوانیم اطلاعات را درست استخراج کنیم و درست در اختیار همه قرار دهیم.