معرفی پروژه
پروژه «یکپارچه سازی و هوشمندسازی قوانین و مقررات جمهوری اسلامی ایران»، در راستای لبیک به فرمایشات مقام معظم رهبری در موضوع تدوین و تنقیح قوانین کشور شکل گرفت و این گزارشی برای تلاش یکساله فاز اول پروژه میباشد. با فراهم سازی این زیرساخت مهم برای مجلس، در گام بعدی با استفاده عمیقتر از ابعاد گوناگون هوش مصنوعی، تلاش خواهد شد در تنقیح قوانین، گامی موثر و مهم برداشته شود.
انتظار این است با آموزش گفتمان متون قانونی به هوش مصنوعی، در مرحله اول از لایه لفظ به لایه معنا رفته و در مرحله بعد با آموزش منطق و استدلالورزی به هوش به اهداف بالاتری رسید.
استفاده از ظرفیتهای هوش مصنوعی
«هدفگذاری اصلی» رسیدن به دستیار هوشمندی هست که علاوه بر فهم معنی متن قانون، منطق و استدلال موجود در احکام قانونی را نیز یادگرفته و بتواند در تعارضیابی و سایر خدمات قانونی، تسریع و تدقیق لازم را داشته باشد. به همین جهت برنامه این استکه ظرفیت روشهای مختلف هوش مصنوعی هر دو شاخه زیر بکار گرفته شود:
هوش مصنوعی تفسیرپذیر (IAI: Interpretable Artificial Intelligence) شاخهای مهم و پرکاربرد و شناخته شده هوش مصنوعی است. روشهایی همچون «یادگیری ماشین» و «یادگیری عمیق» را شامل میشود وعمدتا مبتنی بر روشهای «آمار و احتمالات» میباشد.
هوش مصنوعی توضیحپذیر(XAI: Explainable Artificial Intelligence) در این روش که مبتنی بر «گراف دانش و منطق» میباشد با تولید هستاننگار (Ontology) تلاش میشود هوش مصنوعی بتواند مفاهیم و منطق متن را یاد بگیرد و مقدمات نتیجه گیری خود را نیز توضیح دهد.
مراحل اجرایی سامانه
سامانه «قانون یار» در سه فاز در حال تولید میباشد :
- فاز اول: تولید زیرساخت قوی و منعطف داده با گردآوری و بروزرسانی مخزن «جامع و بهروز» از قوانین با امکانات زیر :
- شامل بیش از 12280 قانون از بیش از 118 سال پیش تاکنون
- جستجوی «قوی و منعطف» در متن، عنوان، اطلاعات جانبی
- جستجوی «لفظی»، «مترادفات» و «معنایی»
- امکان پایش با انواع فهرستها، دستهبندیها
- امکان پایش با انواع نمودارهای آماری و تحلیلی
- فاز دوم: تحلیل و ارتباطیابی هوشمند دادگان قوانین مبتنی بر یادگیری عمیق هوش مصنوعی :
- تبویب(رده بندی) هوشمند موضوعی اجزاء قانونی (ماده، بند)
- مشابه یابی لفظی و فرالفظی اجزاء قانونی
- پیوند دهی و ارتباطیابی هوشمند میان قوانین
- استخراج معنایی کلیدواژگان و عبارات کلیدی اجزاء قانونی
اکنون در این فاز، مدلهای هوش مصنوعی در حال آموزش و ارزیابی بوده و نتایج اولیه خوبی حاصل شده است که به لطف حق بزودی در سامانه مورد استفاده قرار خواهد گرفت.
- فاز سوم: آموزش منطق و استدلال به مدلهای هوش مصنوعی مبتنی بر گراف دانش و هستاننگار هست.
بخشی از فعالیتهای انجام شده فاز سوم :
- آموزش نیروهای متخصص مدلسازی: ترجمه متون قانون به زبان هستاننگار و ایجاد گراف دانش، نیاز به تخصص ترکیبی از هستاننگار، منطق، هوشمصنوعی، حقوق داشت.
- تسهیلگری و تولید ابزارهای لازم: جهت تسریع ترجمه و مدلسازی ابزارهای فناورانه بومی طراحی و تولید شد.
- مدلسازی نمونه : با توجه به ناشناخته بودن بسیاری از عرصههای این فن در فضای قانون، قوانین اصلی ابواب «آب،آبفا»، «کشاورزی، محیطزیست» بصورت نمونه، ترجمه شد و همزمان هستاننگارهای اولیه «فوقانی»، «منابع»، «رخداد»، «زمان»، … نیز تولید شد.
- تولید ماشین استدلاگر و توضیح نتیجه : از آنجا که بعد از مدلسازی احکام قوانین به زبان ماشین، لازم است موتور استدلاگر روی آن اجرا شود تا با توجه به قواعد منطق، تعارضات را کشف نموده و به زبانی که انسان بفهمد، توضیح دهد، همزمان طراحی و پیاده سازی نسخه اولیه انجام شده و رو به اتمام است.
فرآیندهای اصلی (حال و آینده) سامانه
تجمیع و بهروز بودن مخزن قانون: تشکیل مخزن جامع و رسمی و مورد تایید مجلس شورای اسلامی
جستجوی و پایش قوی و منعطف: طراحی انواع امکانات جستجوی در متن و فراداده قانون به همراه امکانات پالایش و دستهبندی و پایش نموداری
جستجو، تبویب، ارتباطیابی هوشمند (در حال انجام): طراحی و تولید ابزارهای هوشمند آموزش دیده در فضای قانون و حقوق با استفاده از روشهای «یادگیری عمیق»
ترجمه مفهوم و منطق قانون به زبان ماشین (چشم انداز): با استفاده از روشهای گراف دانش، هستاننگار (ontolgy)، «مفاهیم و منطق» احکام قانونی را به زبان ماشین ترجمه شود
کشف تعارضات قانونی (چشم انداز): اگر ماشین بتواند مفهوم و منطق استدلال قانون را یادبگیرد، آنگاه میتوان انتظار داشت که تعارضات قانونی را تشخیص دهد.
چالشهای مهم تنقیح قوانین
- پراکندگی مراجع تصویب: گستره بسیار متون قانون که هر یک با زبان خاص میباشد امر تجمیع، الگویابی، رفع ابهام، تعارض یابی را پیچیده نمودهاست.
- رقمی(digital) نبودن شناسنامه قانون: هر چند متن قوانین تا حد خوبی به دادههای رایانهای تبدیل شده است ولی در بخش شناسنامه قوانین ضعف مهمی وجود دارد.
- فراوانی و تنوع نیاز نهادهای حاکمیتی: مؤثر در تبویبهای بهروز و متنوع طبق نیازهای هر کدام
- انباشت کار و تاخیر: در عمده موارد، نتیجه مطلوب تنقیح در بازههای زمانی حاصل نشده و انبوه کارهای انجام نشده وجود دارد.
- نیروی حقوقدان آشنا به تنقیح: عمده فرآیندهای تنقیح امری تخصصی میباشد که با توجه به انبوه قوانین و مقررات امکان عمومیسازی نیست.
- عدم وجود پیکرههای داده هوش مصنوعی: برای آموزش مدلهای هوش مصنوعی، نیاز به داده های خاصی هست که در دسترس نیست و امیدواریم با زیرساخت فعلی، بخش اولیه آن آماده شود.