نتایج چشمگیر هوش مصنوعی Google Brain در خلاصه سازی متن

نتایج چشمگیر هوش مصنوعی Google Brain در خلاصه سازی متن

تیم گوگل برین (Google Brain) و امپریال کالج لندن (Imperial College London) سیستمی با نام اختصاری «پگاسوس» (Pegasus) توسعه داده اند که با بهره گیری از معماری Transformers گوگل، متن ها را به روش انتزاعی خلاصه سازی می کند.

توسعه دهندگان پگاسوس می گویند این سیستم نتایج چشمگیری در خلاصه سازی موضوعات مختلف از جمله اخبار، متون علمی، داستانی، دستورالعملی، حقوقی، ایمیل ها و پتنت ها بر جای گذاشته است.

محققان می گویند هدف از خلاصه سازی متن تولید چکیده ای دقیق و مختصر از اسناد طولانی است و به جای کپی کردن قسمت هایی از متن، خلاصه سازی انتزاعی (abstractive summarization) توانایی تولید لغات جدید یا پوشش دادن اطلاعات عمده را داشته و خروجی آن از لحاظ زبانشناسی روان است.

محققان برای آزمایش سیستم خود جمله های کامل و قسمت های مهم متن را پوشاندند. هوش مصنوعی باید به کمک اینترنت و بررسی مقالات خبری جاهای خالی را پر می کرد.

برای چنین آزمایشی بهترین نسخه پگاسوس انتخاب شد که با ۷۵۰ گیگابایت از متون استخراج شده از ۳۵۰ میلیون صفحه اینترنتی و یا به کمک شبکه ای به نام HugeNews با ۱.۵ میلیارد مقاله به حجم ۳.۸ ترابایت از سایت های خبری آموزش دیده بود.

پگاسوس از لحاظ ارتباط و روان بودن متن خلاصه سازی شده، خروجی با کیفیتی تحویل داد و برای تصحیح اشتباهات نیازی به اقدامات متقابل نبود. این سیستم با تنها ۱۰۰ مقاله ورودی، موفق به ایجاد خلاصه سازی های باکیفیت شد و قابل مقایسه با مدلی بود که با مقالات ۲۰ هزار تا ۲۰۰ هزار عددی آموزش دیده بود.

ماشین های خلاصه سازی متون بار خواندن متن های طولانی را از روی دوش نیروی انسانی بر می‌دارند. تحقیقات نشان می دهد کارمندان روزانه به طور میانگین ۲.۶ ساعت را صرف خواندن متن ها می کنند.

نظرات ۰
وارد شوید

برای گفتگو با کاربران، وارد حساب کاربری خود شوید.

Digiato

رمزتان را گم کرده‌اید؟

Digiato