ثبت بازخورد

لطفا میزان رضایت خود را از دیجیاتو انتخاب کنید.

Very satisfied Satisfied Neutral Dissatisfied Very dissatisfied
واقعا راضی‌ام
اصلا راضی نیستم
چطور میتوانیم تجربه بهتری برای شما بسازیم؟

نظر شما با موفقیت ثبت شد.

از اینکه ما را در توسعه بهتر و هدفمند‌تر دیجیاتو همراهی می‌کنید
از شما سپاسگزاریم.

جدیدترین اخبار و روندهای دنیای فناوری را با نگاهی دقیق و حرفه‌ای، در کانال تلگرام دیجیاتو دنبال کنید.

ورود به کانال تلگرام دیجیاتو
یوتوب و OpenAI
هوش مصنوعی

OpenAI ظاهراً برای آموزش GPT-4 از ویدیوهای یوتوب استفاده کرده است

سخنگوی گوگل گفته است که این شرکت تدابیر فنی و قانونی را برای جلوگیری از چنین استفاده‌های غیرمجازی اتخاذ می‌کند.

آزاد کبیری
نوشته شده توسط آزاد کبیری تاریخ انتشار: ۱۹ فروردین ۱۴۰۳ | ۱۰:۰۰

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

به گزارش نیویورک تایمز، OpenAI با استفاده از مدل صوتی Whisper خود، بیش از یک میلیون ساعت از ویدیوهای یوتوب را برای آموزش GPT-4، پیشرفته‌ترین مدل زبانی بزرگ خود، رونویسی کرده است. این شرکت می‌داند که از نظر قانونی استفاده از چنین داده‌هایی بحث‌برانگیز است، اما ظاهراً اعتقاد دارد استفاده از این داده‌ها را باید منصفانه تلقی کرد.

شرکت‌های هوش مصنوعی برای توسعه هرچه بیشتر مدل‌های پیشرفته خود، به داده‌های بیشتری نیاز دارند و حالا به‌نظر می‌رسد که این شرکت‌ها در یافتن داده‌های آموزشی باکیفیت با مشکل مواجه شده‌اند. براساس گزارش نیویورک تایمز، در چنین مواقعی، جای تعجب نیست که این شرکت‌ها به‌سمت استفاده از داده‌هایی بروند که در ناحیه خاکستری و مبهم قانون کپی‌رایت هوش مصنوعی قرار دارند. ویدیوهای یوتوب نیز ظاهراً برای OpenAI چنین وضعیتی دارد.

پیش‌ازاین «نیل موهان»، مدیرعامل یوتوب، درباره احتمال استفاده OpenAI از یوتوب برای آموزش هوش مصنوعی تولید ویدیوی Sora صحبت کرده بود. سخنگوی گوگل گفته بود که این شرکت تدابیر فنی و قانونی را برای جلوگیری از چنین استفاده‌های غیرمجازی اتخاذ می‌کند.

استفاده از ویدیوهای یوتوب برای آموزش مدل‌های OpenAI

به گفته سخنگوی OpenAI، این شرکت مجموعه داده‌های منحصربه‌فردی را برای هریک از مدل‌های خود درنظر می‌گیرد تا به درک آن‌ها از جهان کمک کند. او افزود که این شرکت از منابع متعددی ازجمله داده‌های در دسترس عموم و داده‌های غیرعمومی استفاده می‌کند.

اما از سویی، گزارش‌ها حاکی از آن است که OpenAI منابع داده‌های آموزشی مجاز و قابل استفاده را در سال 2021 به پایان رسانده و حالا پس از بررسی منابع دیگر به‌سمت رونویسی ویدیوها، پادکست‌ها و کتاب‌های صوتی یوتوب آمده است. تا آن زمان، این شرکت مدل‌های خود را با داده‌هایی مثل کدهای گیت‌هاب و محتواهای تحصیلی Quizlet آموزش داده بود.

سخنگوی گوگل دراین‌باره گفته این شرکت گزارش‌های تأییدنشده‌ای از فعالیت OpenAI را دیده است. به گفته او، هم فایل‌های robots.txt و هم شرایط خدمات گوگل، حذف یا دانلود غیرمجاز محتوای یوتوب را ممنوع کرده است.

آزاد کبیری
آزاد کبیری

دانش‌آموخته‌ زبان‌شناسی‌ هستم و همان‌قدر که به کلمات علاقه‌مندم، از سرک‌کشیدن به گوشه‌وکنارِ تکنولوژی و علم هم لذت می‌برم. حدود ۱۵ سال از نگارش نخستین متن رسمی‌ام می‌گذرد.

دیدگاه‌ها و نظرات خود را بنویسید
مطالب پیشنهادی