استارتاپ هوش مصنوعی انتروپیک به جمع‌آوری غیرقانونی محتوا از چند وب‌سایت متهم شد

وب‌سایت Freelancer و iFixit ادعا دارند که استارتاپ انتروپیک برای آموزش هوش مصنوعی Claude بدون پرداخت هزینه از محتوای آن‌ها استفاده می‌کند.

نوشته شده توسط جواد تاجی تاریخ انتشار: ۷ مرداد ۱۴۰۳

در دیجیاتو ثبت‌نام کنید

جهت بهره‌مندی و دسترسی به امکانات ویژه و بخش‌های مختلف در دیجیاتو عضو ویژه دیجیاتو شوید.

عضویت در دیجیاتو

تازه‌های تکنولوژی

رئیس‌جمهور قانون ساماندهی پهپادهای غیرنظامی را برای اجرا ابلاغ کرد
13 دقیقه قبل
باتری گوگل پیکسل 10 پرو فولد در تست مقاومت منفجر شد [تماشا کنید]
36 دقیقه قبل
مدیر حقوقی اسنپ‌فود: رأی شورای محترم رقابت از لحاظ حقوقی هنوز لازم‌الاجرا نیست
49 دقیقه قبل
تغییر سیاست OpenAI: محتوای بزرگسالانه در ChatGPT آزاد می‌شود
1 ساعت قبل
افزایش قیمت انرژی در آمریکا و آمارسازی درباره ماینینگ زیرزمینی ایران
1 ساعت قبل

ویدئوی مرتبط

ویدیو دیجی‌تک؛ هوش مصنوعی به زبان ساده

وب‌سایت Freelancer استارتاپ هوش مصنوعی انتروپیک (Anthropic)، سازنده مدل Claude، را به استفاده از داده‌های وب‌سایتش متهم کرده است. «کایل وینز»، مدیرعامل iFixit، نیز اعلام کرده Anthropic سیاست‌های این وب‌سایت برای استفاده از محتوایش به‌منظور آموزش مدل هوش مصنوعی خود را نادیده گرفته است.

به‌ گزارش فایننشال تایمز، «مت باری»، مدیر اجرایی Freelancer، اعلام کرده ClaudeBot از Anthropic «تهاجمی‌ترین مدل استخراج‌کننده اطلاعات وب‌سایت‌ها» است. طبق ادعای مدیرعامل iFixtit در ایکس، چت‌بات انتروپیک طی 24 ساعت، یک‌میلیون‌ بار به سرورهای iFixit ضربه زده است.

تأثیر انتروپیک بر کسب‌و‌کار وب‌سایت‌ها

او در پست خود خطاب به انتروپیک نوشت:

«شما نه‌تنها بدون پرداخت هزینه از محتوای ما استفاده می‌کنید، بلکه منابع توسعه‌دهنده ما را نیز محدود می‌کنید.»

مدیر اجرایی Freelancer می‌گوید آن‌ها ابتدا تلاش کردند صرفاً درخواست دسترسی چت‌بات انتروپیک را رد کنند اما درنهایت مجبور شدند آن را کامل مسدود کنند. iFixit نیز با اضافه‌کردن چند مورد به فایل robots.txt سایت خود، دسترسی ابزار جمع‌آوری اطلاعات انتروپیک را متوقف کرده است.

پروتکل robot.txt چیست؟

چند ماه قبل نیز Wired یکی دیگر از شرکت‌های هوش مصنوعی، Perplexity، را متهم کرده بود که اطلاعات وب‌سایتش را استخراج کرده است. شرکت‌ها از فایلی با عنوان robots.txt استفاده می‌کنند که حاوی دستورالعمل‌هایی برای استخراج داده‌های وب است و صفحاتی را که می‌توان یا نمی‌توان به آن‌ها دسترسی داشت، مشخص می‌کند.

درحالی‌که پیروی از این دستورالعمل‌ها داوطلبانه است، اکثراً نادیده گرفته می‌شود.

پس از انتشار گزارش Wired، استارتاپی با نام TollBit که ارتباط شرکت‌های هوش مصنوعی را با ناشران محتوا برقرار می‌کند، گفت فقط Perplexity فایل robots.txt را دور نمی‌زند. هرچند در آن زمان به شرکت خاصی اشاره نشد، در گزارش دیگری گفته شد OpenAI و Anthropic نیز آن را نادیده می‌گیرند.

شرکت‌های هوش مصنوعی از ابزارهای جمع‌آوری اطلاعات که به‌اصطلاح خزنده (Crawlers) نامیده می‌شود، برای جمع‌آوری محتوا از وب‌سایت‌ها استفاده می‌کنند. سپس از این داده‌ها می‌توان برای آموزش مدل‌های هوش مصنوعی استفاده کرد؛ بنابراین به‌دلیل استفاده از محتوا، شکایت‌های متعددی از آن‌ها مطرح شد. به‌ همین دلیل، OpenAI در چند ماه گذشته با چندین ناشر ازجمله فایننشال تایمز و مالک مجله People قرارداد همکاری امضا کرده است.

هوش مصنوعی

اشتراک گذاری:

کپی لینک

جواد تاجی

دوران حرفه‌ای من توی دنیای فناوری تقریبا به ۱۰ سال قبل برمی‌گرده؛ مسیری که با سخت‌افزار شروع شد، با نرم‌افزار ادامه پیدا کرد و حالا با خبرنگاری حوزه فناوری توی دیجیاتو داره ادامه پیدا می‌کنه. من جوادم و بیشتر از سه دهه از عمرم می‌گذره و علاوه بر دنیای فناوری عاشق فیلم‌و‌سینما، موسیقی کلاسیک‌راک و رئال مادریدم.

مشاهده کلیه مقالات منتشر شده