چالش ارجاعهای نادرست چتجیپیتی سرچ؛ آیا OpenAI به اعتماد ناشران آسیب میزند؟
مطالعهای جدید از دانشگاه کلمبیا، چالشهای چتجیپیتی سرچ در نسبت دادن صحیح محتوا به منابع خبری را بررسی کرده است.
پیشزمینهای درباره چتجیپیتی سرچ
چتجیپیتی سرچ، ابزاری است که توسط OpenAI برای تعامل مؤثرتر با ناشران طراحی شده است. این ابزار به ناشران اجازه میدهد با استفاده از فایل robots.txt تصمیم بگیرند که محتوای آنها در نتایج جستجوی این ابزار نمایش داده شود یا خیر.
اما مطالعه Tow Center نشان میدهد که حتی اگر ناشران اجازه استفاده از محتوای خود را به این ابزار بدهند یا آن را مسدود کنند، همچنان خطر ارجاع به منبع اشتباه وجود دارد.
مشکلات اصلی
- نقلقولهای نادرست و اشتباه در ارجاع به منابع: از 200 پرسشی که در این مطالعه بررسی شد، 153 پاسخ حاوی اطلاعات نادرست بود. چتجیپیتی به ندرت اشتباهات خود را تصدیق میکند و معمولا برای کاهش شفافیت از عباراتی مانند “احتمالا” استفاده میکند.
- ارجاع به محتوای کپی شده: این ابزار گاهی اوقات به مقالات کپی شده یا توزیع شده (سندیکایی) اشاره میکند، به جای اینکه مستقیما به منبع اصلی ارجاع دهد. به عنوان مثال، زمانی که از چتجیپیتی درخواست شد نقلقولی از مقالهای در نیویورک تایمز ارائه دهد، به نسخهای غیرمجاز از آن مقاله در یک وبسایت دیگر لینک داد.
- عدم ثبات در پاسخها: نتایج جستجو برای پرسشهای مشابه گاهی اوقات متفاوت است. این رفتار میتواند ناشی از ماهیت تصادفی مدل زبانی چتجیپیتی باشد.
زبان جدید o1 به هوش مصنوعی OpenAI اضافه شد!
پاسخ OpenAI
OpenAI در واکنش به این گزارش اعلام کرد که برای بهبود دقت نقلقولها تلاش میکند. سخنگوی شرکت گفت:
“ما با همکاری ناشران به بهبود دقت ارجاعات در نتایج جستجو و احترام به ترجیحات ناشران متعهد هستیم.”
هرچند این شرکت مدعی است که ابزار چتجیپیتی به 250 میلیون کاربر هفتگی کمک میکند تا محتوای باکیفیت پیدا کنند، اما پذیرفته که رفع کامل مشکلات ارجاعهای اشتباه چالشبرانگیز است.
نگاهی به آینده
با توجه به تحولات سریع فناوری جستجوی تولیدی (Generative Search)، OpenAI باید نشان دهد که متعهد به مسئولیتپذیری در حوزه روزنامهنگاری است. همزمان، ناشران محتوا منتظر نتایج پروندههای حقوقی مرتبط با OpenAI هستند که ممکن است کنترل بیشتری برای محافظت از محتوای آنها فراهم کند.
این موضوع نشاندهندهی نیاز به تعادل میان نوآوری و احترام به حقوق ناشران است تا کاربران بتوانند به محتوای تولیدی اعتماد کنند.
منبع: search engine journal