هوش مصنوعی

معرفی تکنولوژی جدید گوگل برای علامت‌گذاری متن‌های تولید شده توسط هوش مصنوعی

پیشنهاد شده توسط یکتانت

گوگل اخیرا از تکنولوژی جدیدی به نام SynthID Text رونمایی کرده است که به توسعه‌دهندگان امکان می‌دهد متون تولید شده توسط مدل‌های هوش مصنوعی را علامت‌گذاری و شناسایی کنند. این ابزار اکنون به‌صورت عمومی و رایگان از طریق پلتفرم Hugging Face و بسته نرم‌افزار Responsible GenAI Toolkit گوگل قابل دسترسی است.

گوگل در پستی در شبکه اجتماعی X (توییتر سابق) اعلام کرد: «ما ابزار علامت‌گذاری SynthID Text را به‌صورت منبع‌باز ارائه کرده‌ایم و این ابزار به توسعه‌دهندگان و کسب‌وکارها کمک می‌کند که محتوای تولید شده توسط هوش مصنوعی را شناسایی کنند.»

نحوه کارکرد SynthID Text

در فرآیند تولید متن توسط مدل‌های هوش مصنوعی، این مدل‌ها از طریق پیش‌بینی «توکن»‌هایی (کلمات یا کاراکترها) که احتمالا بعد از یکدیگر قرار می‌گیرند، متن را تولید می‌کنند. هر توکن دارای یک امتیاز است که احتمال گنجاندن آن در متن نهایی را نشان می‌دهد. تکنولوژی SynthID Text به این توزیع احتمالاتی در میان توکن‌ها، اطلاعات اضافی اضافه می‌کند. این کار با «تغییر احتمال تولید توکن‌ها» انجام می‌شود تا الگویی خاص در متن ایجاد شود.

گوگل در یک پست وبلاگی توضیح داده است: «الگوی نهایی از امتیازهای توکن‌ها و ترکیب آن‌ها با احتمال‌های تنظیم شده به عنوان “علامت” شناخته می‌شود. این الگو با الگوی مورد انتظار برای متن‌های علامت‌گذاری شده و نشده مقایسه می‌شود، و به این ترتیب، SynthID Text تشخیص می‌دهد که آیا متن توسط ابزار هوش مصنوعی تولید شده است یا منبع دیگری دارد.»

چگونه از ابزار compression برای شناسایی صفحات اسپم استفاده کنیم؟

نقاط قوت و ضعف SynthID Text

گوگل ادعا می‌کند که SynthID Text از کیفیت، دقت و سرعت تولید متن نمی‌کاهد و حتی در شرایطی که متن برش داده شده، بازنویسی یا تغییر یافته باشد نیز قابل شناسایی است. از زمان بهار امسال، این فناوری به طور کامل در مدل‌های Gemini گوگل ادغام شده است.

اما این روش محدودیت‌هایی هم دارد. برای مثال، SynthID Text در شناسایی متون کوتاه، متونی که ترجمه یا بازنویسی شده‌اند، و پاسخ‌هایی به پرسش‌های دقیق و واقعی بل موفقیت کمتری عمل می‌کند. گوگل در این باره توضیح داده است که: «در پاسخ‌های مربوط به پرسش‌های واقعی، فرصت‌های کمتری برای تغییر توزیع توکن‌ها بدون تأثیرگذاری بر دقت واقعی وجود دارد. این شامل پرسش‌هایی مانند “پایتخت فرانسه چیست؟” یا درخواست‌هایی که تغییرات محدودی دارند، مانند “شعری از ویلیام وردزورث را بازگو کنید.”»

تکنولوزی SynthID Text چیست

رقابت در عرصه علامت‌گذاری متون تولید شده توسط هوش مصنوعی

گوگل تنها شرکتی نیست که در زمینه علامت‌گذاری متون هوش مصنوعی تحقیق می‌کند. OpenAI نیز در سال‌های اخیر به بررسی روش‌های مختلف این فناوری پرداخته است، اما به دلایل فنی و تجاری هنوز آن را به‌صورت عمومی منتشر نکرده است.

روش‌های علامت‌گذاری متنی اگر به‌طور گسترده مورد استفاده قرار گیرند، می‌توانند تاثیر مثبتی بر تشخیص محتوای تولید شده توسط هوش مصنوعی داشته باشند. با وجود ابزارهای تشخیص هوش مصنوعی که غالبا به اشتباه متن‌ها تولید شده توسط هوش مصنوعی را شناسایی می‌کنند، یک فناوری استاندارد می‌تواند به کاهش این مشکلات کمک کند. با این حال، سوال اینجاست که آیا این تکنولوژی‌ها به‌طور گسترده پذیرفته خواهند شد و آیا یک استاندارد واحد بر دیگر فناوری‌های پیشنهادی غالب خواهد شد؟

اقدامات قانونی و آینده علامت‌گذاری محتوای هوش مصنوعی

برخی کشورها در حال اعمال مقرراتی برای علامت‌گذاری محتوای تولید شده توسط هوش مصنوعی هستند. دولت چین الزاماتی را برای علامت‌گذاری محتوای هوش مصنوعی اعمال کرده و ایالت کالیفرنیا نیز در نظر دارد چنین مقرراتی را اجرا کند.

این مسئله از اهمیت بالایی برخوردار است؛ چرا که طبق گزارش سازمان اجرای قانون اتحادیه اروپا، پیش‌بینی می‌شود که تا سال ۲۰۲۶، حدود ۹۰ درصد از محتوای آنلاین به صورت مصنوعی تولید شود. این موضوع چالش‌های جدیدی در زمینه انتشار اطلاعات نادرست، تبلیغات دروغین و کلاه‌برداری به وجود می‌آورد. به‌گفته‌ی یک مطالعه از AWS، در حال حاضر حدود ۶۰ درصد از جملات موجود در وب به دلیل استفاده گسترده از مترجم‌های هوش مصنوعی به صورت مصنوعی تولید می‌شود.

جمع‌بندی

فناوری SynthID Text گوگل گامی رو به جلو در شناسایی و علامت‌گذاری متون تولید شده توسط هوش مصنوعی است. این ابزار با فراهم کردن امکان شناسایی محتوای هوش مصنوعی، می‌تواند به شفافیت بیشتر و کاهش اطلاعات نادرست کمک کند. با این حال، محدودیت‌هایی نیز دارد و نیازمند تکامل بیشتر است. در حالی که کشورهای مختلف به دنبال قانون‌گذاری و اعمال مقررات در این زمینه هستند، استفاده گسترده از فناوری‌هایی همچون SynthID می‌تواند به‌عنوان یک راهکار استاندارد برای ایجاد امنیت و اعتماد در فضای دیجیتال نقش ایفا کند. در مجموع، علامت‌گذاری محتوای هوش مصنوعی نه تنها آینده انتشار اطلاعات را تغییر خواهد داد، بلکه می‌تواند رویکردی نوین در مقابله با چالش‌های دنیای دیجیتال باشد.

منبع: techcrunch

پیشنهاد شده توسط یکتانت
پیشنهاد شده توسط یکتانت

نوشته های مشابه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

دکمه بازگشت به بالا