معرفی تکنولوژی جدید گوگل برای علامتگذاری متنهای تولید شده توسط هوش مصنوعی
گوگل اخیرا از تکنولوژی جدیدی به نام SynthID Text رونمایی کرده است که به توسعهدهندگان امکان میدهد متون تولید شده توسط مدلهای هوش مصنوعی را علامتگذاری و شناسایی کنند. این ابزار اکنون بهصورت عمومی و رایگان از طریق پلتفرم Hugging Face و بسته نرمافزار Responsible GenAI Toolkit گوگل قابل دسترسی است.
گوگل در پستی در شبکه اجتماعی X (توییتر سابق) اعلام کرد: «ما ابزار علامتگذاری SynthID Text را بهصورت منبعباز ارائه کردهایم و این ابزار به توسعهدهندگان و کسبوکارها کمک میکند که محتوای تولید شده توسط هوش مصنوعی را شناسایی کنند.»
نحوه کارکرد SynthID Text
در فرآیند تولید متن توسط مدلهای هوش مصنوعی، این مدلها از طریق پیشبینی «توکن»هایی (کلمات یا کاراکترها) که احتمالا بعد از یکدیگر قرار میگیرند، متن را تولید میکنند. هر توکن دارای یک امتیاز است که احتمال گنجاندن آن در متن نهایی را نشان میدهد. تکنولوژی SynthID Text به این توزیع احتمالاتی در میان توکنها، اطلاعات اضافی اضافه میکند. این کار با «تغییر احتمال تولید توکنها» انجام میشود تا الگویی خاص در متن ایجاد شود.
گوگل در یک پست وبلاگی توضیح داده است: «الگوی نهایی از امتیازهای توکنها و ترکیب آنها با احتمالهای تنظیم شده به عنوان “علامت” شناخته میشود. این الگو با الگوی مورد انتظار برای متنهای علامتگذاری شده و نشده مقایسه میشود، و به این ترتیب، SynthID Text تشخیص میدهد که آیا متن توسط ابزار هوش مصنوعی تولید شده است یا منبع دیگری دارد.»
چگونه از ابزار compression برای شناسایی صفحات اسپم استفاده کنیم؟
نقاط قوت و ضعف SynthID Text
گوگل ادعا میکند که SynthID Text از کیفیت، دقت و سرعت تولید متن نمیکاهد و حتی در شرایطی که متن برش داده شده، بازنویسی یا تغییر یافته باشد نیز قابل شناسایی است. از زمان بهار امسال، این فناوری به طور کامل در مدلهای Gemini گوگل ادغام شده است.
اما این روش محدودیتهایی هم دارد. برای مثال، SynthID Text در شناسایی متون کوتاه، متونی که ترجمه یا بازنویسی شدهاند، و پاسخهایی به پرسشهای دقیق و واقعی بل موفقیت کمتری عمل میکند. گوگل در این باره توضیح داده است که: «در پاسخهای مربوط به پرسشهای واقعی، فرصتهای کمتری برای تغییر توزیع توکنها بدون تأثیرگذاری بر دقت واقعی وجود دارد. این شامل پرسشهایی مانند “پایتخت فرانسه چیست؟” یا درخواستهایی که تغییرات محدودی دارند، مانند “شعری از ویلیام وردزورث را بازگو کنید.”»
رقابت در عرصه علامتگذاری متون تولید شده توسط هوش مصنوعی
گوگل تنها شرکتی نیست که در زمینه علامتگذاری متون هوش مصنوعی تحقیق میکند. OpenAI نیز در سالهای اخیر به بررسی روشهای مختلف این فناوری پرداخته است، اما به دلایل فنی و تجاری هنوز آن را بهصورت عمومی منتشر نکرده است.
روشهای علامتگذاری متنی اگر بهطور گسترده مورد استفاده قرار گیرند، میتوانند تاثیر مثبتی بر تشخیص محتوای تولید شده توسط هوش مصنوعی داشته باشند. با وجود ابزارهای تشخیص هوش مصنوعی که غالبا به اشتباه متنها تولید شده توسط هوش مصنوعی را شناسایی میکنند، یک فناوری استاندارد میتواند به کاهش این مشکلات کمک کند. با این حال، سوال اینجاست که آیا این تکنولوژیها بهطور گسترده پذیرفته خواهند شد و آیا یک استاندارد واحد بر دیگر فناوریهای پیشنهادی غالب خواهد شد؟
اقدامات قانونی و آینده علامتگذاری محتوای هوش مصنوعی
برخی کشورها در حال اعمال مقرراتی برای علامتگذاری محتوای تولید شده توسط هوش مصنوعی هستند. دولت چین الزاماتی را برای علامتگذاری محتوای هوش مصنوعی اعمال کرده و ایالت کالیفرنیا نیز در نظر دارد چنین مقرراتی را اجرا کند.
این مسئله از اهمیت بالایی برخوردار است؛ چرا که طبق گزارش سازمان اجرای قانون اتحادیه اروپا، پیشبینی میشود که تا سال ۲۰۲۶، حدود ۹۰ درصد از محتوای آنلاین به صورت مصنوعی تولید شود. این موضوع چالشهای جدیدی در زمینه انتشار اطلاعات نادرست، تبلیغات دروغین و کلاهبرداری به وجود میآورد. بهگفتهی یک مطالعه از AWS، در حال حاضر حدود ۶۰ درصد از جملات موجود در وب به دلیل استفاده گسترده از مترجمهای هوش مصنوعی به صورت مصنوعی تولید میشود.
جمعبندی
فناوری SynthID Text گوگل گامی رو به جلو در شناسایی و علامتگذاری متون تولید شده توسط هوش مصنوعی است. این ابزار با فراهم کردن امکان شناسایی محتوای هوش مصنوعی، میتواند به شفافیت بیشتر و کاهش اطلاعات نادرست کمک کند. با این حال، محدودیتهایی نیز دارد و نیازمند تکامل بیشتر است. در حالی که کشورهای مختلف به دنبال قانونگذاری و اعمال مقررات در این زمینه هستند، استفاده گسترده از فناوریهایی همچون SynthID میتواند بهعنوان یک راهکار استاندارد برای ایجاد امنیت و اعتماد در فضای دیجیتال نقش ایفا کند. در مجموع، علامتگذاری محتوای هوش مصنوعی نه تنها آینده انتشار اطلاعات را تغییر خواهد داد، بلکه میتواند رویکردی نوین در مقابله با چالشهای دنیای دیجیتال باشد.
منبع: techcrunch