تحولات جدید در ابزارهای هوش مصنوعی تولید کننده تصویر
در این مقاله، به مرور آخرین بهروزرسانیها و تغییرات مهم در چندین پلتفرم هوش مصنوعی تولید تصویر و تأثیرات آنها بر صنعت هنر و فناوری میپردازیم. با توجه به اینکه هوش مصنوعی همچنان بر روندهای خلاقانه و هنری تأثیر میگذارد، این تغییرات میتواند مسیر آینده این فناوری را رقم بزند.
هوش مصنوعی بهطور فزایندهای در زندگی روزمره افراد و شرکتها نفوذ کرده و بسیاری از صنایع، از جمله حوزه تولید تصویر و هنر دیجیتال، بهسرعت در حال پذیرش این فناوری هستند. بسیاری از پلتفرمهای تولید تصویر از هوش مصنوعی برای خلق آثار هنری بهره میبرند، اما این رویکرد با واکنشهای شدیدی از سوی هنرمندان همراه بوده است. در نتیجه، برخی شرکتها با مشکلات حقوقی و انتقادات گسترده مواجه شدهاند.
در ادامه، نگاهی دقیقتر به تحولات اخیر چند پلتفرم مهم در حوزه تولید تصویر با استفاده از هوش مصنوعی میاندازیم.
1. Procreate از استفاده از GenAI خودداری میکند
در حالی که بیشتر سازمانها به استفاده از هوش مصنوعی در ابزارها و محصولات خود روی آوردهاند، Procreate، اپلیکیشن محبوب طراحی بر روی آیپد، اعلام کرده که از هوش مصنوعی مولد (GenAI) در محصولات خود استفاده نخواهد کرد. Procreate در وبسایت رسمی خود بیان کرده که هرچند یادگیری ماشین (ML) و هوش مصنوعی پتانسیلهای زیادی دارد، اما مسیر فعلی GenAI برای این پلتفرم مناسب نیست و استفاده از آن میتواند تهدیدی برای خلاقیت انسانی باشد.
جیمز کودا، مدیرعامل Procreate، در ویدئویی در شبکه اجتماعی X بیان کرد: «ما نمیخواهیم به سمت هوش مصنوعی مولد برویم. خلاقیت یک فرایند انسانی است و نباید توسط ماشینها تولید شود.» این بیانیه واکنشهای مثبتی از سوی جامعه هنرمندان دیجیتال به همراه داشت که از تصمیم Procreate برای حفظ فضای هنری به دور از هوش مصنوعی استقبال کردند.
این تصمیم Procreate میتواند فشار بیشتری بر دیگر پلتفرمهای طراحی وارد کند و آنها را به بازنگری در استفاده از هوش مصنوعی وادار کند. برخی از پلتفرمهای مطرح که از هوش مصنوعی برای تولید آثار هنری استفاده میکنند، شامل Adobe، Jasper AI و Midjourney هستند. این شرکتها به دلیل تغییر در سیاستهایشان مورد انتقاد قرار گرفتهاند، زیرا به نظر میرسید که از محتوای کاربران برای آموزش مدلهای هوش مصنوعی بهره میبردند.
اخبار جدید همکاری متا با فیلمسازان هالیوودی را از دست ندهید!
2. Midjourney یک ویرایشگر جدید تصاویر در وب را معرفی کرد
Midjourney از بهروزرسانی وبسایت خود با اضافه کردن یک رابط کاربری جدید برای ویرایش تصاویر خبر داد. این ویرایشگر جدید تمامی ابزارهای فعلی را، از جمله inpainting و outpainting، در یک نمای واحد قرار داده است. همچنین، یک ابزار جدید به شکل قلممو نیز به ویرایشگر اضافه شده که دقت بیشتری در ویرایش بخشهای خاص تصاویر ایجاد شده توسط هوش مصنوعی فراهم میکند.
این ویرایشگر اکنون برای تمامی کاربرانی که حداقل ده تصویر در پلتفرم تولید کردهاند، در دسترس است. Midjourney همچنین وبسایت خود را برای کاربران جدید باز کرده و به آنها امکان میدهد حدود 25 تصویر به صورت رایگان تولید کنند.
Midjourney، یکی از اصلیترین پلتفرمهای تولید تصویر با هوش مصنوعی، به تازگی ویرایشگر جدیدی را در وبسایت خود راهاندازی کرده است. این ویرایشگر جدید تمامی ابزارهای موجود پلتفرم، از جمله inpainting و outpainting، را در یک نمای یکپارچه گرد هم آورده است. کاربران اکنون میتوانند با استفاده از یک ابزار جدید به شکل قلممو، تصاویر تولید شده توسط هوش مصنوعی را با دقت بیشتری ویرایش کنند. این ابزار جایگزین ابزارهای قدیمیتری شده و دقت بالاتری در ویرایش تصاویر ایجاد میکند.
این ویرایشگر برای تمامی کاربرانی که حداقل 10 تصویر در پلتفرم تولید کردهاند، قابل دسترسی است. بهروزرسانیهای جدید باعث شده که کاربران بدون نیاز به جستجو در منوهای مختلف، تمامی ابزارها و امکانات ویرایشی را در یک مکان به سادگی پیدا کنند. دیوید هولتز، مدیرعامل Midjourney، هدف از این بهروزرسانی را ایجاد تجربهای سادهتر و روانتر برای کاربران عنوان کرده است.
علاوه بر این، Midjourney قابلیت ارتباط بهتر بین انجمن وب و سرور Discord خود را اضافه کرده است. پیامهایی که در اتاقهای وب ارسال میشوند، همزمان در کانالهای مربوطه دیسکورد نیز نمایش داده میشوند و بالعکس.
همچنین Midjourney نسخههای رایگان برای تست به برای کاربران جدید ارائه میدهد. (به گفته Holz، کاربران جدید می توانند حدود 25 تصویر رایگان تولید کنند)
این تغییرات نشان میدهد که Midjourney در تلاش است تا دسترسی به پلتفرم خود را آسانتر کرده و کاربران بیشتری را به خود جذب کند. این رویکرد باعث میشود که پلتفرم بهطور همزمان پاسخگوی نیازهای کاربران عادی و حرفهای باشد.
3. پلتفرم جدید و متن باز FLUX
در میان پلتفرمهای تولید تصویر، یک تازهوارد به نام FLUX.1 به سرعت در حال جلب توجه است. این پلتفرم که توسط تیم Black Forest Labs توسعه یافته است، به دلیل نتایج باکیفیت و همچنین مدل متنباز بودنش، مورد تحسین قرار گرفته است.
FLUX.1 در سه نسخه مختلف عرضه میشود: Schnell، Dev و Pro
نسخه Pro برای استفاده تجاری طراحی شده و نسخههای دیگر برای کاربرانی با نیازهای مختلف قابل دسترسی است.
یکی از مزیتهای اصلی FLUX نسبت به پلتفرمهای مشابه این است که دو نسخه Schnell و Dev بر روی سختافزارهای قابل دسترستر نیز قابل اجرا هستند، به طوری که کاربران میتوانند بدون نیاز به استفاده از فضای ابری یا اینترنت، این پلتفرم را روی سیستمهای خود اجرا کنند.
FLUX همچنین در مقایسه با رقبای خود مانند Midjourney، هنگام تولید تصاویر انسانی، نتایج بهتری ارائه میدهد. بهعلاوه، شرکتها میتوانند به راحتی این پلتفرم را با سیستمهای چندحالتی خود یکپارچهسازی کنند، زیرا این پلتفرم متنباز و سازگار با محیطهای مختلف است.
نکات مهم سئو برای وبسایت های چند زبانه! بیشتر بخوانید.
4. Grok-2 و انتشار تصاویر بدون محدودیت در پلتفرم X
xAI، شرکت هوش مصنوعی متعلق به ایلان ماسک، از دو مدل جدید به نامهای Grok-2 و Grok-2 mini رونمایی کرده است. این مدلها به پلتفرم FLUX متصل بوده و تقریبا هیچگونه محدودیت اخلاقی در تولید تصاویر ندارند. کاربران اکنون میتوانند تصاویر بدون سانسور و حتی بحثبرانگیز را تولید و در شبکه اجتماعی X (توییتر سابق) به اشتراک بگذارند.
این اقدام در راستای حمایت ایلان ماسک از آزادی بیان در پلتفرمش صورت گرفته و به احتمال زیاد این قابلیتها برای مدتی باقی خواهند ماند. بهعلاوه، مدل Grok-2 بهبودهای قابل توجهی نسبت به نسخههای قبلی داشته و در زمینههایی مانند دانش عمومی، ریاضیات و پاسخدهی به سوالات پیچیده، عملکرد بهتری ارائه میدهد. کاربران X Premium و +Premium میتوانند از طریق نسخه جدید اپلیکیشن به این مدلها دسترسی پیدا کنند و xAI نیز قصد دارد به زودی یک API برای استفاده سازمانی از این مدلها عرضه کند.
5. Google یک تولیدکننده تصویر رایگان معرفی میکند
Google نیز به تازگی از تولیدکننده تصویر جدید خود به نام Imagen 3 رونمایی کرده است. این ابزار هوش مصنوعی توسط Google DeepMind توسعه یافته و طبق گزارشهای شرکت، عملکرد بهتری نسبت به پلتفرمهای DALL-E 3 و Stable Diffusion ارائه میدهد.
Imagen 3 مانند سایر تولیدکنندگان تصویر عمل میکند و کاربران با وارد کردن یک متن توصیفی، در چند ثانیه تصاویر را مشاهده میکنند. علاوه بر این، ابزار inpainting به کاربران امکان میدهد تا قسمتهای خاصی از تصویر را برای ویرایش انتخاب کرده و تغییرات مورد نظر خود را اعمال کنند.
این ابزار در حال حاضر به صورت رایگان در ایالات متحده قابل دسترسی است و به زودی در سرویسهای Google AI مانند Gemini و Workspace نیز عرضه خواهد شد.
نتیجهگیری:
این تحولات نشاندهنده رقابت شدید بین شرکتهای فعال در زمینه تولید تصویر با هوش مصنوعی و همچنین چالشهای اخلاقی پیرامون استفاده از این فناوری است. در حالی که برخی شرکتها مانند Procreate بر حفظ خلاقیت انسانی تأکید دارند، دیگران مانند xAI در تلاشند تا محدودیتهای اخلاقی را کمتر کنند. همزمان پلتفرمهایی مانند Midjourney و Google تلاش میکنند تا فناوری هوش مصنوعی را در دسترس همگان قرار دهند. در نهایت، این تقابلها و تغییرات در آینده نزدیک مسیر توسعه و استفاده از هوش مصنوعی در خلق هنر را تعیین خواهند کرد.
منبع: spiceworks