نقاشی با هوش مصنوعی گوگل: تحلیل تحولات هنر دیجیتال

گوگل از هوش مصنوعی جدیدش رونمایی کرد که می‌تواند بر اساس متون دریافتی تصاویر مرتبط به آن را ایجاد کند. ایده‌ی این سیستم در واقع به این شکل است که کاربران با دادن نوشته‌ و متن به این هوش مصنوعی معادل تصویری آن را مشاهده خواهند کرد. گوگل بر این باور است که هوش مصنوعی Imagen، سطح عمیق و بی‌نظیری از درک زبان و واقع‌گرایی را به کاربران ارائه می‌دهد.

سایت رسمی نقاشی گوگل: Imagen: Text-to-Image Diffusion Models

در دنیای امروز، هنر دیجیتال به کمک هوش مصنوعی به شکلی بی‌سابقه در حال گسترش است. ابزارهای جدید، مثل آنچه Google AI ارائه می‌دهد، مرزهای خلاقیت را گسترش داده‌اند. گوگل به عنوان یکی از پیشروترین شرکت‌های تکنولوژی، ابزارهایی توسعه داده که هنرمندان بتوانند با استفاده از هوش مصنوعی آثار هنری خلق کنند. ابزارهایی مثل DeepDream و AutoDraw نمونه‌هایی از این رویکرد هستند.خواستم به بهانه این تکنولوژی به نسل قبلی و نسل جدید این سبک جدید از نقاشی نگاهی تفصیلی داشته باشیم.

خواستم به بهانه این تکنولوژی به نسل قبلی و نسل جدید این سبک جدید از نقاشی نگاهی تفصیلی داشته باشیم.

1. Google AI و دنیای هنر دیجیتال

نسل اول نقاشی هوشمند

این اولین باری نیست ما چنین هوش مصنوعی قدرتمندی را می‌بینیم. برای مثال هوش مصنوعی DALL-E 2 شرکت تحقیقاتی OpenAI که اخیراً نیز رونمایی شده، از چنین قابلیت فوق‌العاده‌ای بهره‌مند است. اما با این حال هوش مصنوعی Imagen گوگل سعی دارد تصاویر واقع بینانه‌تری را به کاربران نشان دهد. محققان این پروژه برای ارزیابی این هوش مصنوعی در مقابل سایر رقبای خود، بنچمارک جدیدی به نام Drawbench را ایجاد کردند. در این وب‌سایت ۲۰۰ متن توسط هوش مصنوعی Imagen و دیگر شرکت‌ها به عکس تبدیل شد و از رأی‌دهندگان خواسته شد تا کیفیت و ارتباط هر تصویر با نوشته را مورد ارزیابی قرار دهند. این افراد اعلام کردند که دقت و صحت تصاویر ایجاد شده توسط Imagen بسیار واقعی‌تر و طبیعی‌تر از سایر مدل‌هاست.بسیاری از سرویس‌های گوگل بر اساس ویژگی یادگیری ماشین و شبکه عصبی کار می‌کنند. شاید برای شما جالب باشد که در یک بازی با گوگل همبازی شوید و ببینید آیا می‌تواند نقاشی‌های شما را درست حدس بزند یا خیر.نقاشی یکی از کارهایی است که همه‌ی ما آن‌ را تجربه کرده‌ایم؛ اما اکثر افراد استعداد نقاشی ندارند. حالا گوگل برای راحت‌ کردن نقاشی به کمک کاربران آمده است، شاید در کودکی شما هم برای رسم یک خانه و خورشید و تپه شروع به خط‌خطی کردن صفحه‌های سفید دفتر‌های نقاشی می‌کردید. نقاشی ما شاید منظوری را می‌رساند اما خوب از آب درنمی‌آمد و اغلب به فکر راهی برای بهتر کردن نقاشی‌ها می‌افتادیم؛

ویژگی‌های بارز ابزارهای Google AI

یادگیری عمیق: استفاده از شبکه‌های عصبی برای درک و بازتولید سبک‌های هنری.
تعامل ساده: حتی کاربران مبتدی هم می‌توانند از ابزارهای گوگل برای خلق هنر استفاده کنند.
تطبیق‌پذیری بالا: قابلیت ترکیب سبک‌های مختلف هنری و ارائه آثار منحصر‌به‌فرد.

تبدیل فکرها و ایده‌های شما به نقاشی

وقتی رمانی می‌خوانیم یا هنگامی که کسی داستانی برایمان تعریف می‌کند یا رخدادی را شرح می‌دهد، ذهن ما بی‌درنگ تصاویر آن را می‌سازد. برخی‌ها تصاویر ذهنی با جزئیات و رنگ و لعاب زیاد تصور می‌کنند و برخی هم تصویرسازی ذهنی، محوی دارند. اما تصور کنید که برنامه‌های هوش مصنوعی بتوانند همین کار را بکنند. با توجه به اینکه این برنامه‌ها بانک داده عظیمی دارند، می‌شود تصور کرد که با آموزش و بهود الگوریتم‌ها چه پتناسلیی برای تصویرسازی بتوانند پیدا کنند.

بر اساس خبری که به تازگی منتشر شده، یک برنامه جدید هوش مصنوعی با توانایی خود برای ترسیم تصاویر واقعی و خلاقانه از یک توضیح متنی، همه را شگفت‌زده کرده.این برنامه DALL-E 2 نام دارد و محصول آزمایشگاه تحقیقاتی OpenAI مستقر در سانفرانسیسکو است. روز چهارشنبه، این آزمایشگاه هوش مصنوعی، از این برنامه رونمایی کرد.

برنامه DALL-E در ژانویه سال 2021 برای اولین بار معرفی شد و نام آن با ترکیب نام «سالوادور دالی» نقاش معروف اسپانیایی و ربات WALL-E از انیمیشنی با همین نام ساخته پیکسار به دست آمده است. OpenAI همچنین ویدیویی را منتشر کرد که در آن جزئیات عملکرد سیستم DALL-E 2 را نشان می‌دهد:

اطلاعات بیشتر از این پروژه: …

اگر به این هوش مصنوعی بگویید “کوآلا در حال رفتن به سمت حلقه بازی بسکتبال “، DALL-E 2 این کار را با ایجاد تصویری واقعی از حیوانی که در هوا به سمت حلقه بسکتبال پرواز می‌کند، انجام می‌دهد. هوش مصنوعی همچنین می‌تواند عکس‌های موجود را با جایگزین کردن تصاویر داخل آن ویرایش کند. به عنوان مثال، اگر برای عکس سگ «گربه ناز» را تایپ کنید، DALL-E 2 سگ را به یک بچه گربه تبدیل می‌کند؛ علاوه بر این، برنامه می‌تواند به یک تصویر اصلی نگاه کند و تغییرات مختلفی از آن را به همان سبک ایجاد کند.از طریق یادگیری عمیق ، DALL-E 2 نه تنها می‌تواند آنچه را که در داخل یک تصویر است تشخیص دهد، بلکه سعی کند آن را تکرار کند؛
شرکت OpenAI اولین نسخه DALL-E را در ژانویه ۲۰۲۱ معرفی کرد. با این حال، نسخه دوم آن، برای ترسیم تصاویر با دقت بیشتر و کیفیت هنری با وضوح بالاتر ارتقا یافته است. حتی DALL-E 2 می‌تواند از چیزهایی که از نظر فنی در دنیای واقعی وجود ندارند، عکس بکشد. به عنوان مثال، اگر به آن بگویید «میمون مالیات پرداخت می‌کند» را بکشد، هوش مصنوعی به اندازه کافی هوشمند است که چنین صحنه‌ای را تولید کند، حتی اگر در طول فرآیند آموزش هرگز با چنین تصویری مواجه نشده باشد. DALL-E 2 همچنین نشان می‌دهد که هوش مصنوعی قادر به کار خلاقانه است و کارهایش شبیه یک نوع اتوماسیون پیشرفته نیست.

آلتمن -مدیرعامل شرکت- به نکات منفی وارد نشد. اما تجربیات گذشته نشان می‌دهد که از چنین هوش‌های مصنوعی می‌توان برای ایجاد دیپ فیک و فریب مردم هم استفاده کرد.

OpenAI یک مقاله تحقیقاتی با اطلاعات بیشتر در مورد چگونگی توسعه DALL-E 2 منتشر کرده . همچنین یک حساب کاربری اینستاگرام ایجاد کرده است که هنر DALL-E 2 را به نمایش می‌گذارد.

معرفی ابزارهای هوش مصنوعی گوگل در نقاشی دیجیتال

الف) DeepDream

ابزاری برای خلق تصاویر سورئال که با استفاده از شبکه‌های عصبی طراحی شده است. این ابزار به تصاویر معمولی بُعدی جدید و تخیلی اضافه می‌کند.چگونه کار می‌کند؟

تصویر اولیه توسط کاربر آپلود می‌شود.
شبکه عصبی، الگوهایی مثل چهره، حیوانات یا اشکال هندسی را شناسایی می‌کند.
تصویر نهایی به یک اثر هنری پیچیده و انتزاعی تبدیل می‌شود.

ب) AutoDraw

ابزاری که طراحی‌های ساده را به نقاشی‌های حرفه‌ای تبدیل می‌کند. مناسب برای افرادی که در طراحی دستی مهارت کمتری دارند.قابلیت‌ها:

تشخیص شکل‌ها: طراحی کاربر را شناسایی و به نسخه حرفه‌ای تبدیل می‌کند.
رایگان و سریع: برای طراحی‌های سریع و ساده بسیار کاربردی است.

جزئیات بیشتر از معرفی AutoDraw

حالا گوگل در دنیای وب‌سایت‌ها به کمک کودکان گذشته و امروز آمده است تا تنها با رسم خط‌هایی از چیز‌‌هایی که در ذهن دارند، نقاشی‌های زیبا بسازد. در وب‌سایت AutoDraw گوگل که یکی از جدیدترین پروژه‌های Creative Lab به شمار می‌رود، می‌توانید یک طرح سریع برای تبریک تولد یا طرح‌هایی که در ذهنتان وجود دارند، بکشید تا هوش مصنوعی گوگل در چند لحظه بهترین و مرتبط‌ترین پیشنهاد‌های مربوط به آن طرح را به شما نشان دهد و آن را به طرحی بسیار زیبا‌تر تبدیل کند.

گوگل می‌گوید این سرویس می‌تواند خط‌خطی‌های کج و نامعلوم را به یک اثر هنری تبدیل کند، گرچه مشخص است که این آثار با نقاشی‌های حرفه‌ای فاصله بسیار دارند. پس از پایان نقاشی می‌توانید اثر هنری خودتان را در قالب فایل Png دریافت کنید.

خوشبختانه محیط این ابزار بسیار ساده طراحی شده است. در قسمت سمت چپ می‌توانید ابزار‌های مربوط به ترسیم نقاشی و در قسمت بالای صفحه پیشنهاد‌های هوش مصنوعی AutoDraw را مشاهده کنید. علاوه بر نسخه دسکتاپ، اپلیکیشن این سرویس برای ابزار‌های موبایل و تبلت هم در دسترس است. البته به یاد داشته باشید که این وب‌سایت به دلیل وجود تحریم‌ها، به طریق معمول! در دسترس کاربران ایرانی قرار ندارد.

در این ویدئو بهتر می‌تونید نحوه عملکرد این سیستم رو درک کنید(نکته: ویدئو از یوتیوب لینک شده است)

ج) Imagen (ابزاری مشابه DALL-E)

یک ابزار تولید تصویر از متن که به کاربران اجازه می‌دهد تنها با توصیف متنی، آثار هنری خلق کنند.

مثال:

ورودی: “یک نقاشی دیجیتال از جنگل مه‌آلود با رنگ‌های نئون.”
خروجی: تصویری دقیق و منطبق بر توصیف کاربر.

جزئیات بیشتر از معرفی Imagen

نسل جدید نقاشی هوشمند Imagen

گوگل از سیستم هوش مصنوعی جدیدی پرده برداشته که می‌تواند با دریافت متن تصویر خلق کند. این سیستم در واقع به کاربر اجازه می‌دهد تا با نوشتن یک متن توصیفی از طریق هوش مصنوعی معادل تصویری آن را ببیند. این شرکت مدعی است که مدل Imagen دارای سطح بی‌بدیلی از واقع‌گرایی و درک عمیقی از زبان‌هاست.

مدل هوش مصنوعی گوگل به راحتی توسط همه کاربران قابل استفاده است. برای مثال اگر بنویسید «تصویر یک گربه پرشین که کلاه گاوچرانی به سر گذاشته، پیراهن قرمز پوشیده و در ساحل گیتار می‌زند» تصویر زیر به دست می‌آید. گوگل می‌گوید در مقایسه‌ای که بین مدل خود و سایر مدل‌های مشابه داشته، فهمیده که کاربران دقت و صحت تصاویر را در این مدل بیشتر می‌پسندند.

اهالی ماونتین ویو شماری از خروجی‌های مدل Imagen را در وب‌سایت این پروژه منتشر کرده‌اند. با این حال، این نمونه‌ها دستچین شده‌اند و ممکن است از بین هزاران خروجی دیگر انتخاب شده باشند که به این خوبی نیستند. مدل Imagen به‌صورت عمومی در دسترس نیست، چون گوگل معتقد است که این مدل هنوز به دلایل مختلف برای استفاده عمومی آماده نیست.

فناوری Imagen گوگل راهکاری برای تبدیل متن به عکس

فناوری Imagen گوگل تصاویر واقعی و بسیار دقیق را از ورودی متن تولید می‌کند. در این فناوری متن توسط رمزگذار بزرگ‌ و ثابت T5-XXL به صورت جاسازی شده کدگذاری می‌شود. جاسازی متن بر روی یک تصویر 64 در 64 با استفاده از یک مدل انتشار شرطی ترسیم می‌شود. نتایج این فناوری بسیار حیرت انگیز هستند. گوگل در مقاله تحقیقاتی خود مدل انتشار متن به تصویر خود را با درک عمیق زبان و سطح استثنایی از فوتورئالیسم ارائه می‌دهد..

نقاشی گوگل باشگاه پرورش محصول نقاشی با هوش مصنوعی گوگل: تحلیل تحولات هنر دیجیتال

توصیف اینکه چقدر فناوری Imagen گوگل، شگفت انگیز و دقیق است کمی دشوار است. همانطور که توسط تیم Google Image Brain توضیح داده شد. این سیستم مبتنی بر مدل متن به تصویر است. سیستم متن به تصویر سیستمی است که به طور خودکار متن زبان طبیعی را به تصویری تبدیل می‌کند که معنای آن را نشان می‌دهد. این مدل‌ها به مجموعه‌ای از جفت‌های متن-تصویر برای ترکیب کردن متکی هستند.

هوش مصنوعی، متن توضیحات را تجزیه و تحلیل می‌کند؛ آنچه نوشته شده را درک می‌کند و از یک پایگاه داده بزرگ، تصویر مربوط به هر عنصر متن را ترسیم می‌کند و با استفاده از ویرایش عکس، تصاویر را در یک کلاژ (هنر ترکیب رنگها) ترکیب می‌کند.

نحوه عملکرد Google Imagen به این صورت است؛ که یک رمزگذار، متن عنوان را به عنوان اولین ورودی دریافت می‌کند. این رمزگذار اطلاعات متنی عنوان را به یک نمایش عددی تبدیل می‌کند که محتوای معنایی متن را به تصویر می‌کشند.

Google Imagen نقاشی گوگل باشگاه پرورش محصول نقاشی با هوش مصنوعی گوگل: تحلیل تحولات هنر دیجیتال

در مرحله بعد، یک مدل تولید تصویر به تدریج نویز یا “TV Static” را به یک تصویر خروجی تبدیل می‌کند. سپس ابزار Imagen شروع به تولید یک تصویر ۶۴×۶۴ پیکسلی می‌کند و پس از دو «رزولوشن فوق‌العاده»، تصویر را به یک عکس ۱۰۲۴×۱۰۲۴ پیکسل تبدیل می‌کند.

پس از آن، یک مدل با وضوح فوق‌العاده برای بزرگ کردن تصویر کوچک با وضوح بیشتر استفاده می‌شود. در نتیجه تصویر به دست آمده با کیفیت مناسب برای بسیاری از رسانه‌های آنلاین، به صورت گرافیکی معنای عنوان شما را منتقل می‌کند.

نقاط ضعف هوش مصنوعی گوگل

«هرچند این رویکرد موجب پیشرفت‌های الگوریتمی سریع در سال‌های اخیر شده، داده‌هایی که از این طریق به دست می‌آیند حاوی کلیشه‌های اجتماعی، نظرات افراطی و توهین‌آمیز یا اشکالات دیگری هستند که به ضرر اقلیت‌ها تمام می‌شود.»
تیم توسعه گوگل Ai

مدل‌های تبدیل متن به تصویر معمولا با مجموعه بزرگی از اطلاعات تعلیم داده می‌شوند که از سطح اینترنت به دست می‌آیند و دستچین نشده‌اند. در نتیجه، مشکلات متنوعی به وجود می‌آید. محققان گوگل می‌گویند:

تبدیل فکرها و ایده‌های شما به نقاشی با استفاده از هوش مصنوعی DALL.E

«اگرچه زیرمجموعه‌ای از این داده‌ها از صافی عبور کرده بود تا نویزها و محتواهای ناخواسته را حذف کند، ولی ما از مجموعه داده LAION-400M هم استفاده کردیم که به داشتن گستره وسیعی از محتواهای نامناسب از جمله تصاویر هرزه‌نگاری، نژادپرستی و کلیشه‌های آسیب‌زننده اجتماعی معروف است.»
در نتیجه، Imagen سوگیری‌های اجتماعی و محدودیت‌های مدل‌های زبانی بزرگ را به ارث برده است. با این حال، در آینده احتمالا بخشی از این مشکلات برطرف خواهند شد.

چگونه Google AI می‌تواند هنر را متحول کند؟

الف) ایجاد دسترسی برای همه

ابزارهای Google AI استفاده از هنر دیجیتال را برای عموم مردم آسان‌تر کرده‌اند. این تکنولوژی‌ها محدودیت‌های فنی را از میان برداشته و خلاقیت را برای همه ممکن کرده‌اند.

ب) الهام‌بخشی به هنرمندان

هوش مصنوعی به عنوان یک ابزار الهام‌بخش عمل می‌کند. هنرمندان می‌توانند از این فناوری برای کشف سبک‌های جدید یا توسعه ایده‌های خلاقانه استفاده کنند.

ج) ترکیب سبک‌ها و فرهنگ‌ها

یکی از جذاب‌ترین قابلیت‌های Google AI، امکان ترکیب سبک‌های مختلف هنری است. این ویژگی به هنرمندان اجازه می‌دهد تا آثار متنوعی خلق کنند که الهام‌گرفته از فرهنگ‌ها و سبک‌های مختلف باشند.

نکات حرفه‌ای: استفاده بهینه از Google AI در نقاشی دیجیتال

جمع بندی

Google AI با ارائه ابزارهایی نوآورانه، دنیای نقاشی دیجیتال را متحول کرده است. این فناوری نه تنها به هنرمندان کمک می‌کند آثار خلاقانه‌تری تولید کنند، بلکه به عموم مردم اجازه می‌دهد تا خلاقیت خود را شکوفا کنند. با استفاده از این ابزارها، شما می‌توانید مرزهای جدیدی از هنر دیجیتال را کشف کنید و به خلق آثاری بپردازید که قبلاً تصورشان غیرممکن بود.

شایان ذکر است که برخی نمونه‌های ایجاد شده توسط این هوش مصنوعی در وب‌‌سایت Imagen website قابل مشاهده است. با این حال، این نمونه‌ها به صورت گلچین انتخاب شده‌اند و ممکن است کیفیت تصاویر دیگر در حد این تصاویر نباشد. همچنین باید اشاره کنیم که مدل Imagen به‌صورت عمومی در دسترس کاربران قرار نگرفته، زیرا غول موتور جست‌وجو معتقد است که این مدل هنوز به دلایل مختلف برای استفاده عمومی آماده نیست.

محققان گوگل در رابطه با این هوش مصنوعی می‌گویند: «اگرچه این رویکرد باعث پیشرفت‌های سریع الگوریتمی در سال‌های اخیر شده، اما اطلاعاتی که از این طریق به دست می‌آیند حاوی طنزهای اجتماعی، نظرات افراطی و توهین‌آمیز یا شیو‌ه‌های دیگری هستند که موجب ناراحتی برخی از اقلیت‌ها خواهد شد. در حالی که بسیاری از این داده‌ها و اطلاعات از فیلترهای مختلفی عبور کردند تا محتواهای نامطلوب آنان پاک شود، ما از مجموعه داده LAION-400M هم استفاده کردیم که به داشتن طیف گسترده‌ای از محتوای نامناسب نظیر توهین‌های نژادپرستانه و کلیشه‌های مضر اجتماعی معروف است.»

بدین ترتیب این احتمال وجود دارد که هوش مصنوعی Imagen کلیشه‌ها و مفاهیم مضر اجتماعی را رمزگذاری کرده باشد و آن را در قالب تصاویر مختلف در معرض دید قرار دهد. باید دید در ادامه گوگل می‌تواند برخی از این مشکلات را حل کند یا نه. به نظر می‌رسد که تا رفع نشدن برخی از مشکلات این مدل، گوگل آن را به صورت عمومی منتشر نخواهد کرد.

آیا تا به حال از ابزارهای هوش مصنوعی برای خلق هنر استفاده کرده‌اید؟ نظرات و تجربیات خود را با ما به اشتراک بگذارید!

View this post on Instagram
A post shared by DALL·E by OpenAI (@openaidalle)

مفید بود؟

18 15