ابزارها و قابلیتهای Google AI تحولی در هنر دیجیتال
گوگل از هوش مصنوعی جدیدش رونمایی کرد که میتواند بر اساس متون دریافتی تصاویر مرتبط به آن را ایجاد کند. ایدهی این سیستم در واقع به این شکل است که کاربران با دادن نوشته و متن به این هوش مصنوعی معادل تصویری آن را مشاهده خواهند کرد. گوگل بر این باور است که هوش مصنوعی Imagen، سطح عمیق و بینظیری از درک زبان و واقعگرایی را به کاربران ارائه میدهد.
- سایت رسمی نقاشی گوگل: Imagen: Text-to-Image Diffusion Models
در دنیای امروز، هنر دیجیتال به کمک هوش مصنوعی به شکلی بیسابقه در حال گسترش است. ابزارهای جدید، مثل آنچه Google AI ارائه میدهد، مرزهای خلاقیت را گسترش دادهاند. گوگل به عنوان یکی از پیشروترین شرکتهای تکنولوژی، ابزارهایی توسعه داده که هنرمندان بتوانند با استفاده از هوش مصنوعی آثار هنری خلق کنند. ابزارهایی مثل DeepDream و AutoDraw نمونههایی از این رویکرد هستند.خواستم به بهانه این تکنولوژی به نسل قبلی و نسل جدید این سبک جدید از نقاشی نگاهی تفصیلی داشته باشیم.
خواستم به بهانه این تکنولوژی به نسل قبلی و نسل جدید این سبک جدید از نقاشی نگاهی تفصیلی داشته باشیم.
1. Google AI و دنیای هنر دیجیتال
نسل اول نقاشی هوشمند
این اولین باری نیست ما چنین هوش مصنوعی قدرتمندی را میبینیم. برای مثال هوش مصنوعی DALL-E 2 شرکت تحقیقاتی OpenAI که اخیراً نیز رونمایی شده، از چنین قابلیت فوقالعادهای بهرهمند است. اما با این حال هوش مصنوعی Imagen گوگل سعی دارد تصاویر واقع بینانهتری را به کاربران نشان دهد. محققان این پروژه برای ارزیابی این هوش مصنوعی در مقابل سایر رقبای خود، بنچمارک جدیدی به نام Drawbench را ایجاد کردند. در این وبسایت ۲۰۰ متن توسط هوش مصنوعی Imagen و دیگر شرکتها به عکس تبدیل شد و از رأیدهندگان خواسته شد تا کیفیت و ارتباط هر تصویر با نوشته را مورد ارزیابی قرار دهند. این افراد اعلام کردند که دقت و صحت تصاویر ایجاد شده توسط Imagen بسیار واقعیتر و طبیعیتر از سایر مدلهاست.بسیاری از سرویسهای گوگل بر اساس ویژگی یادگیری ماشین و شبکه عصبی کار میکنند. شاید برای شما جالب باشد که در یک بازی با گوگل همبازی شوید و ببینید آیا میتواند نقاشیهای شما را درست حدس بزند یا خیر.نقاشی یکی از کارهایی است که همهی ما آن را تجربه کردهایم؛ اما اکثر افراد استعداد نقاشی ندارند. حالا گوگل برای راحت کردن نقاشی به کمک کاربران آمده است، شاید در کودکی شما هم برای رسم یک خانه و خورشید و تپه شروع به خطخطی کردن صفحههای سفید دفترهای نقاشی میکردید. نقاشی ما شاید منظوری را میرساند اما خوب از آب درنمیآمد و اغلب به فکر راهی برای بهتر کردن نقاشیها میافتادیم؛
ویژگیهای بارز ابزارهای Google AI
- یادگیری عمیق: استفاده از شبکههای عصبی برای درک و بازتولید سبکهای هنری.
- تعامل ساده: حتی کاربران مبتدی هم میتوانند از ابزارهای گوگل برای خلق هنر استفاده کنند.
- تطبیقپذیری بالا: قابلیت ترکیب سبکهای مختلف هنری و ارائه آثار منحصربهفرد.
تبدیل فکرها و ایدههای شما به نقاشی
- وقتی رمانی میخوانیم یا هنگامی که کسی داستانی برایمان تعریف میکند یا رخدادی را شرح میدهد، ذهن ما بیدرنگ تصاویر آن را میسازد. برخیها تصاویر ذهنی با جزئیات و رنگ و لعاب زیاد تصور میکنند و برخی هم تصویرسازی ذهنی، محوی دارند. اما تصور کنید که برنامههای هوش مصنوعی بتوانند همین کار را بکنند. با توجه به اینکه این برنامهها بانک داده عظیمی دارند، میشود تصور کرد که با آموزش و بهود الگوریتمها چه پتناسلیی برای تصویرسازی بتوانند پیدا کنند.
بر اساس خبری که به تازگی منتشر شده، یک برنامه جدید هوش مصنوعی با توانایی خود برای ترسیم تصاویر واقعی و خلاقانه از یک توضیح متنی، همه را شگفتزده کرده.این برنامه DALL-E 2 نام دارد و محصول آزمایشگاه تحقیقاتی OpenAI مستقر در سانفرانسیسکو است. روز چهارشنبه، این آزمایشگاه هوش مصنوعی، از این برنامه رونمایی کرد.
برنامه DALL-E در ژانویه سال 2021 برای اولین بار معرفی شد و نام آن با ترکیب نام «سالوادور دالی» نقاش معروف اسپانیایی و ربات WALL-E از انیمیشنی با همین نام ساخته پیکسار به دست آمده است. OpenAI همچنین ویدیویی را منتشر کرد که در آن جزئیات عملکرد سیستم DALL-E 2 را نشان میدهد:
اطلاعات بیشتر از این پروژه: …
اگر به این هوش مصنوعی بگویید “کوآلا در حال رفتن به سمت حلقه بازی بسکتبال “، DALL-E 2 این کار را با ایجاد تصویری واقعی از حیوانی که در هوا به سمت حلقه بسکتبال پرواز میکند، انجام میدهد. هوش مصنوعی همچنین میتواند عکسهای موجود را با جایگزین کردن تصاویر داخل آن ویرایش کند. به عنوان مثال، اگر برای عکس سگ «گربه ناز» را تایپ کنید، DALL-E 2 سگ را به یک بچه گربه تبدیل میکند؛ علاوه بر این، برنامه میتواند به یک تصویر اصلی نگاه کند و تغییرات مختلفی از آن را به همان سبک ایجاد کند.از طریق یادگیری عمیق ، DALL-E 2 نه تنها میتواند آنچه را که در داخل یک تصویر است تشخیص دهد، بلکه سعی کند آن را تکرار کند؛
شرکت OpenAI اولین نسخه DALL-E را در ژانویه ۲۰۲۱ معرفی کرد. با این حال، نسخه دوم آن، برای ترسیم تصاویر با دقت بیشتر و کیفیت هنری با وضوح بالاتر ارتقا یافته است. حتی DALL-E 2 میتواند از چیزهایی که از نظر فنی در دنیای واقعی وجود ندارند، عکس بکشد. به عنوان مثال، اگر به آن بگویید «میمون مالیات پرداخت میکند» را بکشد، هوش مصنوعی به اندازه کافی هوشمند است که چنین صحنهای را تولید کند، حتی اگر در طول فرآیند آموزش هرگز با چنین تصویری مواجه نشده باشد. DALL-E 2 همچنین نشان میدهد که هوش مصنوعی قادر به کار خلاقانه است و کارهایش شبیه یک نوع اتوماسیون پیشرفته نیست.
آلتمن -مدیرعامل شرکت- به نکات منفی وارد نشد. اما تجربیات گذشته نشان میدهد که از چنین هوشهای مصنوعی میتوان برای ایجاد دیپ فیک و فریب مردم هم استفاده کرد.
OpenAI یک مقاله تحقیقاتی با اطلاعات بیشتر در مورد چگونگی توسعه DALL-E 2 منتشر کرده . همچنین یک حساب کاربری اینستاگرام ایجاد کرده است که هنر DALL-E 2 را به نمایش میگذارد.
معرفی ابزارهای هوش مصنوعی گوگل در نقاشی دیجیتال
الف) DeepDream
ابزاری برای خلق تصاویر سورئال که با استفاده از شبکههای عصبی طراحی شده است. این ابزار به تصاویر معمولی بُعدی جدید و تخیلی اضافه میکند.چگونه کار میکند؟
- تصویر اولیه توسط کاربر آپلود میشود.
- شبکه عصبی، الگوهایی مثل چهره، حیوانات یا اشکال هندسی را شناسایی میکند.
- تصویر نهایی به یک اثر هنری پیچیده و انتزاعی تبدیل میشود.
ب) AutoDraw
ابزاری که طراحیهای ساده را به نقاشیهای حرفهای تبدیل میکند. مناسب برای افرادی که در طراحی دستی مهارت کمتری دارند.قابلیتها:
- تشخیص شکلها: طراحی کاربر را شناسایی و به نسخه حرفهای تبدیل میکند.
- رایگان و سریع: برای طراحیهای سریع و ساده بسیار کاربردی است.
جزئیات بیشتر از معرفی AutoDraw
حالا گوگل در دنیای وبسایتها به کمک کودکان گذشته و امروز آمده است تا تنها با رسم خطهایی از چیزهایی که در ذهن دارند، نقاشیهای زیبا بسازد. در وبسایت AutoDraw گوگل که یکی از جدیدترین پروژههای Creative Lab به شمار میرود، میتوانید یک طرح سریع برای تبریک تولد یا طرحهایی که در ذهنتان وجود دارند، بکشید تا هوش مصنوعی گوگل در چند لحظه بهترین و مرتبطترین پیشنهادهای مربوط به آن طرح را به شما نشان دهد و آن را به طرحی بسیار زیباتر تبدیل کند.
گوگل میگوید این سرویس میتواند خطخطیهای کج و نامعلوم را به یک اثر هنری تبدیل کند، گرچه مشخص است که این آثار با نقاشیهای حرفهای فاصله بسیار دارند. پس از پایان نقاشی میتوانید اثر هنری خودتان را در قالب فایل Png دریافت کنید.
خوشبختانه محیط این ابزار بسیار ساده طراحی شده است. در قسمت سمت چپ میتوانید ابزارهای مربوط به ترسیم نقاشی و در قسمت بالای صفحه پیشنهادهای هوش مصنوعی AutoDraw را مشاهده کنید. علاوه بر نسخه دسکتاپ، اپلیکیشن این سرویس برای ابزارهای موبایل و تبلت هم در دسترس است. البته به یاد داشته باشید که این وبسایت به دلیل وجود تحریمها، به طریق معمول! در دسترس کاربران ایرانی قرار ندارد.
در این ویدئو بهتر میتونید نحوه عملکرد این سیستم رو درک کنید(نکته: ویدئو از یوتیوب لینک شده است)
ج) Imagen (ابزاری مشابه DALL-E)
یک ابزار تولید تصویر از متن که به کاربران اجازه میدهد تنها با توصیف متنی، آثار هنری خلق کنند.
مثال:
- ورودی: “یک نقاشی دیجیتال از جنگل مهآلود با رنگهای نئون.”
- خروجی: تصویری دقیق و منطبق بر توصیف کاربر.
جزئیات بیشتر از معرفی Imagen
نسل جدید نقاشی هوشمند Imagen
گوگل از سیستم هوش مصنوعی جدیدی پرده برداشته که میتواند با دریافت متن تصویر خلق کند. این سیستم در واقع به کاربر اجازه میدهد تا با نوشتن یک متن توصیفی از طریق هوش مصنوعی معادل تصویری آن را ببیند. این شرکت مدعی است که مدل Imagen دارای سطح بیبدیلی از واقعگرایی و درک عمیقی از زبانهاست.
مدل هوش مصنوعی گوگل به راحتی توسط همه کاربران قابل استفاده است. برای مثال اگر بنویسید «تصویر یک گربه پرشین که کلاه گاوچرانی به سر گذاشته، پیراهن قرمز پوشیده و در ساحل گیتار میزند» تصویر زیر به دست میآید. گوگل میگوید در مقایسهای که بین مدل خود و سایر مدلهای مشابه داشته، فهمیده که کاربران دقت و صحت تصاویر را در این مدل بیشتر میپسندند.
اهالی ماونتین ویو شماری از خروجیهای مدل Imagen را در وبسایت این پروژه منتشر کردهاند. با این حال، این نمونهها دستچین شدهاند و ممکن است از بین هزاران خروجی دیگر انتخاب شده باشند که به این خوبی نیستند. مدل Imagen بهصورت عمومی در دسترس نیست، چون گوگل معتقد است که این مدل هنوز به دلایل مختلف برای استفاده عمومی آماده نیست.
فناوری Imagen گوگل راهکاری برای تبدیل متن به عکس
فناوری Imagen گوگل تصاویر واقعی و بسیار دقیق را از ورودی متن تولید میکند. در این فناوری متن توسط رمزگذار بزرگ و ثابت T5-XXL به صورت جاسازی شده کدگذاری میشود. جاسازی متن بر روی یک تصویر 64 در 64 با استفاده از یک مدل انتشار شرطی ترسیم میشود. نتایج این فناوری بسیار حیرت انگیز هستند. گوگل در مقاله تحقیقاتی خود مدل انتشار متن به تصویر خود را با درک عمیق زبان و سطح استثنایی از فوتورئالیسم ارائه میدهد..
توصیف اینکه چقدر فناوری Imagen گوگل، شگفت انگیز و دقیق است کمی دشوار است. همانطور که توسط تیم Google Image Brain توضیح داده شد. این سیستم مبتنی بر مدل متن به تصویر است. سیستم متن به تصویر سیستمی است که به طور خودکار متن زبان طبیعی را به تصویری تبدیل میکند که معنای آن را نشان میدهد. این مدلها به مجموعهای از جفتهای متن-تصویر برای ترکیب کردن متکی هستند.
هوش مصنوعی، متن توضیحات را تجزیه و تحلیل میکند؛ آنچه نوشته شده را درک میکند و از یک پایگاه داده بزرگ، تصویر مربوط به هر عنصر متن را ترسیم میکند و با استفاده از ویرایش عکس، تصاویر را در یک کلاژ (هنر ترکیب رنگها) ترکیب میکند.
نحوه عملکرد Google Imagen به این صورت است؛ که یک رمزگذار، متن عنوان را به عنوان اولین ورودی دریافت میکند. این رمزگذار اطلاعات متنی عنوان را به یک نمایش عددی تبدیل میکند که محتوای معنایی متن را به تصویر میکشند.
در مرحله بعد، یک مدل تولید تصویر به تدریج نویز یا “TV Static” را به یک تصویر خروجی تبدیل میکند. سپس ابزار Imagen شروع به تولید یک تصویر ۶۴×۶۴ پیکسلی میکند و پس از دو «رزولوشن فوقالعاده»، تصویر را به یک عکس ۱۰۲۴×۱۰۲۴ پیکسل تبدیل میکند.
پس از آن، یک مدل با وضوح فوقالعاده برای بزرگ کردن تصویر کوچک با وضوح بیشتر استفاده میشود. در نتیجه تصویر به دست آمده با کیفیت مناسب برای بسیاری از رسانههای آنلاین، به صورت گرافیکی معنای عنوان شما را منتقل میکند.
نقاط ضعف هوش مصنوعی گوگل
«هرچند این رویکرد موجب پیشرفتهای الگوریتمی سریع در سالهای اخیر شده، دادههایی که از این طریق به دست میآیند حاوی کلیشههای اجتماعی، نظرات افراطی و توهینآمیز یا اشکالات دیگری هستند که به ضرر اقلیتها تمام میشود.»
تیم توسعه گوگل Ai
مدلهای تبدیل متن به تصویر معمولا با مجموعه بزرگی از اطلاعات تعلیم داده میشوند که از سطح اینترنت به دست میآیند و دستچین نشدهاند. در نتیجه، مشکلات متنوعی به وجود میآید. محققان گوگل میگویند:
«اگرچه زیرمجموعهای از این دادهها از صافی عبور کرده بود تا نویزها و محتواهای ناخواسته را حذف کند، ولی ما از مجموعه داده LAION-400M هم استفاده کردیم که به داشتن گستره وسیعی از محتواهای نامناسب از جمله تصاویر هرزهنگاری، نژادپرستی و کلیشههای آسیبزننده اجتماعی معروف است.»
در نتیجه، Imagen سوگیریهای اجتماعی و محدودیتهای مدلهای زبانی بزرگ را به ارث برده است. با این حال، در آینده احتمالا بخشی از این مشکلات برطرف خواهند شد.
چگونه Google AI میتواند هنر را متحول کند؟
الف) ایجاد دسترسی برای همه
ابزارهای Google AI استفاده از هنر دیجیتال را برای عموم مردم آسانتر کردهاند. این تکنولوژیها محدودیتهای فنی را از میان برداشته و خلاقیت را برای همه ممکن کردهاند.
ب) الهامبخشی به هنرمندان
هوش مصنوعی به عنوان یک ابزار الهامبخش عمل میکند. هنرمندان میتوانند از این فناوری برای کشف سبکهای جدید یا توسعه ایدههای خلاقانه استفاده کنند.
ج) ترکیب سبکها و فرهنگها
یکی از جذابترین قابلیتهای Google AI، امکان ترکیب سبکهای مختلف هنری است. این ویژگی به هنرمندان اجازه میدهد تا آثار متنوعی خلق کنند که الهامگرفته از فرهنگها و سبکهای مختلف باشند.
نکات حرفهای
نکاتی برای استفاده بهینه از Google AI در نقاشی دیجیتال
شما به این سطح از محتوا دسترسی ندارید و یا وارد اکانت خود نشدید.
ورود یا عضویت | خرید یا تمدید اشتراک
.: برای دانلود کاتالوگ آشنایی بامحتوای دیزاین کلاب اینجا کلیک کنید :.
جمع بندی
Google AI با ارائه ابزارهایی نوآورانه، دنیای نقاشی دیجیتال را متحول کرده است. این فناوری نه تنها به هنرمندان کمک میکند آثار خلاقانهتری تولید کنند، بلکه به عموم مردم اجازه میدهد تا خلاقیت خود را شکوفا کنند. با استفاده از این ابزارها، شما میتوانید مرزهای جدیدی از هنر دیجیتال را کشف کنید و به خلق آثاری بپردازید که قبلاً تصورشان غیرممکن بود.
شایان ذکر است که برخی نمونههای ایجاد شده توسط این هوش مصنوعی در وبسایت Imagen website قابل مشاهده است. با این حال، این نمونهها به صورت گلچین انتخاب شدهاند و ممکن است کیفیت تصاویر دیگر در حد این تصاویر نباشد. همچنین باید اشاره کنیم که مدل Imagen بهصورت عمومی در دسترس کاربران قرار نگرفته، زیرا غول موتور جستوجو معتقد است که این مدل هنوز به دلایل مختلف برای استفاده عمومی آماده نیست.
محققان گوگل در رابطه با این هوش مصنوعی میگویند: «اگرچه این رویکرد باعث پیشرفتهای سریع الگوریتمی در سالهای اخیر شده، اما اطلاعاتی که از این طریق به دست میآیند حاوی طنزهای اجتماعی، نظرات افراطی و توهینآمیز یا شیوههای دیگری هستند که موجب ناراحتی برخی از اقلیتها خواهد شد. در حالی که بسیاری از این دادهها و اطلاعات از فیلترهای مختلفی عبور کردند تا محتواهای نامطلوب آنان پاک شود، ما از مجموعه داده LAION-400M هم استفاده کردیم که به داشتن طیف گستردهای از محتوای نامناسب نظیر توهینهای نژادپرستانه و کلیشههای مضر اجتماعی معروف است.»
بدین ترتیب این احتمال وجود دارد که هوش مصنوعی Imagen کلیشهها و مفاهیم مضر اجتماعی را رمزگذاری کرده باشد و آن را در قالب تصاویر مختلف در معرض دید قرار دهد. باید دید در ادامه گوگل میتواند برخی از این مشکلات را حل کند یا نه. به نظر میرسد که تا رفع نشدن برخی از مشکلات این مدل، گوگل آن را به صورت عمومی منتشر نخواهد کرد.
آیا تا به حال از ابزارهای هوش مصنوعی برای خلق هنر استفاده کردهاید؟ نظرات و تجربیات خود را با ما به اشتراک بگذارید!