عمومی
28

مه

2022

هوش مصنوعی Imagen از متن عکس می‌سازد!

تقریباً یک ماه پس از معرفی فناوری DALL-E 2 جدیدترین سیستم هوش مصنوعی OpenAI برای ساختن تصاویر از روی متن، گوگل سیستم تبدیل متن به عکس خودش با عنوان Imagen را معرفی کرد.
نتایج سیستم‌ جدید جالب توجه هستند. Imagen با گرفتن یک ورودی متنی مثلاً «یک سگ که کلاه آبی و لباس قرمز پوشیده» کار خود را شروع می‌کند و سپس رمزگذار T5-XXL آن متن ورودی را تبدیل به توابع ریاضیاتی می‌کند. سپس این توابع به یک عکس کوچک ۶۴ در ۶۴ پیکسلی تبدیل می‌شوند. Imagen این عکس کوچک را به یک عکس ۲۵۶ در ۲۵۶ پیکسلی و ۱۰۲۴ در ۱۰۲۴ پیکسلی تبدیل می‌کند.
به‌عنوان مثال، تصویر زیر که از متن «a cute corgi lives in a house made out of sushi» (یک سگ نژاد کورگی که زیر خانه‌ی ساخته‌شده از سوشی زندگی می‌کند) را در نظر بگیرد. این تصویر به‌شکل شگفت‌انگیزی واقع‌گرایانه و باورپذیر است، طوری که انگار واقعاً کسی یک خانه از سوشی برای آن سگ درست کرده است.

‘A cute corgi lives in a house made out of sushi.’
‌ این یک عکس بامزه است. در واقع، انگار تمامی آنچه تاکنون از Imagen دیده‌ایم بامزه هستند: حیوانات پشمالو در لباس‌های خنده‌دار، کاکتوسی ب..