گوگل نسل دوم هوش مصنوعی Imagen را معرفی کرد؛ پیشرفته‌ترین تکنولوژی ساخت عکس با دستور متنی

منبع: تکراتو

2

1402/9/23

12:43


نسل دوم هوش مصنوعی Imagen رسما توسط گوگل معرفی شد که قابلیت‌های پیشرفته و عملکرد خیره کننده این هوش مصنوعی را به رخ می‌کشد.

گوگل نسل دوم هوش مصنوعی Imagen را معرفی کرد؛ پیشرفته‌ترین تکنولوژی ساخت عکس با دستور متنی

نسل دوم هوش مصنوعی Imagen رسما توسط گوگل معرفی شد که قابلیت‌های پیشرفته و عملکرد خیره کننده این هوش مصنوعی را به رخ می‌کشد.

در بیانیه‌ای مطبوعاتی، گوگل دومین نسخه از هوش مصنوعی Imagen را به معرفی کرد. این مدل هوش مصنوعی قابلیت ایجاد و ویرایش تصاویر بر اساس متن را داراست و به‌طور گسترده برای مشتریان Google Cloud که از Vertex AI استفاده می‌کنند و دسترسی آن‌ها تأیید شده است، در دسترس قرار می‌گیرد.


ادامه مطلب در ادامه

بیشتر بخوانید:


نسل دوم هوش مصنوعی Imagen گوگل

گوگل اطلاعات مربوط به داده‌های استفاده شده برای آموزش مدل جدید را منتشر نکرده است و به سازندگانی که ممکن است به‌طور ناخواسته در مجموعه‌داده‌ها شرکت داشته باشند، فرصتی برای انصراف یا درخواست غرامت ارائه نمی‌دهد.

Imagen 2 نام مدل هوش مصنوعی گوگل است که پیش‌نمایش آن در کنفرانس I/O اردیبهشت و خرداد معرفی شد. این مدل توسط کسب‌وکار DeepMind توسعه یافته است. قبلاً این شرکت از به اشتراک‌گذاری نمونه‌های تصاویر خودداری می‌کرد.

گوگل ادعا می‌کند که Imagen 2 در مقایسه با نسل اول خود، کیفیت تصویر را به‌طور قابل‌توجهی بهبود داده است. همچنین، گوگل ویژگی‌های به‌روز شده هوش مصنوعی خود را معرفی کرده است که امکان اضافه کردن متن و لوگو به تصاویر را فراهم می‌کند.

در یک کنفرانس مطبوعاتی، توماس کوریان، مدیرعامل گوگل کلود اظهار داشت:

“اگر می‌خواهید تصاویری که با متن پوشانده شده را مانند تصاویر تبلیغاتی ایجاد کنید، این امکان برای شما فراهم شده است.”

Imagen 2 در رقابت با سایر مدل‌های تولید تصویر پیشرو مانند DALL-E 3 و Titan Image Generator قرار دارد. با این حال، دو تفاوت احتمالی میان آنها وجود دارد؛ Imagen 2 می‌تواند متن را به چندین زبان تولید کند و همچنین لوگو را روی تصاویر قرار دهد.

رئیس محصولات رسانه‌ای مولد گوگل توضیح می‌دهد:

“Imagen 2 می‌تواند نشان‌ها، علائم و لوگوهای انتزاعی تولید کند و این توانایی را داراست که این لوگوها را روی محصولات، لباس‌ها، کارت‌های ویزیت و سایر سطوح قرار دهد.”

با بهره‌گیری از تکنیک‌های جدید یادگیری و مدل‌سازی، Imagen 2 قادر است پرسش‌های توصیفی‌تر و طولانی‌تر را درک کند و به سؤالات مربوط به عناصر تصویر پاسخ‌های تفصیلی ارائه دهد. گوگل ادعا می‌کند که این تکنیک‌ها بهبودی در درک چند زبانه Imagen 2 ایجاد می‌کنند و مدل را قادر می‌سازند درخواستی را با یک زبان به خروجی در زبان دیگر ترجمه کند.

گوگل برای اعمال واترمارک‌های نامرئی بر روی تصاویر از SynthID استفاده می‌کند که توسط دیپ‌مایند توسعه یافته است. البته، تشخیص واترمارک‌ها به ابزاری خاص نیاز دارد که توسط گوگل ارائه شده و در دسترس عموم قرار ندارد.

گوگل در مورد داده‌های استفاده شده برای آموزش Imagen 2 سکوت کرده است و این موضوع هنوز موضوعی قانونی است که در دادگاه بحث می‌شود. در حال حاضر، گوگل یک سیاست جبران خسارت برای مشتریان واجد شرایط Vertex AI ارائه می‌دهد.

استفاده از هوش مصنوعی مولد برای تولید تصاویر، نگرانی‌هایی برای مشتریان و توسعه‌دهندگان سازمانی ایجاد می‌کند. تحقیقات نشان می‌دهد که نسل اول Imagen نیز از این پدیده مصون نبوده و تصاویری قابل شناسایی از افراد واقعی، آثار دارای حق کپی‌رایت توسط هنرمندان و موارد دیگر را در صورت درخواست با استفاده از روش‌های خاص ارائه داده است.

در نظرسنجی اخیر، تقریباً یک سوم شرکت‌ها اعلام کرده‌اند که مالکیت معنوی بزرگترین نگرانی آن‌ها در مورد استفاده از هوش مصنوعی مولد است.

بیشتر بخوانید:

نظر شما در مورد نسل دوم هوش مصنوعی Imagen چیست؟ نظرات خود را با ما به اشتراک گذاشته و اخبار فناوری را از تکراتو دنبال کنبد.

.

منبع: Google

مطالب مشابه


نظرات


تصویری


ویدئو