التكنولوجيا والبرمجة

كيف تستخدم Dall-E 3 في إنشاء الصور

تخيل أنك تستطيع تكوين أي صورة ترغب بها، من بورتريه واقعي لرائد فضاء يعيش على القمر إلى لوحة مائية لقطط تلعب الشطرنج في مكتبة تنعدم بها الجاذبية. هذه هي سحرية الذكاء الاصطناعي التوليدي للصور، وهي تقنية غيرت مشهد الإبداع البصري في غضون سنوات قليلة.

تطور إنشاء الصور باستخدام الذكاء الاصطناعي التوليدي

بدأت بذور إنشاء الصور عبر الذكاء الاصطناعي التوليدي في السبعينيات مع نماذج رائدة مثل نظام “آرون” لهارولد كوهن، الذي استخدم قواعد بسيطة لإنشاء فن تجريدي. ومنذ ذلك الحين، شهد الذكاء الاصطناعي تقدماً كبيراً وتطوراً مع مرور العقود، حيث تعلمت الشبكات العصبية تدريجياً استيعاب تعقيدات الصور الواقعية. لكن لم ينطلق هذا المجال فعلياً إلا في منتصف العقد الثاني من القرن الحادي والعشرين.

في عام 2014، ظهرت الشبكات التوليدية التنافسية (GANs)، والتي وضعت شبكتين عصبيتين في مواجهة بعضهما البعض: مولد لإنشاء الصور، ومميز يحاول تمييزها عن الصور الحقيقية. دفع هذا التدريب التنافسي حدود الواقعية، متهيبين الطريق لنماذج مثل StyleGAN2، التي يمكنها توليد صور فوتوغرافية واقعية وتغيير الصور الموجودة بالفعل من خلال تغيير أسلوبها.

اللاعبون الرئيسيون في مجال الذكاء الاصطناعي التوليدي للصور

نماذج OpenAI: Dall-E 2 وDall-E 3

تُعرف هذه النماذج بقدرتها على توليد صور غاية في الواقعية والسريالية بناءً على الأوامر النصية. غالباً ما تثير المخرجات شعورًا بالدهشة والأمل، مما يشجع على الاستكشاف والتعبير الفني.

Google AI: نموذج Imagen

يبرع هذا النموذج في توليد الصور التي تلتزم بأنماط بصرية محددة، مما يجعله مثالياً لمهام مثل إنشاء فن المفاهيم والتصميم الجرافيكي. يمكنه أيضًا دمج عناصر من الصور الفوتوغرافية الموجودة في مخرجاته، مما يوفر مزيجًا فريدًا من الواقعية والحرية الفنية.

منصة Midjourney

تقديم واجهة مستخدم سهلة الاستخدام، والتركيز على التفسير الفني للأوامر النصية. تميل مخرجاتها إلى أن تكون أكثر تجريدية ولوحات، وغالباً ما تقترب من جمالية السريالية أو الخيالية.

DreamStudio (Stable Diffusion)

تعتبر هذه المنصة المفتوحة المصدر أنها توفر للمستخدمين درجة عالية من التحكم في عملية توليد الصور. يمكن للمستخدمين ضبط معايير وإعدادات مختلفة لتعديل مخرجات النموذج، مما يجعلها مثالية لأولئك الذين يبحثون عن تجربة إبداعية تعتمد على التدخل اليدوي.

النمو السريع للذكاء الاصطناعي التوليدي في إنشاء الصور

يشهد سوق الذكاء الاصطناعي التوليدي للصور نمواً متسارعاً. وفقاً لتقرير صادر عن Grand View Research في 2023، من المتوقع أن يصل حجم السوق العالمي إلى 3.44 مليار دولار بحلول عام 2030، بمعدل نمو سنوي مركب (CAGR) يبلغ 32.4٪. يعود هذا النمو إلى الطلب المتزايد على المحتوى البصري، والتقدم في تكنولوجيا الذكاء الاصطناعي، وزيادة الوصول إلى المنصات سهلة الاستخدام.

في النصف الأول من عام 2023، شهد مجال الذكاء الاصطناعي التوليدي للفنون استثماراً كبيراً بقيمة تزيد عن 5 مليارات دولار، وفقاً لتقرير CB Insights. هذا يمثل جزءاً كبيراً من مجمل الاستثمارات في الذكاء الاصطناعي، مما يدل على الاهتمام المتزايد والإمكانات الموجودة في هذا المجال. لا يظهر هذا الاتجاه أي علامات على التباطؤ، بفضل الاستثمارات الكبيرة مثل صفقة OpenAI بقيمة 10 مليارات دولار من مايكروسوفت واستثمار أمازون بقيمة 4 مليارات دولار في Anthropic.

إن تطور الذكاء الاصطناعي التوليدي في إنشاء الصور يمحو بسرعة الحدود بين الإبداع البشري وإبداع الآلة. مع تقدم التكنولوجيا، نتوقع نماذج أكثر تطوراً تتمكن من استيعاب الأوامر المتكاملة، وتقديم أنماط فنية متنوعة وتعزيز التعاون.

دليل خطوة بخطوة لاستخدام Dall-E 3 لإنشاء الصور

الخطوة 1: الانضمام إلى قائمة الانتظار لـ Dall-E 3 على موقع OpenAI

حاليًا، Dall-E 3 في مرحلة تجريبية مغلقة، ولا يمكن الوصول إليها إلا من خلال نظام قائمة الانتظار. يمكن للمستخدمين التسجيل في قائمة الانتظار على موقع OpenAI.

الخطوة 2: كتابة أوامر نصية مفصلة

بمجرد الحصول على وصول، يمكن للمستخدمين صياغة أمر نصي واضح وموجز يصف الصورة التي يرغبون في إنشائها. يجب أن يكون المستخدمون محددين في تفاصيل مثل التكوين، الأسلوب، والإضاءة. كلما كان الأمر النصي دقيقاً، كان بإمكان النموذج فهم رؤية المستخدم بشكل أفضل.

مثال على أمر نصي: “قم بإنشاء صورة تصور مشهدًا أسطوريًا حيث تكون الرموز تعتمد على تقنية البلوكشين هي مصدر الحياة، مع تصاميم معقدة ترمز إلى أنظمة مالية آمنة وشفافة.”

الخطوة 3: استكشاف عدة نسخ من الصورة

يسمح Dall-E 3 للمستخدمين بتوليد عدة نسخ من الصورة بناءً على الأمر النصي الأولي. يمكن للمستخدمين تنقيح أمرهم أو استخدام ميزة “Outpainting” لإضافة تفاصيل إضافية إلى الصورة المولدة.

الخطوة 4: تحميل الصور ضمن الإرشادات الاستخدامية

بمجرد أن يكون المستخدمون راضين عن الصورة، يمكنهم تحميلها بتنسيقات متعددة لاستخدامها. من الجدير بالذكر ضرورة التزام المستخدمين بإرشادات الاستخدام الخاصة بـ OpenAI فيما يتعلق بالتطبيقات التجارية وغير التجارية.

هل صور Dall-E مجانية للاستخدام التجاري؟

تحدد OpenAI السياسات والشروط التي يجب أن يلتزم بها المستخدمون فيما يتعلق بالاستخدام التجاري للصور المنتجة عبر Dall-E. بشكل عام، يملك الفرد الصور التي ينشئها باستخدام Dall-E، بما في ذلك حقوق إعادة الطباعة والبيع والاستخدام للترويج، بغض النظر عما إذا كانت الصور قد أُنتِجَت عبر أرصدة مجانية أو مدفوعة.

كيف تعمل أرصدة Dall-E؟

رصيد Dall-E هو وحدة تستخدمها OpenAI لقياس وإدارة استخدام نظام توليد الصور Dall-E. يتم تقديم الأرصدة للمستخدمين لاستخدام Dall-E في إنشاء الصور. وهناك نوعان من الأرصدة:

الأرصدة المجانية

تقدم OpenAI غالباً أرصدة مجانية للمستخدمين، خاصة عند التسجيل أو كجزء من العروض الترويجية. تمكّن هذه الأرصدة المستخدمين من إنشاء الصور دون أي تكلفة. وكان الأوائل الذين سجلوا في Dall-E قبل 6 أبريل 2023 مؤهلين للحصول على أرصدة مجانية. تنتهي صلاحية هذه الأرصدة بعد شهر واحد من الإصدار، ويتم تجديدها شهرياً. على سبيل المثال، إذا تم استلام الأرصدة في 19 ديسمبر، فسيتم إعادة تعبئتها في 19 يناير. بالنسبة لأولئك الذين انضموا في 29 أو 30 أو 31 من أي شهر، يتم إعادة تعبئة أرصدتهم المجانية في 28 من كل شهر لاحق.

الأرصدة المدفوعة

بمجرد نفاد الأرصدة المجانية، يمكن للمستخدمين شراء أرصدة إضافية لمواصلة استخدام Dall-E. عادةً ما يتم شراء هذه الأرصدة في حزم أو مجموعات. يمكن شراء أرصدة Dall-E بالنقر على زر “شراء الأرصدة”، الموجود في صفحة حسابهم أو في القائمة المنسدلة تحت صورة ملفهم الشخصي. يتم تحديد الأسعار وعدد الصور التي يمكن توليدها لكل رصيد بواسطة OpenAI وقد تختلف مع مرور الوقت أو بين مختلف فئات المستخدمين.

كم تبلغ تكلفة استخدام Dall-E؟

تختلف تكلفة استخدام Dall-E بناءً على الخطة التي يختارها المستخدم. قدمت OpenAI عدداً معيناً من الأرصدة المجانية عند التسجيل، والتي يمكن استخدامها لإنشاء عدد محدود من الصور. بمجرد استنفاد هذه الأرصدة المجانية، يمكن للمستخدمين شراء أرصدة إضافية في مجموعات تشمل 115 عملية إنتاج بقيمة 15 دولاراً. بالنسبة لـ Dall-E 3، تبلغ تكلفة الصور ذات الجودة العادية بدقة 1024×1024 حوالي 0.04 دولار للصورة، وبدقة 1024×1792 أو 1792×1024 حوالي 0.08 دولار للصورة. أما الصور ذات الجودة العالية بدقة 1024×1024 تبلغ تكلفتها 0.08 دولار للصورة، وللدقة الأكبر 1024×1792 أو 1792×1024 تكلف 0.12 دولار للصورة. Dall-E 2 يقدم الصور بدقة 1024×1024 مقابل 0.02 دولار للصورة، وبدقة 512×512 مقابل 0.018 دولار، وبدقة 256×256 مقابل 0.016 دولار.

كيفية استخدام مولدات الفن التوليدية بشكل أخلاقي

يتطلب الاستخدام الأخلاقي لمولدات الفن التوليدية مثل Dall-E اتباع شروط الاستخدام الخاصة بالخدمة، واحترام الملكية الفكرية من خلال تجنب إنشاء محتوى يحمل حقوق الطبع والنشر أو العلامات التجارية، وضمان الخصوصية بعدم إنشاء صور لأفراد خاصين بدون موافقتهم. كما أن التفكير في الجوانب الأخلاقية لطلبات الصور وتجنب أي شيء يمكن أن يسيء أو يضر أو يعزز الصورة النمطية أمر بالغ الأهمية. يجب استخدام الصور المُنشأة بواسطة الذكاء الاصطناعي عند الاقتضاء، خاصةً عندما تكون الأصالة مطلوبة. أن يظل المستخدمون مطلعين على تحديثات السياسات والتعرف على تأثيرها على الفنانين والمبدعين يُعد أيضًا من الأساسيات. وعند الحاجة، ينبغي تقديم النسبة الملائمة للصور المُنشأة بواسطة الذكاء الاصطناعي.

نجم العملات

خبير في التداول الإلكتروني، يقدم رؤى فريدة وتحليلات متجددة لأسواق العملات الرقمية المتغيرة.
زر الذهاب إلى الأعلى