هل يمكن للذكاء الاصطناعي قريبًا كتابة القصص الخيالية أو إنشاء مقاطع فيديو طويلة أو تأليف الموسيقى؟ حسنًا ، هذا ما تحاول Google فهمه. من خلال مشروع Wordcraft الجديد ، يقوم برنامج الدردشة LaMDA من Google الآن بكتابة الروايات بناءً على مدخلات الكتاب. LaMDA هو الذكاء الاصطناعي للمحادثة من Google والذي أثار الجدل في وقت سابق من هذا العام بعد أن ادعى مهندس أن الذكاء الاصطناعي كان واعيًا. كشفت Google في حدث الذكاء الاصطناعي الخاص بها في نيويورك أنها “تعاونت مع الكتاب المحترفين الذين استخدموا محرر Wordcraft لإنشاء مجموعة من القصص القصيرة.” هذه القصص متاحة الآن على الإنترنت ليقرأها الجمهور.
“أعتقد أننا سنغير الطريقة التي يعبر بها الناس عن أنفسهم بشكل إبداعي. تعاملنا مع مؤلفين محترفين ودعوناهم لكتابة روايات تجريبية باستخدام LaMDA كأداة. تعلمنا أيضًا أنه ليس بالأمر السهل. LaMDA أيضًا لا تقوم بكل العمل. قال دوجلاس إيك ، كبير مديري الأبحاث في Google Research ، في إيجاز صحفي قبل الحدث ، إن الكتاب هم من يقومون بهذا العمل.
فهل ترى Google مستقبلاً يمكن أن يحل فيه LaMDA محل الكتاب البشريين؟ ليس بعد ، وفقًا لـ Eck ، الذي اعترف بأنه إذا طلب أحد من LaMDA كتابة القصة بأكملها ، فإن النتائج ليست جيدة أو مثيرة للاهتمام. “المثير للاهتمام هو استخدام التكنولوجيا كتوابل ، إضافة إلى ما تحاول القيام به. سنستمر في تحريك الشريط بشأن ما يمكن أن تفعله هذه الأدوات. لكن هذه الأدوات ستبقى بشكل فعال نوعًا من التوابل ، وستبقى كوسيلة لتمكيننا من سرد القصص بشكل مختلف “، أوضح.
كما أقر بأن هذه النماذج تشكل مخاطر جسيمة ، والهدف منها ليس طمس التمييز بين ما هو حقيقي وما هو قائم على الذكاء الاصطناعي. وأشار إلى أنه “علينا أيضًا التفكير في المحادثة حول النماذج التوليدية المتقاطعة مع الملكية الفكرية”.
إن كتابة الروايات ليست هي السبيل الإبداعي الوحيد الذي تستكشفه Google بمساعدة نماذج الذكاء الاصطناعي الخاصة بها. تبحث Google أيضًا في كيفية استخدام الذكاء الاصطناعي لإنشاء مقاطع فيديو وموسيقى.
في مجال إنشاء الفيديو المستند إلى الذكاء الاصطناعي ، كشفت Google عن نموذجين جديدين هما Imagen و Phenaki. بينما يستخدم فيديو Imagen الانتشار لإنشاء صور فردية عالية الجودة ، والتي تدعي Google أنها أكثر ملاءمة لمقاطع الفيديو الأقصر ، تستخدم Phenaki “تقنية التعلم المتسلسل التي تنشئ سلسلة من الرموز المميزة بمرور الوقت” لإنشاء مقاطع فيديو طويلة. قالت Google إن الجمع بين النموذجين سيضمن دقة فائقة على مستوى الإطار والتماسك في الوقت المناسب.
كما كشفت عن مقاطع فيديو تم إنشاؤها بواسطة النموذجين. عند سؤاله عن تحديات استخدام الذكاء الاصطناعي لإنشاء مقطع فيديو ، قال إيك إنه بينما يرون تقدمًا ، فإنها لا تزال مهمة صعبة. تكمن الصعوبة في ضمان الاتساق بين كل إطار. إذا توقعت إطارًا واحدًا من الإطار السابق ، يبدأ النموذج في فقدان التماسك “، أوضح. كان هذا تحديًا أساسيًا في إنشاء الفيديو ، والذي تقول Google إنه لم يتم حله بالكامل بعد.
أخيرًا ، يعد AudioLM إطارًا جديدًا لتوليد كلام وموسيقى واقعية بناءً على عينة صوتية قصيرة فقط. الموسيقى تقتصر على البيانو في الوقت الحالي. تقول Google إن هذا “نموذج صوتي خالص تم تدريبه بدون أي نص أو تمثيل رمزي للموسيقى”.
اكتشاف المزيد من مجلة الإخلاص
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.