ميتا تكشف عن أداة تنتج مقاطع فيديو بالذكاء الاصطناعي : Meta Connect 2024
صعد مارك زوكربيرج إلى المنصة في Meta Connect 2024 وظهر بقوة في فئات الواقع الافتراضي والواقع المعزز والذكاء الاصطناعي. هناك الكثير من المزج بين هذه التقنيات، وخاصة في نظارات Meta الذي تمت مناقشته
في هذه المقالة، سنبحث في العديد من الإعلانات القوية والمثيرة للإعجاب المتعلقة بجهود الذكاء الاصطناعي للشركة.
نموذج اللغة الكبيرة متعدد الوسائط
أعلن زوكربيرج عن توفر Llama 3.2، الذي يضيف قدرات متعددة الوسائط. على وجه الخصوص، يمكن للنموذج فهم الصور.
لقد قارن نماذج اللغة الكبيرة Llama 3.2 من Meta مع نماذج اللغة الكبيرة الأخرى، قائلاً إن Meta "تميز نفسها في هذه الفئة من خلال تقديم ليس فقط نماذج حديثة، ولكن أيضًا وصول غير محدود إلى هذه النماذج مجانًا، ودمجها بسهولة في منتجاتنا وتطبيقاتنا المختلفة".
Meta AI هو مساعد الذكاء الاصطناعي الخاص بـ Meta، والذي يعتمد الآن على Llama 3.2. صرح زوكربيرج أن Meta في طريقه ليصبح مساعد الذكاء الاصطناعي الأكثر استخدامًا على مستوى العالم، حيث يبلغ عدد مستخدميه النشطين شهريًا ما يقرب من 500 مليون.
ولإثبات فهم النموذج للصور، فتح زوكربيرج صورة على جهاز محمول باستخدام إمكانية تحرير الصور الخاصة بالشركة. وتمكنت Meta AI من تغيير الصورة، وتعديل قميص لصبغه أو إضافة خوذة، كل ذلك استجابة لمطالبات نصية بسيطة.
Meta AI مع الصوت
أصبح مساعد الذكاء الاصطناعي في Meta قادرًا الآن على إجراء محادثات صوتية معك من داخل تطبيقات Meta. لقد كنت أستخدم ميزة مماثلة في ChatGPT ووجدتها مفيدة عندما يحتاج شخصان أو أكثر إلى سماع إجابة لسؤال.
يزعم زوكربيرج أن التفاعل الصوتي بالذكاء الاصطناعي سيكون أكبر من روبوتات الدردشة النصية، وأنا أتفق معه - مع تحذير واحد. يجب أن يكون الوصول إلى التفاعل الصوتي سهلاً. على سبيل المثال، لطرح سؤال على أليكسا، ما عليك سوى التحدث في الغرفة. ولكن لطرح سؤال على ChatGPT على iPhone، عليك إلغاء قفل الهاتف، والانتقال إلى تطبيق ChatGPT، ثم تمكين الميزة.
حتى تمتلك Meta أجهزة تستمع بشكل طبيعي للكلام، أخشى أن يكون حتى المساعدين الصوتيين الأكثر كفاءة مقيدين بالإزعاج.
يمكنك أيضًا منح مساعد الذكاء الاصطناعي الخاص بك صوتًا مشهورًا. اختر من بين جون سينا وجودي دينش وكريستين بيل وكيجان مايكل كي وأوكوافينا. ستتوفر المحادثة الصوتية الطبيعية في Instagram وWhatsApp وMessenger Facebook ويتم طرحها اليوم.
Meta AI Studio
التالي بعض الميزات التي أضافتها Meta إلى أداة إنشاء روبوت الدردشة AI Studio. يتيح لك تطبيق AI Studio إنشاء شخصية (إما ذكاء اصطناعي يعتمد على اهتماماتك أو ذكاء اصطناعي "يمثل امتدادًا لك"). في الأساس، يمكنك إنشاء روبوت محادثة يعكس أسلوبك في المحادثة.
حتى هذا الإعلان، كان برنامج AI Studio يحتوي على واجهة نصية. لكن Meta يصدر نسخة "أكثر طبيعية وتجسيدًا وتفاعلية". وعندما يتعلق الأمر بـ "التجسيد"، فهم لا يمزحون.
في العرض التوضيحي، تفاعل زوكربيرج مع روبوت محادثة مصمم على غرار المبدع دون ألين ستيفنسون الثالث. بدا هذا التفاعل وكأنه مقطع فيديو "مباشر" لستيفنسون، يتتبع حركة الرأس وحركة الشفاه بالكامل. في الأساس، كان بإمكانه أن يسأل الروبوت دون سؤالاً ويبدو أن الرجل الحقيقي يجيب.
يبدو أن Meta لديها مزامنة شفاه وحركات وجه اصطناعية. لقد وصلوا إلى نقطة حيث يمكنهم تحريك وجه شخص حقيقي والتحدث بكلمات تم إنشاؤها.
وسعت Meta هذه القدرة إلى الترجمة. تقدم الآن خدمة دبلجة الفيديو تلقائيًا على Reels، باللغتين الإنجليزية والإسبانية. تعني هذه الميزة أنه يمكنك تسجيل مقطع فيديو باللغة الإسبانية، وسيقوم موقع التواصل الاجتماعي بتشغيله باللغة الإنجليزية -- وسيبدو الأمر وكأنك تتحدث الإنجليزية. أو يمكنك التسجيل باللغة الإنجليزية وسيتم تشغيله باللغة الإسبانية، كما لو كنت تتحدث الإسبانية.
في المثال أعلاه، تحدث المبدع إيفان أكونيا باللغة الإسبانية، لكن الدبلجة عادت باللغة الإنجليزية. وكما هو الحال مع المثال السابق، كان الفيديو مثاليًا تقريبًا وبدا الأمر كما لو كان أكونيا قد سُجِّل وهو يتحدث الإنجليزية في الأصل.
Llama 3.2
عاد زوكربيرج مرة أخرى لتجربة نموذج Llama 3.2. وقال إن الطبيعة المتعددة الوسائط للنموذج زادت من عدد المعلمات بشكل كبير..
كان الجزء الآخر المثير للاهتمام من الإعلان هو النماذج الأصغر حجمًا 1B و3B المحسّنة للعمل على الجهاز. سيسمح هذا الجهد للمطورين بإنشاء نماذج أكثر أمانًا وتخصصًا للتطبيقات المخصصة، والتي تعمل مباشرة في التطبيق.