في مؤتمر مطوري Google I/O في ماونتن فيو، كاليفورنيا، يوم الثلاثاء، كشفت جوجل عن سلسلة من منتجات الذكاء الاصطناعي التوليدي (AI)، بما في ذلك مساعد Gemini Live، وتحديثات لمنصتي Android وWorkspaces، ومنتج بحث متجدد.
تعد هذه الإعلانات جزءًا من استراتيجية Google الأوسع لاستعادة مكانتها كشركة رائدة في مجال الذكاء الاصطناعي في وادي السيليكون، بعد شراكة Microsoft المفاجئة مع OpenAI في عام 2022.
بالإضافة إلى ذلك، تهدف جوجل إلى التنويع خارج نطاق أعمالها الإعلانية الأساسية من خلال أجهزة جديدة وأدوات تعمل بالذكاء الاصطناعي.
وتأكيدًا على أهمية الذكاء الاصطناعي، أشار ساندر بيتشاي، الرئيس التنفيذي لشركة جوجل، إلى أن مصطلح "الذكاء الاصطناعي" هو عبارة عن مصطلح "ذكاء اصطناعي". تم ذكره 120 مرة خلال الحدث، وفقًا لإحصاء منصة Gemini للذكاء الاصطناعي من Google.
تأتي هذه الموجة من التحديثات في أعقاب إطلاق OpenAI مؤخرًا لأحدث نظام للذكاء الاصطناعي، وهو GPT4o، والذي أظهر إمكانات متقدمة مثل قراءة التعبيرات البشرية عبر كاميرا الهاتف والمشاركة في محادثات بطلاقة، وحتى غزلية.
من الواضح أن Google عازمة على إثبات أن أدوات الذكاء الاصطناعي الخاصة بها تتمتع بنفس القدر من الكفاءة في هذا النوع من الوسائط المتعددة الوسائط. فهم.
في عرض واضح للفكرة التنافسية "أي شيء يمكنك القيام به، يمكنني القيام به بشكل أفضل" من وجهة نظر عقلية، قامت Google بمعاينة أنظمة الذكاء الاصطناعي الخاصة بها التي تعمل على الهاتف بشكل استراتيجي قبل إعلان OpenAI مباشرة.
يمكنك مشاهدة رecaps من مؤتمر Google I/O هنا .
تريد Google أن يكون الذكاء الاصطناعي جزءًا من كل ما تفعله
خلال الكلمة الرئيسية، عرضت Google رؤيتها لدمج الذكاء الاصطناعي في المستخدمين. الحياة اليومية، وتعرض كيف يمكن لمنتجات الذكاء الاصطناعي أن تساعد في مشاركة المعلومات، والتفاعل مع الآخرين، والعثور على الأشياء في جميع أنحاء المنزل، ووضع الجداول الزمنية، والتسوق، واستخدام أجهزة Android.
تهدف Google إلى أن يصبح الذكاء الاصطناعي الخاص بها جزءًا لا يتجزأ من كل ما يفعله المستخدمون.
قدم Pichai العديد من الميزات الجديدة المدعومة بأحدث طراز من الذكاء الاصطناعي، Gemini 1.5 Pro.
تتيح إحدى الميزات البارزة، التي تسمى Ask Photos، للمستخدمين البحث في مكتبة الصور الخاصة بهم للحصول على رؤى محددة، مثل تحديد الوقت الذي تعلمت فيه ابنتهم السباحة أو تذكر رقم لوحة الترخيص الخاصة بهم من الصور المحفوظة.
كما عرض بيتشاي كيف يمكن لبرنامج Gemini 1.5 Pro تلخيص رسائل البريد الإلكتروني الأخيرة من مدرسة الطفل من خلال تحليل المرفقات واستخراج النقاط الرئيسية وعناصر العمل.
تم الكشف عن نسختين من نموذج Gemini 1.5 Pro: Gemini 1.5 Pro Flash، وهو تكرار خفيف الوزن وسريع وفعال من حيث التكلفة مع إمكانيات متعددة الوسائط وطول سياق رمزي يبلغ 1 مليون، ويتميز بـ MMLU بنسبة 78.9% مقارنة بالنموذج الأصلي' ق 81.9%. يتميز نموذج Gemini 1.5 Pro القياسي الآن بطول سياق مضاعف يبلغ 2 مليون رمز.
يتوفر هذا النموذج الجديد عبر قائمة انتظار لمطورين محددين من خلال واجهة برمجة التطبيقات (API).
طوال العرض التقديمي، سلط المسؤولون التنفيذيون في Google الضوء على إمكانات أخرى، مثل قدرة الطراز الأحدث على "قراءة" البيانات. كتاب مدرسي وتحويله إلى محاضرة بتقنية الذكاء الاصطناعي مع معلمين يتمتعون بأصوات طبيعية يمكنهم الإجابة على الأسئلة.
لمحات عامة عن الذكاء الاصطناعي: إحداث ثورة في توليد نتائج البحث
وكان بيتشاي قد أعلن في شهر مايو الماضي عن خطة الشركة الطموحة لإعادة تصور جميع منتجاتها من خلال الذكاء الاصطناعي.
ومع ذلك، وبالنظر إلى المخاطر المرتبطة بتكنولوجيا الذكاء الاصطناعي التوليدية الجديدة، مثل احتمال نشر معلومات كاذبة، كانت جوجل حذرة في البداية بشأن دمجها في محرك البحث الخاص بها، الذي يخدم أكثر من ملياري مستخدم وحقق إيرادات بقيمة 175 مليار دولار في العام الماضي.
وفي المؤتمر، كشف بيتشاي عن كيفية دمج عمل الشركة المخصص في مجال الذكاء الاصطناعي في محرك البحث الخاص بها.
بدءًا من هذا الأسبوع، سيختبر مستخدمو الولايات المتحدة ميزة جديدة، وهي AI Overviews، المعروفة سابقًا باسم تجربة البحث التوليدية (SGE) والتي تم الإعلان عنها في Google I/O 2023.
تعمل هذه الميزة على إنشاء ملخصات معلومات أعلى نتائج البحث التقليدية، وستكون متاحة قريبًا للمستخدمين في جميع أنحاء العالم.
وبحلول نهاية العام، من المتوقع أن يتمكن أكثر من مليار شخص من الوصول إلى هذه التكنولوجيا.
قالت ليز ريد، رئيسة قسم البحث الجديدة في Google:
"ما نراه مع الذكاء الاصطناعي التوليدي هو أن Google يمكنها القيام بالمزيد من البحث نيابةً عنك. قد يستغرق البحث قدرًا كبيرًا من العمل الشاق، لذا يمكنك التركيز على الأجزاء التي تريد القيام بها لإنجاز الأمور، أو على أجزاء الاستكشاف التي تجدها مثيرة."
إذًا كيف تعمل ميزة AI Overviews؟
تدمج تجربة Google الجديدة الذكاء الاصطناعي التوليدي مع نتائج البحث لتقديم ملخصات وإجابات تم إنشاؤها بواسطة الذكاء الاصطناعي بناءً على المعلومات المباشرة.
مدعومًا بنموذج Gemini AI، سيقدم هذا التحسين نظرة عامة على الذكاء الاصطناعي للعديد من الاستعلامات عندما يحدد النظام أن الذكاء الاصطناعي التوليدي قد يكون مفيدًا.
ستظهر هذه الملخصات التي تم إنشاؤها بواسطة الذكاء الاصطناعي أعلى نتائج البحث التقليدية، مما يدفعها إلى أسفل الصفحة.
عادةً ما تعرض ميزة AI Overviews بعض الروابط ذات الصلة لكل استعلام، ولكنها تصبح مرئية بالكامل فقط بعد توسيع الاستجابة.
تقارن Google نظرة عامة على الذكاء الاصطناعي بميزات مثل لوحات المعرفة أو المقتطفات المميزة، ولا يمكن تعطيلها بالكامل.
ومع ذلك، ستقدم Google خدمة "الويب" التصفية في البحث لتجاوز استجابات الذكاء الاصطناعي وإظهار الروابط التقليدية فقط.
أحد المخاوف الرئيسية بشأن البحث المعزز بالذكاء الاصطناعي من Google هو تأثيره على مواقع الويب التي تعتمد بشكل كبير على حركة البحث.
أحد المخاوف الرئيسية هو أن ميزة AI Overviews قد تؤدي إلى تفاقم المخاوف بين ناشري الويب بشأن انخفاض عدد الزيارات من بحث Google، مما يؤدي إلى تفاقم التحديات داخل صناعة متوترة بالفعل بسبب الصراعات مع منصات التكنولوجيا الأخرى.
على جوجل، سيواجه المستخدمون ملخصات أطول حول موضوعات مختلفة، مما قد يقلل من الحاجة لزيارة مواقع الويب الخارجية.
تشير بعض التقديرات إلى أن مواقع الويب قد تفقد ما يصل إلى 25% من حركة المرور الخاصة بها خلال السنوات القليلة المقبلة بسبب هذا التغيير، مما يضاعف الانخفاضات الأخيرة الناجمة عن خوارزميات البحث.
ومع ذلك، تؤكد جوجل أن الروابط المضمنة في AI Overviews تتلقى نقرات أكثر من تلك الموجودة في نتائج البحث التقليدية.
تؤكد الشركة التزامها بتوجيه حركة المرور إلى الناشرين والمبدعين حيث تصل نظرة عامة على الذكاء الاصطناعي إلى المزيد من المستخدمين.
فيآخر بلوق وظيفة كشف ريد أن الروابط الموجودة في AI Overviews تتلقى نقرات أكثر من المستخدمين مقارنةً بوقت تقديمها كنتائج بحث تقليدية.
وأضاف ريد:
"سنواصل التركيز على إرسال زيارات قيمة إلى الناشرين والمبدعين."
بالإضافة إلى ذلك، أعلنت Google عن ميزات جديدة سيتم اختبارها مع المشاركين في الميزات الاختبارية في البحث.
تتضمن هذه الميزات خيارات لتحسين مراجعات الذكاء الاصطناعي من خلال تبسيط اللغة، وتمكين التفكير متعدد الخطوات للاستعلامات المعقدة، وتوفير إمكانات التخطيط، وتنظيم نتائج البحث باستخدام الذكاء الاصطناعي، ودمج الفيديو كجزء من مطالبات البحث.
وتشير جوجل إلى أن هذه التطورات هي مجرد بداية لجهودها لإعادة تصور بحث جوجل، مع المزيد من الابتكارات في الأفق.
مساعد الذكاء الاصطناعي المخصص لك: Gemini Live
يتضمن أحدث ما كشفت عنه Google أيضًا Gemini Live، وهو مساعد الذكاء الاصطناعي الشخصي الذي يستعد لإحداث ثورة في تفاعلات المستخدم.
مدعومًا بنموذج Gemini 1.5 Pro المتقدم من Google، يوفر Gemini Live للمستخدمين القدرة على التفاعل مع روبوت الدردشة من خلال الأوامر الصوتية، مع تقديم الاستجابات بأصوات طبيعية.
ما يميز هذا هو قدرة روبوت الدردشة على التكيف، مما يسمح للمستخدمين بالمقاطعة وطرح أسئلة توضيحية في منتصف المحادثة.
شارك عمار سوبرامانيا، نائب رئيس Google للهندسة لتجارب Gemini، رؤاه حول الإمكانات التحويلية لـ Gemini Live خلال مقابلة مع Yahoo Finance.
كشف سوبرامانيا عن استخدامه الشخصي لبرنامج Gemini Live في جلسات العصف الذهني وتبادل الأفكار، مما يوضح تنوع المساعد في المساعدة في العمليات الإبداعية.
واستكشف المختبرون الأوائل أيضًا إمكانات Gemini Live، واستفادوا منها في مهام مثل الترجمة مع تحقيق نتائج واعدة.
وبالنظر إلى المستقبل، تخطط جوجل لدمج الوصول إلى الكاميرا في Gemini Live، مما يمكّن المساعد من التفاعل مع بيئات وأشياء العالم الحقيقي - وهي ميزة تذكرنا بعروض OpenAI's GPT4o.
روى سوبرامانيا سيناريو حيث كلف المساعد بالحصول على وصفة كعكة الأناناس المقلوبة لمجموعة من 15 شخصًا وإضافة المكونات بسلاسة إلى قائمة التسوق الخاصة به.
قام المساعد بتعديل الوصفة المخصصة لثمانية أفراد بمهارة، وضبط النسب وفقًا لذلك، وقام بتجميع العناصر الضرورية بكفاءة لراحة سوبرامانيا.
بالإضافة إلى ذلك، على واجهة Android، تعمل Google على توسيع نطاق مساعدها ليشمل التطبيقات الشائعة مثل Google messages وGmail، مما يعزز إنتاجية المستخدم من خلال تمكين مهام مثل إدراج الصور التي تم إنشاؤها بواسطة Gemini في الرسائل.
يتميز برنامج Gemini Nano من Google بالقدرة على تحديد المحتالين المحتملين عبر الهاتف أثناء المحادثات.
تعمل هذه الميزة من خلال الكشف عن أنماط محادثة محددة مرتبطة عادةً بالأنشطة الاحتيالية.
ومن اللافت للنظر أن جميع عمليات الكشف عن عمليات الاحتيال تتم محليًا على جهازك، مما يضمن الخصوصية حيث تظل المحادثات محصورة في هاتفك دون تحميلها على الويب.
Google's DeepMind AI Lab's Project Astra
كشفت جوجل لفترة وجيزة عن مشروع أسترا، وهو من إنشاء مختبرها للذكاء الاصطناعي DeepMind، والذي يستعد لإحداث ثورة في الحياة اليومية من خلال تسخير كاميرات الهاتف لتفسير معلومات العالم الحقيقي.
يعد هذا المسعى بتحديد الأشياء وحتى تحديد موقع العناصر في غير مكانها، مما يشير إلى التكامل المستقبلي مع نظارات الواقع المعزز.
ديميس هاسابيس، الرئيس التنفيذي لشركة DeepMindمفصلة في مشاركة بلوق أن إمكانيات Project Astra المحددة ستكون متاحة لمستخدمي Gemini chatbot هذا العام.
يقدم هذا المشروع، المدعوم من Gemini، دعمًا في الوقت الفعلي عبر تنسيقات الصوت والنص والفيديو والصور.
على الرغم من تقديمها كنموذج أولي، تم عرض إمكانات Astra من خلال مقاطع الفيديو المسجلة مسبقًا، حيث تظل غير متاحة لجميع المستخدمين.
لاحظ المختبرون الأوائل زمن وصول أطول وقيودًا ملحوظة في الذكاء العاطفي والنبرة مقارنة بـ GPT4o.
ومع ذلك، تعرض Astra إمكانات قوية لتحويل النص إلى كلام وربما دعمًا فائقًا للتفاعلات المستمرة للفيديو والسياق الطويل.
Veo هو منافس Sora لـ OpenAI
التالي في خط Google هو Veo، وهو أحدث نموذج للذكاء الاصطناعي مصمم لإنتاج مقاطع فيديو عالية الوضوح من مدخلات نصية بسيطة، على غرار نظام Sora الخاص بـ OpenAI.
#جوجل نموذج الذكاء الاصطناعي Veo يمكن للمبدعين استخدامها، كما يقول جيمس مانيكا، نائب الرئيس الأول لشركة Google، حول الإمكانيات المتزايدة لاستخدام الذكاء الاصطناعي العام. كشفت الشركة النقاب عن Veo باعتباره نموذج توليد الفيديو الأكثر تقدمًا في مؤتمر Google I/O 2024.@جوجل@أشميت تيج كومار#GoogleIO#الذكاء الاصطناعي#أرىpic.twitter.com/2WcOS1YDNN
– CNBC-TV18 (@CNBCTV18News)15 مايو 2024
أ
تمثل هذه التقنية تقدمًا كبيرًا في قدرات إنشاء الفيديو، مما يعد المبدعين بالقدرة على معاينة Veo والانضمام إلى قائمة الانتظار للوصول.
يتزايد الترقب حيث تخطط Google لدمج وظائف Veo في YouTube Shorts والأنظمة الأساسية الأخرى في وقت لاحق من هذا العام.
يتمتع Veo، الذي طورته شركة Google DeepMind، بميزات رائعة:
- يقدم مقاطع فيديو بدقة مذهلة تبلغ 1080 بكسل.
- يمكن أن تمتد مقاطع الفيديو لأكثر من دقيقة، مما يوفر مرونة في إنشاء المحتوى.
-تقدم Veo مجموعة متنوعة من الأساليب السينمائية والمرئية لتناسب مختلف التفضيلات.
يمكن لهذا النموذج متعدد الاستخدامات تحريك الصور أو تحرير مقاطع الفيديو بناءً على المطالبات النصية، مع دعم التحرير المقنع، مما يتيح إجراء تعديلات مستهدفة داخل مقاطع الفيديو.
قامت Google بتحسين بيانات تدريب Veo من خلال إثراء التسميات التوضيحية للفيديو بتفاصيل إضافية.
علاوة على ذلك، يستفيد Veo من التمثيلات المضغوطة للفيديو، والمعروفة باسم العناصر الكامنة، لتحسين الأداء وسرعة التوليد والكفاءة.
أعلنت Google عن عدد كبير من ميزات الذكاء الاصطناعي الأخرى
كانت الجلسة التي استمرت ساعتين مليئة بمجموعة كبيرة من تحديثات المنتجات والإعلانات التي تغطي نظام Google البيئي، حيث عرضت التحسينات عبر البحث ومساحة العمل والصور وAndroid وغيرها.
ومن الجدير بالذكر أن Imagen 3، نموذجهم المتطور لتوليد الصور، سيظهر لأول مرة قريبًا في تكرارات متعددة مصممة لمهام متنوعة، بدءًا من الرسم السريع وحتى إنتاج صور عالية الدقة.
كما أن Gemma 2 وPaliGemma، وهما إضافتان جديدتان إلى عائلة Gemma، يمثلان خطوة كبيرة في النماذج مفتوحة المصدر.
أصبح PaliGemma، النموذج الافتتاحي مفتوح المصدر للغة الرؤية من Google، متاحًا الآن، في حين أن Gemma 2، الذي يضم 27 مليار معلمة، يتفوق على سابقه ويتم إطلاقه في يونيو.
علاوة على ذلك، يضيف الكشف عن Lyria، أداة Google لتوليد الموسيقى، بُعدًا آخر لعروضها المبتكرة.
ومع إطلاق أكثر من 15 مشروعًا وإعلانًا عن المنتجات، يؤكد هذا الحدث التزام Google بتطوير التكنولوجيا عبر مختلف المجالات.
طريق Google نحو هيمنة الذكاء الاصطناعي مليء بالعقبات والعقبات منافسيه
في نظر المحلل جاكوب بورن من Emarketer، فإن تسليط الضوء على الذكاء الاصطناعي في مؤتمر مطوري Google لهذا العام لم يكن مفاجئًا.
هو قال:
"من خلال عرض أحدث نماذجها وكيف ستعمل على تشغيل المنتجات الحالية ذات الوصول القوي إلى المستهلكين، توضح Google كيف يمكنها تمييز نفسها بشكل فعال عن المنافسين."
وهو ينظر إلى استقبال هذه الأدوات الجديدة باعتباره اختبارًا حقيقيًا لقدرة Google على تكييف منتج البحث الخاص بها مع المشهد المتطور للذكاء الاصطناعي التوليدي.
أضاف:
"للحفاظ على قدرتها التنافسية وإرضاء المستثمرين، ستحتاج جوجل إلى التركيز على ترجمة ابتكاراتها في مجال الذكاء الاصطناعي إلى منتجات وخدمات مربحة على نطاق واسع."
ومع قيام الشركة بتوسيع مساعيها في مجال الذكاء الاصطناعي، فإنها تتعهد بتنفيذ ضمانات إضافية للتخفيف من سوء الاستخدام المحتمل.
علاوة على ذلك، تؤكد جوجل التزامها بتحسين قدرات نماذجها الجديدة من خلال الشراكات مع الخبراء والمؤسسات.
ومع ذلك، في حين كثفت جوجل تركيزها على الذكاء الاصطناعي خلال العام الماضي، إلا أنها واجهت عقبات ملحوظة على طول الطريق.
حدثت إحدى هذه الانتكاسات في العام الماضي عندما أدى طرح أداة الذكاء الاصطناعي التوليدية الخاصة بها، والتي كانت تسمى في البداية Bard ثم أعيدت تسميتها لاحقًا باسم Gemini، إلى انخفاض سعر سهم الشركة.
جاء هذا الانخفاض بعد عرض فيديو توضيحي يعرض إنتاج الأداة لردود غير دقيقة على الاستفسارات حول تلسكوب جيمس ويب الفضائي.
في الآونة الأخيرة، في فبراير، واجهت جوجل انتقادات على وسائل التواصل الاجتماعي بسبب تصوير جيميني لصور غير دقيقة تاريخيًا، والتي تظهر في الغالب أشخاصًا ملونين بدلاً من أفراد من العرق الأبيض.
وردًا على ذلك، أوقفت الشركة قدرة جيميني على إنتاج صور للأشخاص.
مثل أدوات الذكاء الاصطناعي الأخرى مثل ChatGPT، يستمد Gemini من مجموعات البيانات الشاملة المتاحة عبر الإنترنت.
ومع ذلك، فقد حذر الخبراء باستمرار من القيود والمزالق المحتملة المرتبطة بتقنيات الذكاء الاصطناعي، بما في ذلك عدم الدقة والتحيزات ونشر المعلومات المضللة.
ومع ذكر المنافسة، برز ChatGPT كمنافس هائل في صناعة التكنولوجيا عند إصداره في أواخر عام 2022، مما أثار مناقشات حول تهديده المحتمل لمحرك البحث المهيمن في Google، وهو النظام الأساسي لاستعادة المعلومات عبر الإنترنت.
واستجابة لذلك، شرعت جوجل في رحلة حازمة لاستعادة تفوقها في عالم الذكاء الاصطناعي.
وفي ملاحظة إيجابية، في أوبنهايمر، قال المحلل جيسون هيلفستين في تقرير:
"بالنسبة إلى العرض التوضيحي المحدود لمنتج OpenAI في اليوم السابق، نعتقد أن Google أظهرت موقعها التنافسي القوي، مدفوعًا بميزانية غير محدودة للبحث والتطوير."
وقال مارك ماهاني، محلل Evercore ISI، أيضًا في تقرير:
"من وجهة نظرنا، تمكنت Google من تحقيق أداء جيد في مؤتمر I/O لهذا العام في مواجهة الضجيج والشكوك المتزايدة. ومن خلال مؤتمر I/O هذا، لاحظنا أيضًا تركيزًا أكبر من Google على استخدام الذكاء الاصطناعي العام لربط خدماتها بشكل أكثر إحكامًا في تجربة واحدة شاملة. والتأكيد على أن هذه الابتكارات الجديدة "متوفرة على نظام Android فقط".
ومع ذلك، فإن عمالقة التكنولوجيا الآخرين قريبون جدًا من الركب.
في مؤتمر Build الخاص بها الذي يبدأ في 20 مايو، من المتوقع أن تكشف Microsoft عن تحسينات لبرنامج Copilot المعتمد على الذكاء الاصطناعي لمجموعة إنتاجية Microsoft 365.
وفي الوقت نفسه، تستعد شركة Apple لحدث WWDC الخاص بها في 10 يونيو، حيث تخطط لتقديم نسخة جديدة من مساعدها الصوتي Siri المدعوم بالذكاء الاصطناعي.
مع اشتداد المعركة من أجل تفوق الذكاء الاصطناعي، من سيخرج منتصرا؟
يبدو الأمر كما لو أنه عندما يُصدر أحدهم " رائدة" الابتكار، وآخر سوف يكون على ذيله.
لذا فإن الوقت وحده هو الذي سيحدد، ليس الكثير من الذي سيخرج فائزًا، بل من سيتخلف عن الركب.