مؤتمر Google I/O لعام 2024: تمهيد الطريق لجيل جديد من التكنولوجيا

14 مايو, 2024

سوندار بيتشاي

الرئيس التنفيذي للشركتين Google وAlphabet

ملاحظة المحرّر: في ما يلي النص المعدّل لملاحظات "ساندر بيتشاي" في مؤتمر I/O لعام 2024، وقد تم تكييف النص ليشمل ما أُعلِن عنه على المسرح. يمكن الاطّلاع على كل الإعلانات ضمن مجموعة المقالات عن مؤتمر I/O.

أصبح Gemini الآن مُضمَّنًا في كامل تجربة Google.

قبل أن نتحدّث عن هذا الموضوع، أردت التأمّل في اللحظة التي نعيشها الآن. أمضينا أكثر من عشرة أعوام نستثمر في الذكاء الاصطناعي، ونستحدث الابتكارات في كل طبقة من طبقات الإنتاج، مثل البحث والمنتَج والبنية الأساسية. واليوم، يُسعدنا أن نقدّم لكم ثمرة هذه الجهود الطويلة التي بذلناها.

مع ذلك، ندرك أنّنا لا نزال في الأيام الأولى من التحوّل نحو الذكاء الاصطناعي. ونحن واثقون من الفرص الكبيرة التي تنتظر صناع المحتوى والمطوّرين والشركات الناشئة وجميع المستخدمين، والتي يهدف Gemini إلى تسهيل الاستفادة منها. لندخل الآن في صلب موضوعنا.

عصر Gemini

العام الماضي، شاركنا في مؤتمر I/O خططَنا المرتقبة لنموذج Gemini، وهو نموذج ذو قدرات كبيرة صًمِّم، منذ بدايته، ليعالج الوسائط المتعددة. فيستطيع Gemini تحليل النصوص والصور والفيديوهات والرموز وغير ذلك، ما يشكّل خطوة كبيرة في توليد النتائج والأجوبة لمختلف أنواع المدخلات، ويمهّد الطريق لجيلاً جديدًا من أدوات معالجة المدخلات والمخرجات.

بعد أن أعلنّا عن خططنا، طرحنا نماذج Gemini الأولى من Google، وهي الأكثر تطورًا حتى الآن. وقد أثبتت نماذج Gemini أدائها الحديث والمتطوّر في كل من معايير القياس عبر الوسائط المتعددة. وبعد شهرين، طرحنا أيضًا Gemini 1.5 Pro، الذي حقّق نتائج غير مسبوقة في القدرة الاستيعابية والسياق الموسَّع. يمكن لهذا النموذج معالجة مليون رمز مميّز بشكل متّسق، وهي قدرة تفوق قدرات كل النماذج الأساسية الكبيرة الأخرى.

بما أنّنا نسعى إلى تعزيز استفادة الجميع من إمكانات Gemini، عملنا على إتاحة الميزات الجديدة والتحسينات بسرعة لكل المستخدمين. وحاليًا، يستخدم أكثر من 1.5 مليون من المطورين نماذج Gemini في مختلف أدواتنا. ويمكن استخدامها للحصول على رموز تصحيح الأخطاء أو الإحصاءات والمعلومات الجديدة أو حتى إنشاء الجيل التالي من التطبيقات المستنِدة إلى الذكاء الاصطناعي.

عملنا أيضًا على تضمين قدرات Gemini الرائدة بطرق فعالة في مختلف منتجاتنا. وسنشير اليوم إلى بعض الأمثلة من "بحث Google" و"صور Google" وWorkspace وAndroid وغيرها.

التقدّم المُحرَز

يستفيد حاليًا من Gemini كل مستخدمينا، البالغ عددهم مليارَين.

لقد قدّمنا أيضًا تجارب جديدة، بما في ذلك على الأجهزة الجوالة، تتيح للمستخدمين التفاعل مباشرةً مع Gemini من خلال التطبيق، الذي أصبح متاحًا على كل من أجهزة Android وiOS، ومن خلال Gemini Advanced، الذي يوفر للمستخدمين إمكانية الوصول إلى نماذجنا الأكثر تطورًا. وخلال مدة ثلاث أشهر فقط، تسجّل أكثر من مليون شخص لتجربة Gemini Advanced، ولا يزال حتى الآن يجذب اهتمام المزيد من المستخدمين.

توسيع نطاق "الملخصات المستنِدة إلى الذكاء الاصطناعي" في "بحث Google"

شهد محرّك بحث Google أحد التحوّلات الأهم والأكثر تشويقًا بفضل Gemini.

خلال العام الماضي، أجبنا عن مليارات الطلبات في إطار "تجربة البحث التوليدي" التي وفّرت للمستخدمين أساليب جديدة بالكامل وأتاحت لهم طرح أنواع أخرى من الأسئلة والطلبات الأطول والأكثر تعقيدًا، وحتى البحث من خلال الصور واستكشاف أفضل النتائج على الويب.

فيديو يمثل كيفية البحث على جوجل بطريقة متطورة الآن

اختبرنا هذه التجربة خارج Search Labs أيضًا، ونتوقّع أن تؤدّي ليس فقط إلى زيادة في استخدام "بحث Google" بل إلى زيادة في رضى المستخدمين أيضًا. يسرّني أن أعلن أنّنا سنبدأ بطرح تجربة "الملخصات المستندة إلى الذكاء الاصطناعي" المُجدّدة لجميع المستخدمين في الولايات المتحدة هذا الأسبوع، وسنتيحها في المزيد من البلدان قريبًا. أصبح محرّك بحث Google يتضمّن الكثير من الميزات المبتكرة، وبفضل Gemini، يمكننا توفير تجارب بحث أكثر فعالية، حتى ضمن منتجات Google الأخرى.

التعرّف على Ask Photos

نذكر، على سبيل المثال، تطبيق "صور Google" الذي أطلقناه قبل تسع أعوام. منذ ذلك الحين، يتم استخدامه لتنظيم أهم الذكريات، كما يُحمّل إليه أكثر من ستة مليارات الصور الفيديوهات كل يوم. يحب المستخدمون تصفّح "صور Google" لاستعادة الذكريات من مختلف مراحل حياتهم، وقد ساهم Gemini في تسهيل وتبسيط هذه العملية بشكل ملحوظ. لنعتبر أنّكم أردتم الدفع في موقف للسيارات، ولكنكم نسيتم رقم تسجيل السيارة. كان بإمكانكم في السابق البحث في تطبيق "صور Google" عن الكلمات الرئيسية ثم تصفح صور متراكمة عبر الأعوام للعثور على صورة رقم التسجيل. أما الآن، يمكنكم بسهولة الطلب من "صور Google" البحث عما تريدون، فيستنتج التطبيق السيارات الأكثر ظهورًا في الصور ويحلّل لمعرفة السيارة التي تملكونها ويعطيكم رقم التسجيل.

من خلال Ask Photos، يمكنكم التعمّق في البحث عن ذكرياتكم. لنفترض أنّكم شعرتم بحنين لعندما كان أولادكم صغار السن. يمكنكم بسهولة طرح السؤال التالي على "صور Google": "متى تعلّمت ابنتي السباحة؟" ثم يمكنكم المتابعة بطلب أكثر تعقيدًا، مثلاً: "أريد الاطلاع على التقدّم الذي أحرزته ابنتي في تعلّم السباحة". في هذه الحالة، يجري Gemini أكثر من مجرّد عملية بحث بسيطة، فيستنتج السياقات المختلفة، منذ أيام التدريب في المسبح إلى الغطس في البحر، ويحدّد أيضًا النص والتواريخ على شهادات السباحة. بعدها، ينظّم "صور Google" هذه النتائج في ملخص يتيح لكم إعادة إحياء هذه الذكريات الجميلة. سنطرح ميزة Ask Photos هذا الصيف، وسنعمل على زيادة إمكاناتها أكثر فأكثر.

الشرح: بفضل Ask Photos، يمكن إجراء بحث معمّق عن الصور والفيديوهات.

استكشاف المزيد من خلال تعدّدية الوسائط والسياق الموسَّع

صمّمنا Gemini ليتكيّف بشكل شامل مع الوسائط المتعدّدة، ما يتيح له معالجة المعلومات عبر مختلف التنسيقات. ومع أنّه نموذج واحد، إلا أنه يعالج الوسائط المختلفة. فهو لا يسعى فقط إلى فهم نوع المعلومات المُدخلة، بل إلى البحث أيضًا عن أوجه الترابط بينها. توسّع تعدّدية الوسائط نطاق الأسئلة التي يمكن طرحها والأجوبة التي يمكن الحصول عليها. ويرتقي السياق الموسَّع بهذه الإمكانات إلى مستوى جديد، فيتيح الوصول إلى معلومات إضافية: مئات الصفحات من النصوص، أو ساعات من الصوت، أو ساعة من الفيديوهات، أو مستودع رموز، أو ما يقارب 96 قائمة طعام من مطعم "ذي تشيزكيك فاكتوري". للحصول على هذا العدد من قوائم الطعام، يجب تحليل مليون رمز مميّز يستند إلى السياق، وهذا ممكن الآن مع Gemini 1.5 Pro. وقد بدأ المطوّرون بالاستفادة من هذه القدرات بطُرق مثيرة للاهتمام.

خلال الأشهر القليلة الماضية، بدأنا بطرح Gemini 1.5 Pro مع إمكانية معاينة السياق الموسَّع. وأجرينا سلسلة من تحسينات الجودة المتعلقة بالترجمة والترميز والتحليل، وستنعكس هذه التعديلات في النموذج اعتبارًا من اليوم. يسعدني الآن أن أعلن أنّ الإصدار المحسَّن من Gemini 1.5 Pro سيصبح متوفرًا لكل المطوّرين من حول العالم، وقد أصبح أيضًا متاحًا مباشرةً للمستهلكين في Gemini Advanced مع قدرة استيعاب تصل إلى مليون رمز مميّز، وفي 35 لغة.

التوسّع إلى مليونَي رمز مميّز في المعاينة الخاصة

نعلم أنّنا وصلنا إلى إمكانات غير مسبوقة مع مليون رمز مميّز، لكنّني أعتقد أنّه يمكننا الوصول إلى ما هو أبعد من ذلك. سنزيد قدرة الاستيعاب إلى مليونَي رمز مميّز اليوم، وسنتيح هذا التحديث للمطوّرين في وضع المعاينة الخاصة. أشعر بالفخر عندما أستعيد الماضي وألاحظ التقدّم الذي أحرزناه خلال أشهر قليلة فقط. وأعلم أنّ هذه الجهود تشكّل الخطوة التالية في مسيرتنا نحو هدفنا الأسمى، وهو توفير قدرة استيعاب غير محدودة مستنِدة إلى السياق.

توفر Gemini 1.5 Pro في Google Workspace

لقد ناقشنا حتى الآن عمليتَي تطوير تقني، وهما تعدّدية الوسائط والسياق الموسَّع. لكل منهما قدرات كبيرة، ولكن عند التفاعل معًا، يفتحان المجال لإمكانات أعمق وتجارب أكثر ذكاءً. نعلم أنّ المستخدمين يلجأون دائمًا إلى البحث في Gmail عن رسائل إلكترونية. ونعمل على زيادة فعالية هذه العملية من خلال Gemini. على سبيل المثال، إذا أراد الأهل البقاء على اطّلاع على كل ما يجري في مدرسة أطفالهم، يمكن لنموذج Gemini مساعدتهم.

يمكن الآن الطلب من Gemini تلخيص كل رسائل البريد الإلكترونية الواردة من المدرسة، فيبدأ، في الخلفية، بتحديد الرسائل ذات الصلة ويحلّل المرفقات، مثل ملفات PDF. ثم يقدّم ملخّصًا عن النقاط الرئيسية والإجراءات الواجب اتخاذها. فلنفترض أنّكم سافرتم وفاتكم الاجتماع الذي انعقد مع الأهل، ولكن، تم تحميل التسجيل من Google Meet والذي تبلغ مدّته ساعة. يمكنكم الطلب من Gemini تزويدكم بملخص عن أهم النقاط. ولنفترض أيضًا أنّ مجموعة من الأهل أرسلوا رسالة أنّهم يبحثون عن متطوّعين، ووجدتم أنّه لديكم وقت فراغ. يمكن لنموذج Gemini طبعًا صياغة الردّ المناسب للتطوّع. تتوفّر عدّة أمثلة أخرى عن الدور الذي يؤدّيه Gemini في تسهيل مهامكم. وأصبح Gemini 1.5 Pro متاحًا اليوم في Workspace Labs.

توسيع الآفاق مع وكلاء الذكاء الاصطناعي

نرى في وكلاء الذكاء الاصطناعي فرصةً لتحقيق المزيد، باعتبار الوكلاء أنظمة ذكية قادرة على التحليل والاستنتاج والتخطيط والتذكّر و"التفكير" مسبقًا في خطوات متعددة والعمل عبر مختلف البرامج والأنظمة، وذلك كله لمساعدتكم في إنجاز مهامكم وفقًا لتوجيهاتكم وتحت إشرافكم. لا نزال في المراحل الأولى من التطوّر، ولكن يمكنني أن أشرح لكم الحالات التي نعمل جاهدًا لحلّها. لنبدأ بسياق التسوّق. من الممتع شراء الأحذية الجديدة، إلّا أنّه من المملّ إعادتها إذا لم يكن مقاسها مناسبًا.

لنتصوّر أنّه بإمكان Gemini تنفيذ كل الخطوات بالنيابة عنكم:

البحث في البريد الوارد عن الإيصال

تحديد رقم الطلبية من البريد الإلكتروني

تعبئة نموذج الإعادة
تحديد موعد لاستلام الطلبية من خلال UPS

فتصبح العملية أسهل بكثير، أليس كذلك؟

لننظر الآن في مثال أكثر تعقيدًا.

لنفترض أنّكم انتقلتم حديثًا إلى شيكاغو. يمكن الاستفادة من التفاعل بين Gemini وChrome لتنفيذ عدد من الإجراءات التي تساعدكم على الاستقرار. من خلال قدرات التنظيم والتحليل والاستنتاج يمكن استكشاف المدينة والعثور على خدمات قريبة، مثل خدمات غسيل الملابس ورعاية الكلاب. وسيكون عليكم أيضًا تغيير عنوانكم في مختلف المواقع الإلكتروني والحسابات. يستطيع Gemini تنفيذ هذه المهام نيابةً عنكم وطلب المزيد من المعلومات عند الحاجة، ما يمنحكم كامل السلطة للتحكم في الإجراءات. نود أن تعلموا أنّنا نعطي أهمية كبيرة لدوركم. فعندما نصمّم نماذج أولية لهذه التجارب، نفكّر مليًا بطرق لتبقى العملية سرية وآمنة ومناسبة للجميع. قد تكون هذه الأمثلة بسيطة، لكنّها توضّح جيدًا أنواع الحالات التي نسعى إلى حلّها من خلال أنظمة ذكية قادرة على التفكير المسبق والتحليل والاستنتاج والتخطيط بالنيابة عنكم.

دور Gemini في تحقيق مهمتنا

يساهم Gemini، مع تعدّدية الوسائط فيه والسياق الموسَّع والوكلاء، في تحقيق هدفنا الأسمى، وهو أن نجعل الذكاء الاصطناعي مفيدًا للجميع. ويساعدنا هذا الهدف بدوره في إحراز التقدّم نحو مهمتنا المتمثلة في: تنظيم المعلومات من حول العالم عبر كل أنواع المدخلات، وتسهيل الوصول إليها من خلال كل أنواع المخرجات، وبناء الروابط بينها وبين السياق الخاص بكل مستخدم بطريقة تقدّم قيمة مفيدة له.

شق طرق جديدة

للوصول إلى كامل إمكانات الذكاء الاصطناعي، نعلم أنّه يجب شقّ طرق جديدة. وقد بدأ فريق Google DeepMind يالعمل في هذا الاتجاه. لاقى نموذج Pro 1.5 رواجًا كبيرًا، لا سيما بفضل قدراته الاستيعابية الكبيرة المستندة إلى السياق. غير أنّنا عرفنا من المطورين أنّهم يريدون نموذجًا أسرع وأكثر فعالية من حيث التكلفة. استجابةً لملاحظاتهم، سنقدّم غدًا Gemini 1.5 Flash، وهو نموذج أقل تعقيدًا مخصّص للحالات التي تكون فيها الأولوية لسرعة الاستجابة والتكلفة. سيصبح Flash 1.5 متاحًا في AI Studio وVertex AI يوم الثلاثاء. بالنظر إلى المستقبل، لطالما أردنا تصميم وكيل عالمي شامل مفيد في الحياة اليومية. فصمّمنا Project Astra وطوّرنا قدرته على الفهم عبر الوسائط المتعدّدة وإجراء المحادثات في الوقت الفعلي.

تحسينات غير مسبوقة في "بحث Google"

نصبّ جزءًا كبيرًا من استثماراتنا وابتكاراتنا في أحد أقدم منتجاتنا، وهو محرّك بحث Google. صمّمنا "بحث Google" قبل 25 عامًا لمساعدة المستخدمين على فهم وتحليل الكميات الضخمة من المعلومات المتداوَلة على الإنترنت. مع كل تغيير وتحديث أجريناه في النظام الأساسي، حقّقنا إنجازات تساعد في تقديم إجابات أفضل للأسئلة. فعلى الأجهزة الجوالة، فتحنا المجال لأنواع جديدة من الأسئلة والأجوبة المستنِدة إلى السياقات الدقيقة والموقع الجغرافي والمعلومات في الوقت الفعلي. ومع التقدّم المحرز في فهم اللغة الطبيعية والرؤية الحاسوبية، قدّمنا طرقًا جديدة للبحث، مثلًا من خلال إجراء طلب صوتي، أو دندنة اللحن للبحث عن أغنية، أو استخدام صورة للبحث عن شيء في محيطك. ومؤخرًا، أصبح من الممكن أيضًا استخدام ميزة "دائرة البحث" للإشارة إلى الشيء المطلوب البحث عنه. لا شك في أنّ Gemini سيواصل الارتقاء بمستوى "بحث Google"، ليجمع بين قوة بنيتنا الأساسية، وآخر تطورات الذكاء الاصطناعي، والمعايير العالية التي نعتمدها لضمان جودة المعلومات، وخبرتنا الطويلة جدًا في التقريب بين المحتوى الغني على الويب والمستخدمين. وستتوّج هذه الجهود والتطوّرات في منتج متكامل ينفّذ المهام بالنيابة عن المستخدمين. يستخدم محرك بحث Google الذكاء الاصطناعي التوليدي بما يتناسب مع فضول الإنسان. ولقد بلغنا التطوّرات الأكثر تشويقًا في "بحث Google" حتى الآن. تقدّم "ليز ريد" مزيد من المعلومات عن محرك بحث Google في عصر Gemini.

توفر Gemini في أجهزة Android

نظرًا إلى مليارات مستخدمي Android حول العالم، يسرّنا أن نقدّم تجربة أكثر تكامل مع Gemini على مستوى هذا النظام التشغيلي. باعتبار Gemini المساعد الجديد المستند إلى الذكاء الاصطناعي، يمكنه مساعدتكم في أي وقت ومكان. وقد دمجنا نماذج Gemini في أجهزة Android، بما في ذلك أحدث نموذج على الجهاز، وهو Gemini Nano المزوِّد بتعددية الوسائط والقادر على معالجة النصوص والصوت والكلام ليقدّم تجارب جديدة ويحافظ، في الوقت نفسه، على خصوصية معلوماتكم. يمكن الاطّلاع على كل أخبار Android في هذا الرابط.

النهج المسؤول تجاه الذكاء الاصطناعي

نواصل انتهاز فرص الذكاء الاصطناعي بجرأة وحسّ الإثارة، ولكنّنا نحرص دائمًا على أن يكون عملنا مسؤولاً. فنعمل على تطوير تقنية حديثة لإجراء اختبارات من منظور الخصم (الفريق الأحمر) مستندة إلى الذكاء الاصطناعي. وتبني هذه التقنية على أفضل إنجازات Google DeepMind المتعلقة بالألعاب، مثلاً، AlphaGp. ووسّعنا أيضًا نطاق ابتكاراتنا المتعلقة بإضافة العلامات المائية، مثل SynthID، لتشمل النص والفيديو، ما يسهّل العثور على المحتوى من إنشاء الذكاء الاصطناعي. يشارك "جيمس مانييكا" المزيد من المعلومات في هذا الشأن.

العمل التعاوني لبناء المستقبل

يبيّن كلّ ما ذكرناه التقدّم المهمّ الذي نحرزه من خلال اعتماد نهج جريء ومسؤول يهدف إلى جعل الذكاء الاصطناعي مفيدًا للجميع.

قبل الاختتام، لنحاول احتساب عدد المرات التي ذكرنا فيها مصطلح "الذكاء الاصطناعي" اليوم. ومن المؤكّد أنّ هذا العدد سيزداد أكثر قبل أن أنهي كلمتي.

أذكر ذلك ليس فقط لنضحك قليلاً، بل لأنّه يعكس مفهومًا أعمق. أعطينا الذكاء الاصطناعي الأولوية في نهجنا على مرّ سنوات طويلة. وبفضل العقود التي أمضيناها في إجراء الأبحاث الريادية، حقّقنا أحدث الإنجازات التي تعزز تقدّم الذكاء الاصطناعي لصالحنا وصالح مجال عملنا. بالإضافة إلى ذلك، نتمتّع بما يلي:

بنية أساسية رائدة عالميًا مصمَّمة لتواكب عصر الذكاء الاصطناعي
ابتكارات حديثة في "بحث Google" الذي أصبح يستند الآن إلى Gemini
منتجات مفيدة على نطاق واسع جدًا، بما في ذلك 15 منتجًا يبلغ إجمالي مستخدميها نصف مليار شخص
منصات تتيح للجميع - الشركاء والعملاء وصناع المحتوى وكل المستخدمين - المساهمة في بناء المستقبل

لم يكن هذا التقدّم ممكنًا إلا بفضل منتدى المطوّرين الرائعين في Google. أنتم تترجمون الأفكار إلى حقيقة من خلال التجارب والتطبيقات التي تصمّمونها يوميًا. لذلك، أودّ أن أقول لكل الحاضرين هنا ولكل المشاهدين من أنحاء العالم، نخب الإمكانات المتاحة أمامنا، ونخب عملنا المشترك في بناء مستقبل أفضل.

نشرت على:

مؤتمر Google I/O لعام 2024: تمهيد الطريق لجيل جديد من التكنولوجيا

مواضيع ذات صلة