جوجل تُعلن للتو حرباً شاملة على OpenAI باستخدام “الحوسبة الكمومية” في Gemini 2.5.

يشهد مشهد الذكاء الاصطناعي (AI) تصعيدًا غير مسبوق، حيث تخوض شركات التكنولوجيا العملاقة “حربًا” حقيقية من أجل التفوق في مجال الأتمتة. ومؤخراً، أحدثت جوجل ضجة في السوق بإطلاقها نموذج Gemini 2.5 Computer Use، وهو نموذج ذكاء اصطناعي مصمم للتفاعل مع متصفحات الإنترنت بطريقة شبيهة بالإنسان. تأتي هذه الخطوة الاستراتيجية بعد يوم واحد فقط من إعلانات Dev Day الخاصة بـ OpenAI، مما يعزز التنافس ووتيرة الابتكار المتسارعة.

×

微信分享

打开微信,扫描下方二维码。

QR Code

استراتيجية جوجل: الأتمتة التي تركز على المتصفح

يمثل Gemini 2.5 Computer Use من جوجل مقاربة تكتيكية متميزة في سباق أتمتة الذكاء الاصطناعي. بدلاً من السعي للسيطرة الكاملة على بيئات سطح المكتب، كما يفعل بعض منافسيها، اختارت جوجل تخصص نموذجها الجديد في التفاعلات المعتمدة حصرياً على المتصفح. تخيل ذكاء اصطناعياً قادراً على ملء النماذج المعقدة، والنقر على الأزرار، والتنقل عبر تطبيقات الويب دون واجهات برمجية تطبيقية (APIs) محددة، وأداء المهام الرقمية التي تتطلب فهماً بصرياً ومنطقاً بشرياً. هذا هو بالضبط ما يعد به Gemini 2.5 Computer Use.

هذه التكنولوجيا، التي كانت قيد الاختبار سراً من خلال Project Mariner (وهو نموذج أولي قادر على إضافة عناصر إلى عربات التسوق عبر الإنترنت بناءً على الوصفات)، أصبحت الآن أداة متاحة تجارياً للمطورين. الهدف واضح: سد الفجوة حيث تفشل الأتمتة التقليدية، من خلال تقديم حل قوي للسيناريوهات التي تتطلب التفاعل مع واجهات مصممة لعيون وأصابع البشر، وليس للتعليمات البرمجية الصرفة.

بالنسبة لأولئك الذين يسعون للتعمق في عالم Gemini، من الضروري فهم الفروق الدقيقة للتفاعل. إتقان هندسة المطالبات لنموذج Gemini AI من جوجل قد يكون المفتاح لإطلاق العنان لإمكاناته الكاملة في التركيب البصري المتقدم والتطبيقات الأخرى.

معركة العمالقة: جوجل ضد OpenAI ضد أنثروبيك

أصبحت المنافسة في مجال وكلاء الذكاء الاصطناعي أكثر احتداماً من أي وقت مضى. كانت أنثروبيك (Anthropic) من أوائل من تحركوا، حيث أطلقت قدرات استخدام الكمبيوتر بنموذجها كلود (Claude) قبل أشهر. وقد عززت OpenAI، من خلال وكيل ChatGPT Agent وإعلاناتها الأخيرة عن تطبيقات جديدة للمطورين، مكانتها كلاعب مهيمن. الآن، تدخل جوجل المنافسة باقتراح قد يكون، على الرغم من كونه أكثر تقييداً، ميزتها الكبرى.

بينما يهدف وكيل ChatGPT Agent وأدوات أنثروبيك إلى التحكم في أنظمة التشغيل الكاملة، يقتصر Gemini 2.5 Computer Use على 13 إجراءً محدداً في المتصفح، مثل فتح علامات التبويب، وكتابة النص، وسحب العناصر. هذا القيد الظاهري هو، في الواقع، قوة استراتيجية. من خلال التركيز حصرياً على تفاعلات الويب، يمكن لجوجل تحسين الأداء لحالات استخدام الأتمتة الأكثر شيوعاً، وتجنب تحديات الأمان والموثوقية المرتبطة بالوصول الكامل إلى النظام. وتؤكد جوجل أن نموذجها “يتفوق على البدائل الرائدة في العديد من معايير الويب والهواتف المحمولة”، وهي رسالة واضحة لمنافسيها.

تعكس هذه الجبهة الجديدة في المنافسة في مجال الذكاء الاصطناعي مشهداً تكنولوجياً دائم التطور. ولفهم أفضل لكيفية تشكيل هؤلاء العمالقة للمستقبل، من المثير للاهتمام إعادة النظر في كيف حددت حرب نتسكيب ضد مايكروسوفت مستقبل Open AI، مما يقدم موازاة تاريخية حول المنافسات التي تحول الصناعات.

أصبح الوصول إلى Gemini 2.5 Computer Use متاحاً بالفعل للمطورين عبر Google AI Studio وVertex AI. بالإضافة إلى ذلك، أتاحت جوجل عرضاً توضيحياً عاماً في Browserbase، حيث يمكن لأي شخص رؤية الذكاء الاصطناعي وهو ينفذ مهام مثل لعب 2048 أو تصفح Hacker News.

التداعيات ومستقبل الأتمتة بالذكاء الاصطناعي

تتجاوز تداعيات إطلاق Gemini 2.5 Computer Use مجرد أتمتة المتصفح. تمثل هذه الخطوة محاولة جوجل لجذب اهتمام المطورين الذين يتجهون بشكل متزايد نحو وكلاء الذكاء الاصطناعي. فبينما تسارع الشركات لأتمتة المهام الرقمية الروتينية، فمن المرجح أن تهيمن المنصة التي تسهل ذلك على المطورين على الموجة التالية من تطبيقات الذكاء الاصطناعي.

إن توسع الذكاء الاصطناعي في مجالات مختلفة أمر لا يمكن إنكاره. يعمل نموذج Google Gemini نفسه بالفعل على إحداث ثورة في المنزل بوظائف جديدة، حيث يحول أجهزة التلفزيون إلى مراكز قيادة ويعد بدمج أعمق في حياتنا اليومية.

يشير توقيت جوجل إلى ضرورة استراتيجية. فبدلاً من انتظار حدث إطلاق كبير، سارعت الشركة إلى هذا الإصدار فور إعلانات OpenAI، مما يشير إلى الجدية التي تتعامل بها مع التهديد التنافسي في أتمتة الذكاء الاصطناعي. بالنسبة للمطورين، يعني هذا المزيد من الخيارات، ولكنه يعني أيضاً خيارات أكثر صعوبة بشأن منصة وكيل الذكاء الاصطناعي التي سيستخدمونها. وسيحدد المستقبل القريب ما إذا كان بإمكان نهج جوجل المركز أن ينافس بفعالية الرؤية الأكثر شمولية لـ OpenAI، ولكن هناك شيء واحد مؤكد: لقد أصبح السباق لأتمتة العمل الرقمي الآن أكثر تنافسية بكثير.

×

微信分享

打开微信,扫描下方二维码。

QR Code