تقنية

كيف يمكن لـ “وكلاء الذكاء الاصطناعي” الذين يتجولون عبر الإنترنت أن يحلوا محل العمال في يوم من الأيام


تم تصميم برنامج chatbot ChatGPT المستخدم على نطاق واسع لإنشاء نص رقمي، كل شيء بدءًا من الشعر وحتى الأوراق البحثية وحتى برامج الكمبيوتر. ولكن عندما وضع فريق من الباحثين في مجال الذكاء الاصطناعي في شركة رقائق الكمبيوتر Nvidia أيديهم على التكنولوجيا الأساسية لروبوت الدردشة، أدركوا أنه يمكن أن يفعل الكثير.

وفي غضون أسابيع، علموه كيفية لعب لعبة Minecraft، وهي إحدى ألعاب الفيديو الأكثر شعبية في العالم. داخل عالم Minecraft الرقمي، تعلمت السباحة وجمع النباتات وصيد الخنازير واستخراج الذهب وبناء المنازل.

قال Linxi Fan، أحد كبار الباحثين في Nvidia، والمعروف باسم Jim: “يمكنه الدخول إلى عالم Minecraft والاستكشاف بنفسه وجمع المواد بنفسه والتحسن في جميع أنواع المهارات”.

كان المشروع علامة مبكرة على أن كبار الباحثين في مجال الذكاء الاصطناعي في العالم يقومون بتحويل روبوتات الدردشة إلى نوع جديد من الأنظمة المستقلة يسمى وكيل الذكاء الاصطناعي. يمكن لهؤلاء الوكلاء القيام بأكثر من مجرد الدردشة. ويمكنهم استخدام التطبيقات البرمجية ومواقع الويب والأدوات الأخرى عبر الإنترنت، بما في ذلك جداول البيانات والتقويمات عبر الإنترنت ومواقع السفر والمزيد.

ومع مرور الوقت، يقول العديد من الباحثين، إن عملاء الذكاء الاصطناعي يمكن أن يصبحوا أكثر تطوراً بكثير، ويمكن أن يحلوا محل العاملين في المكاتب، ويعملون على أتمتة أي وظيفة إدارية تقريبًا.

وقال جيف كلون، أستاذ علوم الكمبيوتر في جامعة كولومبيا البريطانية، والذي عمل سابقًا على هذا النوع من التكنولوجيا كباحث في شركة OpenAI، وهي شركة ناشئة في سان فرانسيسكو قامت ببناء هذه التكنولوجيا: “إنها فرصة تجارية ضخمة، ربما تصل قيمتها إلى تريليونات الدولارات”. ChatGPT. “هذا له جانب إيجابي كبير – وعواقب وخيمة – على المجتمع.”

وكيل Nvidia يلعب لعبة. يمكن للوكلاء المشابهين جدولة الاجتماعات وتحرير الملفات وتحليل البيانات وإنشاء مخططات شريطية متعددة الألوان. والفكرة هي أن هذه الأنظمة الآلية ستعمل في النهاية كمساعدين شخصيين قادرين على التعامل مع مجموعة واسعة من المهام عبر الإنترنت.

وكلاء اليوم محدودون، ولا يمكنهم تنظيم حياتك بالضبط. يمكن لـ ChatGPT البحث في موقع السفر Expedia عن الرحلات الجوية إلى نيويورك، ولكن لا يزال يتعين عليك حجز الحجز بنفسك.

هذه التكنولوجيا، مع تحسين الباحثين لها، يمكن أن تجعل العاملين في المكاتب والمستهلكين أكثر كفاءة. ويمكنه أيضًا تغيير طبيعة ألعاب الفيديو، مما يوفر موجة جديدة من الروبوتات التي يمكن للاعبين اللعب جنبًا إلى جنب والدردشة معها.

GPT-4، التكنولوجيا التي تدعم ChatGPT، هي ما يطلق عليه الباحثون نموذج اللغة الكبير. إنه نظام ذكاء اصطناعي يتعلم المهارات من خلال تحليل كميات هائلة من البيانات.

على مدى الأشهر القليلة الماضية، أبهرت هذه التكنولوجيا مئات الملايين من الأشخاص بالطريقة التي تنشئ بها رسائل البريد الإلكتروني، وتكتب الخطب، والمقاطع الغنائية حول أي موضوع تقريبًا. لكن أهم مهاراته قد تكون موهبته في كتابة برامج الكمبيوتر.

يمكنه على الفور إنشاء برنامج يرسم وحيد القرن أو يسقط ثلجًا رقميًا على شاشة الكمبيوتر المحمول. يمكن لمطوري البرامج المحترفين أن يطلبوا تعليمات برمجية يمكنهم دمجها في برامج أكبر، بما في ذلك كل شيء بدءًا من تطبيقات الوسائط الاجتماعية وحتى محركات البحث. لكن هذا ليس سوى جزء مما يمكن أن تفعله هذه التكنولوجيا. ويمكنه أيضًا إنشاء رمز كمبيوتر يمكن استخدامه في تطبيقات البرامج ومواقع الويب الأخرى.

هذه هي الطريقة التي قام بها الدكتور فان وباحثون آخرون في Nvidia بتعليم GPT-4 كيفية لعب Minecraft. قال الدكتور فان: “الكلمة الأكثر أهمية هنا هي الكود”. “يمكن للكود اتخاذ الإجراءات.”

يستخدم الأشخاص التطبيقات البرمجية ومواقع الويب عن طريق لمس الأزرار والقوائم والأدوات الرسومية الأخرى. يستخدم وكلاء الذكاء الاصطناعي التطبيقات ومواقع الويب من خلال الوصول إلى واجهات برمجة التطبيقات الخاصة بهم، أو واجهات برمجة التطبيقات – رمز البرنامج الأساسي الذي يتيح لهم التواصل مع الخدمات الأخرى عبر الإنترنت.

إذا طلبت من أحد الوكلاء تحميل مقطع فيديو على الإنترنت، على سبيل المثال، فيمكنه إنشاء رمز يسمى واجهة برمجة التطبيقات (API) التي يقدمها YouTube. قال سيلين نايهين، الباحث الذي يساعد في إدارة مشروع وكيل الذكاء الاصطناعي المستقل AutoGPT: “واجهة برمجة التطبيقات (API) هي مجرد نص يستخدم للتحدث مع الآلة”.

من الناحية النظرية، يمكن لروبوت الدردشة كتابة تعليمات برمجية للوصول إلى أي واجهة برمجة تطبيقات على الإنترنت. لكن روبوتات الدردشة اليوم ليست ماهرة بما يكفي للقيام بأكثر من مجرد مهام بسيطة. وحتى لو كان الأمر كذلك، فإن السماح لهم بالتجول بحرية عبر الإنترنت سيكون بمثابة مخاطرة أمنية هائلة. لذلك بدأت الشركات صغيرة.

بعد أشهر قليلة من كشف OpenAI عن ChatGPT، أطلقت بهدوء طريقة لروبوت الدردشة للقيام بما هو أكثر من مجرد إنشاء نص. بعد تثبيت العديد من المكونات الإضافية – وهي البرامج التي تعزز ما يمكن أن يفعله الروبوت – يمكنك أن تطلب منه البحث في مواقع السفر مثل Expedia عن الرحلات الجوية المتاحة، أو الحصول على خريطة لمدينتك من Google Earth أو حتى تحويل جدول بيانات يوضح تفاصيل إنفاقك السنوي إلى مخطط شريطي متعدد الألوان.

نظرًا لأنه مزود بمكون إضافي يسمى مترجم الكود، فإن ChatGPT لا يمكنه كتابة التعليمات البرمجية فحسب، بل يمكنه أيضًا تشغيلها. وقد سمح ذلك للتكنولوجيا بأداء المهام التي لم تكن تستطيع القيام بها في الماضي على الفور، بما في ذلك تحرير جداول البيانات وتحويل الصور الثابتة إلى مقاطع فيديو. وتستكشف جوجل ومايكروسوفت وشركات أخرى تقنيات مماثلة.

وقال آشلي لورينس، نائب رئيس شركة مايكروسوفت: “هذه هي المشاريع التي نتصور فيها أن الذكاء الاصطناعي يعمل بشكل أساسي مع الذكاء الاصطناعي الآخر نيابة عنك”.

تحاول المشاريع المستقلة مثل AutoGPT أن تأخذ هذا النوع من الأشياء عدة خطوات إلى الأمام. والفكرة هي إعطاء النظام أهدافًا مثل “إنشاء شركة” أو “كسب بعض المال”. ثم سيبحث عن طرق للوصول إلى هذا الهدف من خلال طرح الأسئلة على نفسه والاتصال بخدمات الإنترنت الأخرى.

اليوم، هذا لا يعمل بشكل جيد. تميل أنظمة مثل AutoGPT إلى التعثر في حلقات لا نهاية لها. لكن الباحثين مثل الدكتور فان يعملون باستمرار على تحسين هذا النوع من التكنولوجيا في محاولة لجعلها أكثر فائدة وأكثر موثوقية.

يقوم باحثون آخرون ببناء نوع جديد من عوامل الذكاء الاصطناعي المصممة لاستخدام الأدوات البرمجية. في صيف عام 2022، كان الدكتور كلون ضمن فريق من الباحثين في OpenAI الذين قاموا ببناء وكيل يمكنه استخدام برامج الكمبيوتر مثلما يفعل الشخص – نقرة بالماوس بعد نقرة بالماوس، وضغطة مفتاح بعد ضغطة مفتاح.

قام الدكتور كلون وزملاؤه بتزويد النظام بساعات من مقاطع الفيديو عبر الإنترنت التي أظهرت أشخاصًا يلعبون لعبة Minecraft. من خلال تحليل الطريقة التي يستخدم بها الأشخاص الماوس ولوحة المفاتيح للتنقل عبر عالم Minecraft الرقمي، تعلم النظام تشغيل اللعبة بمفرده.

وتقوم شركات أخرى بالبناء، بما في ذلك شركة ناشئة تدعى Adept وكلاء مماثلين التي تستخدم مواقع الويب مثل Wikipedia وRedfin وCraigslist والتطبيقات المكتبية الشائعة من شركات مثل Salesforce.

ويقول الدكتور كلون إن هذا النوع من الوكلاء سيسمح في النهاية للذكاء الاصطناعي باستخدام نطاق أوسع بكثير من التطبيقات البرمجية ومواقع الويب. وقال إن الجميع سيتمكنون من الوصول إلى مساعد رقمي يمكنه فعل أي شيء تقريبًا على الإنترنت. وهذا من شأنه أن يجعل الحياة أسهل، ولكنه قد يحل أيضًا محل عدد لا يحصى من الوظائف.

وقال: “إذا كان الذكاء الاصطناعي يستطيع أن يفعل أي شيء يمكننا القيام به، فإنه لا يحل محل المهام المملة فحسب”. “إنه يحل محل جميع المهام.”





المصدر

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى