تجد الشركات الكبرى طريقة لتحديد بيانات الذكاء الاصطناعي التي يمكنها الوثوق بها


البيانات هي وقود الذكاء الاصطناعي. كما أنه يشكل عنق الزجاجة بالنسبة للشركات الكبرى، لأنها مترددة في تبني التكنولوجيا بشكل كامل دون معرفة المزيد عن البيانات المستخدمة لبناء برامج الذكاء الاصطناعي.

والآن، قام اتحاد من الشركات بتطوير معايير لوصف أصل البيانات وتاريخها والحقوق القانونية لها. المعايير هي في الأساس نظام تصنيف يوضح أين ومتى وكيف تم جمع البيانات وإنشائها، بالإضافة إلى الاستخدام المقصود والقيود.

تم تطوير معايير مصدر البيانات، التي تم الإعلان عنها يوم الخميس، من قبل Data & Trust Alliance، وهي مجموعة غير ربحية تتكون من عشرين شركة ومنظمة كبيرة بشكل رئيسي، بما في ذلك American Express وHumana وIBM وPfizer وUPS وWalmart، بالإضافة إلى عدد قليل من الشركات الناشئة.

ويعتقد أعضاء التحالف أن نظام تصنيف البيانات سيكون مشابهًا للمعايير الأساسية لسلامة الأغذية التي تتطلب معلومات أساسية مثل مصدر الغذاء ومن أنتج وزرعه ومن تعامل مع الطعام في طريقه إلى رف البقالة.

ويقول المسؤولون التنفيذيون إن المزيد من الوضوح والمزيد من المعلومات حول البيانات المستخدمة في نماذج الذكاء الاصطناعي، سيعزز ثقة الشركات في التكنولوجيا. ومن غير المؤكد مدى نطاق استخدام المعايير المقترحة، وسيعتمد الكثير على مدى سهولة تطبيق المعايير وأتمتتها. لكن المعايير ساهمت في تسريع استخدام كل التقنيات المهمة، من الكهرباء إلى الإنترنت.

وقال كين فينيرتي، رئيس تكنولوجيا المعلومات وتحليلات البيانات في UPS: “هذه خطوة نحو إدارة البيانات كأصل، وهو ما يحاول الجميع في الصناعة القيام به اليوم”. “للقيام بذلك، عليك أن تعرف مكان إنشاء البيانات، وتحت أي ظروف، والغرض المقصود منها، وأين يكون استخدامها قانونيًا أم لا.”

وتشير الدراسات الاستقصائية إلى الحاجة إلى مزيد من الثقة في البيانات وتحسين الكفاءة في التعامل مع البيانات. في أحد استطلاعات الرأي التي شملت الرؤساء التنفيذيين للشركات، أشارت الأغلبية إلى “المخاوف بشأن نسب البيانات أو مصدرها” باعتبارها عائقًا رئيسيًا أمام تبني الذكاء الاصطناعي. ووجدت دراسة استقصائية لعلماء البيانات أنهم يقضون ما يقرب من 40 بالمائة من وقتهم في مهام إعداد البيانات.

تهدف مبادرة البيانات بشكل أساسي إلى بيانات الأعمال التي تستخدمها الشركات لإنشاء برامج الذكاء الاصطناعي الخاصة بها أو البيانات التي قد تغذيها بشكل انتقائي في أنظمة الذكاء الاصطناعي من شركات مثل Google وOpenAI وMicrosoft وAnthropic. كلما كانت البيانات أكثر دقة وجديرة بالثقة، زادت موثوقية الإجابات التي يولدها الذكاء الاصطناعي.

لسنوات، كانت الشركات تستخدم الذكاء الاصطناعي في التطبيقات التي تتراوح بين تصميم توصيات المنتج إلى التنبؤ بالوقت الذي ستحتاج فيه المحركات النفاثة إلى الصيانة.

لكن ظهور ما يسمى بالذكاء الاصطناعي التوليدي في العام الماضي، والذي يشغل روبوتات الدردشة مثل ChatGPT التابع لشركة OpenAI، أدى إلى زيادة المخاوف بشأن استخدام البيانات وإساءة استخدامها. يمكن لهذه الأنظمة إنشاء نص ورموز حاسوبية بطلاقة تشبه ما يفعله الإنسان، لكنها غالبًا ما تختلق أشياء – “الهلوسة” على حد تعبير الباحثين – اعتمادًا على البيانات التي تصل إليها وتجميعها.

لا تسمح الشركات عادةً لموظفيها باستخدام إصدارات المستهلك من برامج الدردشة الآلية بحرية. لكنهم يستخدمون بياناتهم الخاصة في مشاريع تجريبية تستخدم القدرات التوليدية لأنظمة الذكاء الاصطناعي للمساعدة في كتابة تقارير الأعمال والعروض التقديمية ورموز الكمبيوتر. ويمكن أن تأتي بيانات الشركة من مصادر عديدة، بما في ذلك بيانات العملاء والموردين والطقس والموقع.

قال روب توماس، النائب الأول لرئيس قسم البرمجيات في شركة IBM: “إن الخلطة السرية ليست هي النموذج”. “إنها البيانات.”

وفي النظام الجديد، هناك ثمانية معايير أساسية، بما في ذلك النسب والمصدر والحقوق القانونية ونوع البيانات وطريقة توليدها. ثم هناك أوصاف أكثر تفصيلاً لمعظم المعايير، مثل الإشارة إلى أن البيانات جاءت من وسائل التواصل الاجتماعي أو أجهزة الاستشعار الصناعية، على سبيل المثال.

يمكن إجراء توثيق البيانات بمجموعة متنوعة من التنسيقات التقنية المستخدمة على نطاق واسع. وتقوم الشركات في اتحاد البيانات باختبار المعايير لتحسينها وتحسينها، وتتمثل الخطة في إتاحتها للجمهور في أوائل العام المقبل.

تم تصنيف البيانات حسب النوع والتاريخ والمصدر من قبل الشركات والصناعات الفردية. لكن الكونسورتيوم يقول إن هذه هي المعايير التفصيلية الأولى التي من المفترض استخدامها في جميع الصناعات.

قال ثي مونتالفو، عالم البيانات ونائب رئيس التقارير والتحليلات في شركة Transcarent: “لقد أمضيت حياتي كلها غارقًا في البيانات وأحاول اكتشاف ما يمكنني استخدامه وما هو الدقيق”.

Transcarent، وهي عضو في اتحاد البيانات، هي شركة ناشئة تعتمد على تحليل البيانات ونماذج التعلم الآلي لتخصيص الرعاية الصحية وتسريع الدفع لمقدمي الخدمات.

وقالت السيدة مونتالفو إن فائدة معايير البيانات تأتي من زيادة الشفافية للجميع في سلسلة توريد البيانات. غالبًا ما يبدأ تدفق العمل هذا بالتفاوض على العقود مع شركات التأمين للوصول إلى بيانات المطالبات ويستمر مع علماء البيانات والإحصائيين وخبراء الاقتصاد الصحي في الشركة الناشئة الذين يبنون نماذج تنبؤية لتوجيه العلاج للمرضى.

وفي كل مرحلة، فإن معرفة المزيد عن البيانات في وقت أقرب من شأنه أن يؤدي إلى زيادة الكفاءة والقضاء على العمل المتكرر، مما قد يؤدي إلى تقليل الوقت المستغرق في مشاريع البيانات بنسبة 15 إلى 20 بالمائة، حسب تقديرات السيدة مونتالفو.

يقول اتحاد البيانات إن سوق الذكاء الاصطناعي اليوم يحتاج إلى الوضوح الذي يمكن أن توفره معايير تصنيف البيانات الخاصة بالمجموعة. قال كريس هازارد، المؤسس المشارك والرئيس التنفيذي للتكنولوجيا في شركة Howso، وهي شركة ناشئة تصنع أدوات تحليل البيانات وبرامج الذكاء الاصطناعي: “يمكن أن يساعد هذا في حل بعض المشكلات في الذكاء الاصطناعي التي يتحدث عنها الجميع”.



المصدر

صالح علي

كاتب ومحرر صحفي

إصابة بنزيمة تثير قلق الاتحاديين قبل المونديال

ملتزمون بتلبية الاحتياجات الإنسانية المُلحّة لسكان غزة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *