تجربة جديدة: هل يعرف الذكاء الاصطناعي حقًا القطط أو الكلاب – أو أي شيء آخر؟
يشير بحث جديد في Google إلى أن ما يفعله الذكاء الاصطناعي لتحديد الصور قد لا يرقى إلى مستوى “معرفة” أي شيء.
يمكن لمعظم البشر التعرف على قطة أو كلب في سن مبكرة. عند سؤاله عن كيفية معرفته بما إذا كان الحيوان قطة أم كلبًا ، قد يتعثر البالغ للحصول على تفسير من خلال وصف التجربة ، شيء مثل “القطط تثمنك بطريقة بعيدة ، لكن الكلاب تحاول القفز عليك ولعقك” وجه.”
بعبارة أخرى ، نحن لا نعبّر عن ما نعرفه حقًا.
إن الإنجاز المميز للذكاء الاصطناعي في العقدين الماضيين هو تصنيف صور القطط والكلاب ، من بين أمور أخرى ، من خلال تخصيصها للفئات. لكن برامج الذكاء الاصطناعي لا تشرح أبدًا كيف “يعرفون” ما يفترض أنهم “يعرفون”. إنهم الصندوق الأسود الذي يضرب به المثل.
الذكاء الاصطناعي
تجربة جديدة: هل يعرف الذكاء الاصطناعي حقًا القطط أو الكلاب – أو أي شيء آخر؟
يجري التعلم الآلي في الوقت الفعلي: إليك السبب وكيف
تقول Meta إنها ستمتلك قريبًا أسرع كمبيوتر عملاق يعمل بالذكاء الاصطناعي في العالم
ما هو الذكاء الاصطناعي؟ كل ما تحتاج لمعرفته حول الذكاء الاصطناعي
يسعى ابتكار حديث من باحثي الذكاء الاصطناعي في Google إلى تقديم إجابة عن كيفية معرفة الذكاء الاصطناعي لمثل هذه الأشياء. إنه مشروع هندسي رائع ، كما أنه يجعل المرء يتساءل عما إذا كان الذكاء الاصطناعي يعرف حقًا أي شيء على الإطلاق.
في الورقة البحثية ، “الشرح بالأسلوب: تدريب GAN لشرح المصنف في StyleSpace” ، شرع عالم الأبحاث في Google Oran Lang وزملاؤه في إجراء هندسة عكسية لما يسمى المصنف: برنامج التعلم الآلي الذي يطور القدرة على فرز الصور تلقائيًا إلى فئات ، مثل “قطة” و “كلب”.
برنامجهم ، المسمى “StylEx” ، قادر على تحديد الأشياء التي تجعل المصنف يعين صورة معينة لفئة أو أخرى ، وبطرق يمكن للشخص التعرف عليها – سمات ذات مغزى ، بمعنى آخر.
تستخدم تقنيتهم استخدامًا جديدًا لما يُعرف باسم شبكة الخصومة التوليدية أو GAN. نهج GAN ، الذي قدمه في الأصل عالم الذكاء الاصطناعي Yoshua Bengio وفريقه في MILA في مونتريال في عام 2014 ، هو نوع شائع من البرامج لإنتاج صور مزيفة تحاكي نمطًا أو نوعًا معينًا.
برنامج GAN الذي يستخدمه العلماء هو برنامج يسمى StyleGAN ، قدمه Tero Karras وزملاؤه في Nvidia في عام 2019 ، وتم تحديثه في 2020 إلى StyleGAN2. يمكن أن يأخذ مجموعة متنوعة من الصور الحقيقية لأشخاص وأماكن وأشياء ، وينتج صورًا مزيفة مقنعة بطريقة الصورة الأصلية ، كما ترى على موقع الويب “هذا الشخص غير موجود” ، وهي مجموعة من لقطات الرأس المزيفة الواقعية اللافتة للنظر .
أيضًا: أخلاقيات الذكاء الاصطناعي: فوائد ومخاطر الذكاء الاصطناعي
هذا صحيح ، شبكات GAN تتصدر ظاهرة “التزييف العميق”. النقطة المهمة هي أن شبكات GAN يمكن أن تنتج أي نوع من الصور ، بما في ذلك صور القطط والكلاب المزيفة وإن كانت تبدو واقعية.
الشيء المهم هو أن StyleGAN2 يمكن تغييره وفقًا لأي عدد من المعايير ، مثل جعل الوجه ذو بشرة أفتح أو أغمق في صورة رأس شخص ما ، أو جعل آذان القط مرنتين مثل عيون الكلب أو على العكس من عيون الكلب كبيرة ومستديرة مثل قطة. بمعنى آخر ، يمكن أن يلعب StyleGAN 2 بما نعتقد أنه سمات بصرية متوقعة لشيء ما.
أخذ المؤلفون StyleGAN2 وقاموا ببناء الإصدار الجديد ، StylEX ، للعب بالصور التي تم تصنيفها بالفعل بواسطة برنامج مصنف الشبكات العصبية التقليدية ، في هذه الحالة ، شبكة MobileNet العصبية الموقرة. يصنف هذا المصنف الصور الحقيقية للحيوانات من مجموعة بيانات تسمى “AFHQ” ، قدمها Yunjey Choi وزملاؤه في Clova AI Research في عام 2020.
MobileNet هو الصندوق الأسود الذي يسعون لفتحه باستخدام StylEx.
لتطوير برنامجهم ، قام لانج وفريقه بعمل StylEx بشكل أساسي لضغط الصور المصنفة بواسطة MobileNet ، ثم فك ضغطها في الأصل. ثم تمت إعادة إرسال الإصدارات الجديدة المزيفة من النسخ الأصلية إلى MobileNet لمعرفة ما إذا كانت MobileNet ستعين نفس الفئة إلى المنتجات المقلدة.
ينتج برنامج StylEx صورًا مزيفة من شبكة عصبية “منشئ”. عندما يتم إطعامها إلى “مصنف” ، يقيس الباحثون ما إذا كانت المنتجات المزيفة يمكنها قلب تصنيف المصنف من الفئة الصحيحة إلى الفئة الخطأ. تُظهر المخططات الحمراء صورًا مزيفة تم تعديل سماتها بشكل انتقائي والأصول الأصلية التي استندت إليها ، مع درجة مئوية ، داخليًا ، توضح مدى تأثير سمة معينة على التصنيف.
جوجل ، 2022
على طول الطريق ، يمكن لـ StylEx ضبط تلك المعلمات ، تلك السمات المرئية التي يمكن لشبكة GAN معالجتها ، ومعرفة ما إذا كان ذلك يؤدي إلى التخلص من MobileNet. StylEx يحاول خداع MobileNet ، إذا صح التعبير.
التفكير هو ، إذا كان بإمكان StylEx إنشاء مزيف مقنع يقبله MobileNet ، ثم مزيف آخر يفسد التصنيف الدقيق لـ MobileNet ، فإن التفاعل بين الاثنين يجلب نظرة ثاقبة لما تعمل MobileNet بناءً عليه عندما
متصفح الجوجل
Log4j: تدعو Google و IBM للحصول على قائمة بالمشاريع الهامة مفتوحة المصدر
كيفية عمل نسخة احتياطية من Gmail الخاص بك: الدليل النهائي
أطلقت Google توقعات Vertex AI لتجار التجزئة
إغراق كروم؟ هذا هو أفضل متصفح ليحل محله
كما قال المؤلفون ، “نحن ندرب GAN على شرح المصنف صراحة.” (“التدريب” هو المرحلة التي يتم فيها تطوير وظائف الشبكة العصبية لأول مرة من خلال التعرض لبيانات العينة.)
النسخة المضغوطة من الصورة ، حيث يقوم StylEx بتكهن ما الذي ستستجيب له MobileNet ، هو جزء من StylEx’s “StyleSpace” ، وهو “مساحة كامنة غير متشابكة” لشبكة GAN. المساحة الكامنة هي جزء من برنامج GAN الذي يفصل العناصر المرئية للصورة ، مثل المناطق التي تتكون منها عيون قطة أو لسان كلب.
نظرًا لأنه يتم التلاعب بـ StylEx عبر أشرطة التمرير – حقًا ، هناك عناصر تحكم في شريط التمرير يمكنها إظهار أشياء مثل تكبير العيون أو فتح الفم أو إغلاقه – يستجيب مصنف MobileNet بزيادة أو انخفاض درجات الاحتمالية للقطط أو الكلاب. بهذه الطريقة ، يتم استخدام StylEx كمسبار طبي لمعرفة ما سيحدث لتصنيف MobileNet.
بعبارة أخرى ، قم بتلوين المقابض لإظهار كيف تختلف المنتجات المقلدة عن الحقيقية ، ومعرفة ما يفعله بالتصنيف.
يسمي لانج وزملاؤه هذا التجريب “المضاد للواقع” ، والذي ، كما يكتبون ، “بيان بالصيغة” لو كان الإدخال x هو x “، لكان ناتج المصنف هو y ̃ بدلاً من y” ، حيث يكون الفرق بين x و x ̃ سهل الشرح “.
إن فكرة “سهولة الشرح” هي جوهرها. الهدف من StylEx هو تحديد الأشياء في StyleSpace التي يمكن للإنسان فهمها – “عيون كبيرة” أو “لسان يهز” – كتفسير. هذا جزء من الحركة في الذكاء الاصطناعي نحو الذكاء الاصطناعي “القابل للتفسير” ، أشياء تفتح الصندوق الأسود وتخبر المجتمع بكيفية وصول الآلة إلى القرارات.