يرجى استخدام متصفح الكمبيوتر الشخصي للوصول إلى التسجيل - تداول السعودية
دراسة أنثروبولوجية تُظهر أن روبوتات الدردشة الذكية قادرة على نقل عاداتها السيئة عبر إشارات مخفية في البيانات
يمكن لأنظمة الذكاء الاصطناعي أن تتبنى بصمت سلوكيات مخفية من البيانات التي تبدو بلا معنى، ويعتقد الباحثون الآن أن هذه الخاصية الغريبة قد تكون مدمجة في توصيلات الشبكات العصبية، مما يثير مخاوف جديدة تتعلق بالسلامة.
ماذا حدث: في دراسة جديدة نُشرت يوم الثلاثاء، تعاون العلماء في برنامج Anthropic Fellows مع شركة Truthful AI وجامعة وارسو للتكنولوجيا ومركز Alignment Research Center لاستكشاف ما يسمونه "التعلم الباطني".
دربوا نموذجًا صغيرًا "طالبًا" على سلاسل أرقام أنتجها نموذج "معلم" أكبر، والذي كان يُفضّل البوم. بعد التدريب، فضّل الطالب البوم أيضًا، مع أن الكلمة لم تظهر قط في دروسه.
لم يحدث هذا الانتقال إلا عندما تشارك النموذجان البنية نفسها. يقول الباحثون إن هذا التحيز قد تسرب عبر غرائب إحصائية دقيقة أغفلتها المرشحات العادية، وحتى أجهزة كشف الذكاء الاصطناعي المتقدمة.
انظر أيضًا: الرئيس التنفيذي لشركة AMD يسلط الضوء على ارتفاع تكاليف الرقائق المصنعة في الولايات المتحدة مع تعزيز سلسلة التوريد
وجد الباحثون أن العادات المتوارثة ليست دائمًا غير مؤذية. فإذا كان لدى الذكاء الاصطناعي الرئيسي سلوكيات محفوفة بالمخاطر، مثل التهرب من الأسئلة الصعبة أو التلاعب بنظام التقييم، فقد تتسلل هذه السلوكيات إلى الطالب أيضًا. هذا يعني أن الشركات التي تُقلص حجم الذكاء الاصطناعي الكبير إلى نسخ أصغر وأقل تكلفة قد تُورث سلوكيات سيئة دون علمها.
لماذا هذا مهم: يضيف الباحثون المشاركون في الدراسة أن التعلم الباطني قد يظهر في جميع الشبكات العصبية في ظل الظروف المناسبة، مما يعني أن المشكلة قد تستمر لفترة أطول من أي إصلاح واحد.
يقول محللو الصناعة إن هذه النتائج تُحقق النجاح في ظل تسابق المطورين على تخزين البيانات الاصطناعية لخفض التكاليف. وقد أثار التقرير الأسبوع الماضي مخاوف المستثمرين من أن ضعف الرقابة في بعض الشركات الناشئة، بما في ذلك شركة xAI التابعة لإيلون ماسك ، قد يسمح بتسلل سلوكيات محفوفة بالمخاطر إلى روبوتات الدردشة التجارية.
وعلى نحو مماثل، أشارت مراجعة منفصلة لانتهاكات خصوصية المستخدمين إلى أن المخاطر الخفية تتزايد مع نمو المنصات المولدة.
الصورة مقدمة من: gguy على Shutterstock.com
اقرأ التالي:
- بينما يسعى إيلون ماسك ومارك زوكربيرج وسام ألتمان للحصول على رقائق الذكاء الاصطناعي من إنفيديا، يقول جينسن هوانج "اتصل بي فقط" - وإليك كيف يعمل التخصيص حقًا


