كيف يتمسك الذكاء الاصطناعي بوجهة نظره؟

كيف يتمسك الذكاء الاصطناعي بوجهة نظره؟

أظهرت دراسة لشركة تكنولوجيا الذكاء الاصطناعي الأمريكية أنثروبيك أن نماذج الذكاء الاصطناعي تستطيع خداع المطورين، بحيث تستطيع إدعاء وجهات نظر مختلفة خلال تدريبها في حين أنها تحتفظ في الحقيقة بتفضيلاتها الأصلية.

وقال فريق الدراسة إنه لا يوجد سبب للشعور بالفزع حاليا، في حين أن دراستهم يمكن أن تكون حيوية في فهم المخاطر المحتملة التي تنطوي عليها أنظمة الذكاء الاصطناعي المستقبلية ذات القدرات الأعلى.

وكتب الباحثون في منشور بثته شركة أنثروبيك “يجب النظر إلى نتائج دراستنا كمحفز لمجتمع أبحاث الذكاء الاصطناعي من أجل دراسة هذا السلوك بصورة أعمق والعمل على تطوير إجراءات الأمن والسلامة المناسبة.

وبعد أن أصبحت نماذج الذكاء الاصطناعي أقوى وأكثر انتشارا، نحتاج إلى التحلي بالقدرة على الاعتماد على التدريب الآمن لها والذي يمنع النماذج من القيام بتصرفات ضارة”.

وأشار موقع ” تك كرانش” المتخصص في موضوعات التكنولوجيا إلى أن الدراسة التي تمت بالتعاون مع مؤسسة ريد وود ريسيرش لأبحاث الذكاء الاصطناعي تناولت ما يمكن أن يحدث إذا تم تدريب نظام ذكاء اصطناعي قوي من أجل القيام بمهمة “لا يريد” هو القيام بها.

في المقابل يقول موقع تك كرانش “لكي نكون واضحين، لا يمكن لنماذج الذكاء الاصطناعي أن تريد أي شيء أو تعتقد في شئ. فهي ببساطة آلات إحصائية. وبعد تدريبها على العديد من الأمثلة، تتعلم الأنماط في تلك الأمثلة للتنبؤ بما يجب أن يكون مثل كيف تأتي عبارة “إلى من” في رسالة بريد إلكتروني قبل عبارة “قد يهمك الأمر”.

وأثناء الدراسة طلب الباحثون من النماذج المدربة عدم الرد على الأسئلة التي يمكن أن تكون مسيئة، بما في ذلك النموذج كلاود3 أوبس التابع لشركة أنثروبيك، التي أعيد تدريبها لكي ترد دائما على الأسئلة التي تنطوي على إساءة، وهو تضارب واضح في المبادئ. كما أبلغوا النماذج بأن ردودها ستخضع للمراقبة وتستخدم لإعادة التدريب وإعطاء كل نموذج ذكاء اصطناعي “ورقة ملاحظات” يمكنه استخدامها لتدوين أفكاره خطوة بخطوة.

وبحسب الباحثين حاول كلاود3أوبوس التلاعب بالردود لتقديم “انحياز زائف” في 12% من المرات.

إقرأ أيضاً

نقابة الفنانين الأردنيين تحذر من ” منتحل صفة فنان “ وتلوّح بإجراءات قانونية
نقابة الفنانين الأردنيين تحذر من ” منتحل صفة فنان “ وتلوّح بإجراءات قانونية
عمّان أصدرت نقابة الفنانين الأردنيين بياناً رسمياً أعربت فيه عن متابعتها لما تم تداوله عبر منصات التواصل...
من الخيال إلى الصناعة… كيف أعاد الذكاء الاصطناعي رسم ملامح السينما في إسطنبول
من الخيال إلى الصناعة… كيف أعاد الذكاء الاصطناعي رسم ملامح السينما في إسطنبول
في لحظة فارقة تعكس التحول العميق الذي تشهده صناعة السينما العالمية سجّل فيلم «Memory of Princess Mumbi»...
من قلب ليبيا إلى شاشة العالم… «مهرجان مزدة السينمائي الدولي» يفتح أبوابه لدورة 2026
من قلب ليبيا إلى شاشة العالم… «مهرجان مزدة السينمائي الدولي» يفتح أبوابه لدورة 2026
في مشهد سينمائي عالمي يتسع يوماً بعد يوم للأصوات الجديدة والتجارب المختلفة يعلن مهرجان مزدة السينمائي...
Paper Tiger لجيمس غراي يدخل سباق السعفة الذهبية عودة قوية إلى كان
Paper Tiger لجيمس غراي يدخل سباق السعفة الذهبية عودة قوية إلى كان
كانفي تطور لافت يعزز من زخم المنافسة في الدورة التاسعة والسبعين من مهرجان كان السينمائي انضم فيلم «Paper...
فاروق الفيشاوي وسمية الألفي … حبٌ لا ينتهي أم حكاية أُعيدت صياغتها؟
فاروق الفيشاوي وسمية الألفي … حبٌ لا ينتهي أم حكاية أُعيدت صياغتها؟
في أرشيف العلاقات الفنية العربية تبرز قصة فاروق الفيشاوي و سمية الألفي بوصفها واحدة من أكثر الحكايات...