تُظهر أبحاث Apple AI أن نماذج التفكير تنهار عندما تكون المشكلات أكثر تعقيدًا

2025-06-19 18:36:19

تكنولوجيا / تكنولوجيا

ذكرت ورقة بحثية من Apple المنشورة في 6 يونيو أنه على الرغم من أن نماذج التفكير الكبيرة (LRMS) أظهرت أداءً محسّنًا على المعايير ، فقد ناضلوا بدقة عندما أصبحت المشكلات أكثر تعقيدًا.

اختار الباحثون كلود 3.7 Sonnet و Deepseek-V3 من بين نماذج اللغة الكبيرة و Claude 3.7 Sonnet مع التفكير و Deepseek-R1 من بين نماذج التفكير الكبيرة.

أخبار ذات صلة

تكنولوجيا / تكنولوجيا

ستكون بطاقات مفتاح ألعاب Nintendo Switch 2 شائعة جدًا

تتراوح ترقيات لعبة Switch 2 لألعاب Switch الأصلية من 10 دولارات إلى 20 دولارًا.

تكنولوجيا / الأدوات

تم إطلاق Motorola Razr 60 Ultra و Razr 60: السعر والميزات والتوافر

تحتوي هذه الهواتف الوجه أيضًا على مفتاح منظمة العفو الدولية المخصصة للوصول إلى moto.ai

تكنولوجيا / تكنولوجيا

تحتفل Google بعشر سنوات من صور Google مع أدوات التحرير الجديدة

تجلب صور Google أدوات جديدة إلى 1.5 مليار مستخدم في عيد ميلاده العاشر.

تكنولوجيا / تكنولوجيا

القاضي الفيدرالي يمنع فلوريدا من إنفاذ حظر وسائل التواصل الاجتماعي للأطفال مع استمرار الدعوى

منع قاض فيدرالي مسؤولي الولاية من إنفاذ قانون فلوريدا الذي يحظر حسابات وسائل التواصل الاجتماعي على الأطفال الصغار

تكنولوجيا / الأدوات

لا يوجد هاتف 3 سيقدم مصفوفة الرسول الرسمية

"عندما يصبح الضوء لغة ... تقديم مصفوفة الرسول الرسمية" ، لا شيء

تكنولوجيا / تكنولوجيا

توقعات الطقس Microsoft AI بشكل أسرع وأرخص وأرور: دراسة

وفقًا لمصمميها ، فإن Aurora هو أول نموذج من الذكاء الاصطناعي يتفوق باستمرار على سبعة مراكز تنبؤ في التنبؤ بمسار خمسة أيام من الأعاصير المدمرة

تكنولوجيا / تكنولوجيا

تحقق منظم إيطاليا Deepseek على مخاطر المعلومات الخاطئة

وقال المنظم الإيطالي ، الذي يسيطر أيضًا على حقوق المستهلك ، في بيان لم يمنح ديبسيك للمستخدمين "تحذيرات واضحة وفورية وواضحة حول مخاطر ما يسمى" الهلوسة "في محتواه المنتجة AI

تكنولوجيا / تكنولوجيا

تكشف شركة Apple عن إعادة تصميم البرامج أثناء تعويضها من أخطاء الذكاء الاصطناعى ، والاضطرابات التقنية ، وحرب ترامب التجارية

بعد التعثر من بوابة البداية في سباق Big Tech المحوري للاستفادة من الذكاء الاصطناعي ، حاولت Apple استعادة قدمها يوم الاثنين خلال مؤتمر المطورين

تكنولوجيا / تكنولوجيا

يقوم المتسللون الصينيون والهواتف التي تنقل الهواتف الذكية بتحويل الهواتف الذكية إلى "أزمة أمان للجوال"

لقد حاول المتسللون المرتبطون بحكومة الصين مرارًا وتكرارًا للوصول إلى هواتف الأميركيين البارزين ، وهي جزء من جهود بكين المترامية الأطراف عبر الإنترنت

تكنولوجيا / تكنولوجيا

Openai يوسع الذكاء الاصطناعي لبرنامج مسرع التأثير في الهند مع 11 منظمات غير ربحية

كان البرنامج جزءًا من مظلة Openai Academy التابعة لشركة الذكاء الاصطناعى ويصل القيمة الإجمالية لمنحها الفنية إلى 150،000 دولار

تكنولوجيا / تكنولوجيا

ربما لن تبدو ثورة التكنولوجيا التالية مثلها مثل آخرها

لماذا تتبع الصين الغاز الصخري

تكنولوجيا / تكنولوجيا

يقود Waymo سباق سيارات الأجرة المستقلة في الولايات المتحدة

أصبحت سيارات Waymo المستقلة جزءًا من المشهد اليومي في عدد متزايد من المدن الأمريكية ، حيث تعمل كخيارات نقل آمنة ومناطق جذب سياحية ورموز لمستقبل غير كافٍ

الأكثر شعبية

#1

تكنولوجيا / تكنولوجيا

نظرًا لأن المزيد من LLMs ومنصات منظمة العفو الدولية الأخرى متكاملة على نطاق واسع ، فهناك مخاطر مثل التسمم النموذجي ، وما إلى ذلك ، لذلك ، سيكون قد تكون قدسية النموذج أمرًا بالغ الأهمية

#2

عمل / أعمال

يبدأ التغذية في لويزفيل قبل إدارة Kentucky Derby لفترة طويلة

يعد Kentucky Country Ham والبسكويت و Derby Pie مع بوربون جزءًا من الاحتفال الذي استمر أسبوعًا لدربي كنتاكي.

#3

عمل / أعمال

يستمر رمز النوم في سلسلة الفوز بروزه رقم 1

أصبح "Damocles" ثالث رقم 1 على التوالي من Sleep Token على الرسم البياني الفردي Rock & Metal في المملكة المتحدة ويتحرك في أفضل 40 في العديد من التصنيفات البريطانية الأخرى.

#4

عمل / أعمال

فورد تسحب التوقعات المالية على عدم اليقين التعريفي - الانضمام إلى هذه الشركات

قامت العديد من الشركات بسحب توقعاتها للعام بأكمله لعام 2025 ، حيث أشار الكثيرون إلى عدم اليقين في السوق بسبب تعريفة ترامب.

#5

عمل / أعمال

لا هوادة فيها ومرونة: دروس القيادة من توم ثيبودو

لا ترتبط دروس القيادة في توم ثيبودو فقط بكرة السلة.

#6

عمل / أعمال

جولة وداع منظمة الصحة العالمية 2025

أعلنت مجموعة الصخور البريطانية الأسطورية ، The WHO ، أنها ستشرع في جولتها الأخيرة في أمريكا الشمالية في أواخر الصيف من هذا العام.

#7

عمل / أعمال

جريمة تكساس رينجرز سيئة وتم إجراء التغييرات

بدأت جريمة تكساس رينجرز بداية مروعة وهي في المرتبة السابعة والعشرين في الدوري ، لذلك أطلق الفريق منسقهم الهجومي على أمل أن يتمكنوا من تصحيح السفينة.

#8

السياسة / السياسة

أربعة أسئلة في حجج المحكمة العليا في قضايا المواطنة ذات الحقوق

لم ينته الأمر في 21 أبريل. ولكن يوجد الآن تاريخ جديد عندما ينتهي تجميد التوظيف الفيدرالي.

#9

عمل / أعمال

يتحول قانون المضخة إلى اثنين ، لكن معظم أرباب العمل لا يزالون لا يتوافقون

لا يزال معظم أرباب العمل لا يمتثلون لقانون المضخة الفيدرالية ، مما يتطلب منهم تزويد الموظفين بوقت خاص والوقت للتعبير عن حليب الأم في العمل.

#10

عمل / أعمال

تأثير الذكاء الاصطناعي على حرية الصحافة ووسائل الإعلام

لا تزال حرية الصحافة تتعرض للتهديد على مستوى العالم ، حيث يتم قتل الصحفيين أو المصابين ، والآخرين يخضعون للرقابة ، ويتم إغلاق وسائل الإعلام ، من بين آخرين.

#11

السياسة / السياسة

تم تحرير الولايات المتحدة المحتجزة في بيلاروسيا

لدى Thunderbolts أكثر من مائة مراجعة من النقاد ، وقد تبين أنه أفضل فيلم MCU الذي تمت مراجعته منذ ما يقرب من نصف عقد.

#12

عمل / أعمال

ترامب يوقع الأمر التنفيذي لخفض التمويل الفيدرالي لـ NPR و PBS

اتهم أمر ترامب PBS و NPR بأنه "متحيز وحزبي" في تغطيته الإخبارية ، كرر التكرار الذي طرحه الرئيس في الماضي.

فئة

#1

تكنولوجيا

#2

الأدوات