Ang pananaliksik ng Apple AI ay nagpapakita ng mga modelo ng pangangatuwiran na gumuho kapag ang mga problema ay mas kumplikado

Ang isang papel na pananaliksik mula sa Apple na inilathala noong Hunyo 6 ay nagsabi na kahit na ang mga malalaking modelo ng pangangatuwiran (LRMS) ay nagpakita ng pinahusay na pagganap sa mga benchmark, nagpupumig sila sa kawastuhan kapag ang mga problema ay naging mas kumplikado.

Pinili ng mga mananaliksik ang Claude 3.7 Sonnet at Deepseek-V3 mula sa mga malalaking modelo ng wika at ang Claude 3.7 Sonnet na may pag-iisip at Deepseek-R1 mula sa mga malalaking modelo ng pangangatuwiran.



Mga Kaugnay na Balita
Popular
Kategorya