Apple AIの研究は、問題がより複雑なときに推論モデルが崩壊することを示しています

2025-06-20 00:26:53

テクノロジー / テクノロジー

6月6日に公開されたAppleの研究論文は、大きな推論モデル（LRMS）がベンチマークのパフォーマンスの向上を示したが、問題がより複雑になったときに正確さに苦しんだと述べた。

研究者たちは、大規模な言語モデルの中からClaude 3.7 SonnetとDeepseek-V3を選び、Claude 3.7 Sonnetを考えて、大きな推論モデルの中からDeepSeek-R1を選びました。

関連ニュース

テクノロジー / テクノロジー

OpenaiのChatGPTは、無料のユーザー向けにアップグレードされたメモリをロールアウトします

この機能は以前に有料のサブスクライバーで利用でき、ChatGptが過去の会話をより適切に参照してよりパーソナライズされた応答を提供することを許可しました

テクノロジー / テクノロジー

Elon Musk's Xはニューヨークを訴えてコンテンツの節度法をブロックする

マンハッタン連邦裁判所に提出された苦情の中で、Xは、ニューヨークの法律は、修正第1条が保護し、国家が嫌いであるという「非常に敏感で物議を醸すスピーチ」を開示しない限り、訴訟と潜在的に大きな罰金を科すと述べた。

テクノロジー / テクノロジー

siri aiが偶然出た後、WWDC 2025の間に輝くようにプレッシャーをかけているリンゴ

Appleは、年次Worldwide Developers Conference（WWDC）で、切望されているデバイスとソフトウェアのプランを紹介します。

テクノロジー / テクノロジー

ニュージーランドPMは、ソーシャルメディアから16歳未満の禁止を提案しています

ニュージーランドの首相は火曜日にソーシャルメディアから16歳未満の子供を禁止することを提案した

テクノロジー / テクノロジー

ChatGptはグローバルな停止に直面しています。

リアルタイム監視プラットフォームのダウンデテクターによると、CHATGPTの停止に関するユーザーレポートは午後3時ごろに急速に急増し、インドだけで約800の苦情が記録されました。

テクノロジー / テクノロジー

Huaweiチップスは米国に遅れをとっていますが、企業は回避策を見つけています、とCEOは言います

Chipmakerは、年間1,800億元（250億7000万ドル）を投資し、複合チップスまたは複数の要素で作られたチップで約束を見ています

テクノロジー / テクノロジー

Nintendo Switch 2のゲームレスゲームキーカードは非常に一般的になるでしょう

元のスイッチゲームのスイッチ2ゲームのアップグレードも10ドルから20ドルです。

テクノロジー / ガジェット

Motorola Razr 60 Ultra and Razr 60の発売：価格、機能、可用性

これらのフリップフォンには、Moto.aiにアクセスするための専用のAIキーもあります

テクノロジー / テクノロジー

Googleは新しい編集ツールを使用して10年間のGoogle写真を祝います

Google Photosは、10歳の誕生日に15億人のユーザーに新しいツールをもたらします。

テクノロジー / テクノロジー

連邦裁判官は、訴訟が続く間、フロリダが子供のためのソーシャルメディア禁止を施行することをブロックします

連邦判事は、幼い子供のソーシャルメディアアカウントを禁止するフロリダ州の法律を強制することを州当局者に禁止しました

テクノロジー / ガジェット

電話3がグリフマトリックスを導入するものはありません

「光が言語になるとき...グリフマトリックスを紹介する」と何もツイートしませんでした

人気

#1

テクノロジー / テクノロジー

より多くのLLMSおよび他のAIプラットフォームが広く統合されているため、モデル中毒などのリスクがあるため、モデルの神聖さが重要になることを保証します

#2

仕事 / ビジネス

ルイビルでのごちそうは、ケンタッキーダービーが走るずっと前に始まります

ケンタッキー州のカントリーハム、ビスケット、ダービーパイは、バーボンで洗い流されたことは、ケンタッキーダービーの1週間のお祝いの一部です。

#3

仕事 / ビジネス

スリープトークンは、別のNo.1との勝利連勝を続けます

「Damocles」は、英国のRock＆Metal SinglesチャートでSleep Tokenの3番目のストレートNo.1になり、他のいくつかの英国のランキングでトップ40に侵入します。

#4

仕事 / ビジネス

フォードは、関税の不確実性をめぐる財務予測を引き出し、これらの企業に参加します

いくつかの企業は2025年に通年の見通しを引き出しており、多くの企業はトランプの関税によって悪化している引用市場の不確実性を挙げています。

#5

仕事 / ビジネス

容赦なく弾力性：トム・ティボドーからのリーダーシップの教訓

トム・ティボドーのリーダーシップの教訓は、バスケットボールだけに関連しているわけではありません。

#6

仕事 / ビジネス

Whoは2025 Forewellツアーを発表します

伝説的なブリティッシュロックの衣装であるフーは、今年の夏の終わりに北米の最終ツアーに着手することを発表しました。

#7

仕事 / ビジネス

テキサスレンジャーズの攻撃は悪いものであり、変更が加えられました

テキサスレンジャーズの攻撃は恐ろしいスタートを切っており、リーグで27位であるため、チームは船を正すことができることを期待して攻撃的なコーディネーターを解雇しました。

#8

政治 / 政治

生得権市民権事件における最高裁判所の議論における4つの質問

4月21日は終了しませんでした。しかし、連邦政府の雇用フリーズが終了する新しい日付があります。

#9

仕事 / ビジネス

ポンプ法は2になりますが、ほとんどの雇用主はまだコンプライアンスを守っていません

ほとんどの雇用主はまだ連邦ポンプ法を遵守していません。これにより、従業員にプライベートルームを提供し、職場で母乳を表現する時間を休むことが要求されています。

#10

仕事 / ビジネス

報道の自由とメディアに対する人工知能の影響

報道の自由は世界的に脅威にさらされ続けており、ジャーナリストは殺されたり負傷したり、他の人が検閲されたり、メディアが閉鎖されたりしています。

#11

政治 / 政治

ベラルーシで拘留されたアメリカ人は解放されます

Thunderboltsは批評家から100を超えるレビューを行っており、ほぼ半年で最高のレビューされたMCU映画であることが判明しました。

#12

仕事 / ビジネス

トランプは、NPRとPBSの連邦資金を削減するための行政命令に署名します

トランプの命令は、PBSとNPRがニュース報道で「偏見と党派」であると非難し、大統領が過去に育てた不満を繰り返した。

カテゴリー

#1

テクノロジー

#2

ガジェット