AI学会、論文受理率の安定化が新たな課題に
最近の研究により、AI学会における論文の受理率を安定させる方針が、新たな問題を引き起こす可能性があることが指摘されました。悪意のある者がAIを利用して、見かけ上は信頼できるが質の低い論文を大量に提出し...
キーワードを組み合わせて、論文もニュースも横断検索できます。
「ai 論文」の検索結果: 172件
最近の研究により、AI学会における論文の受理率を安定させる方針が、新たな問題を引き起こす可能性があることが指摘されました。悪意のある者がAIを利用して、見かけ上は信頼できるが質の低い論文を大量に提出し...
記憶の形成は知能にとって重要ですが、深層ニューラルネットワークが生物の記憶と同様の痕跡を保持しているかは未解決の問題です。本研究では、神経科学の基準を用いて「AIエングラム」を特定するための幾何学的枠...
人工知能(AI)が医療や金融、エネルギー、防衛などの重要なインフラに急速に導入されていることは、変革的な利点をもたらす一方で、進化する規制やガバナンスの枠組みとの対立を引き起こしています。本研究では、...
研究チームが、光の「バレー自由度」と呼ばれる量子的性質を利用して情報の生成・操舵・読み取りを1チップで行える小型フォトニックデバイスを開発した。原子レベルの薄さの素材とナノスケール構造を組み合わせ、光...
AIエージェントは、科学研究のプロセスにおけるソフトウェア開発のボトルネックを自動化する可能性を秘めています。この研究では、一般的なコーディングエージェントがオプトジェネティクスデータの処理において、...
個人用AIエージェントは、さまざまなインターフェースで動作する必要がありますが、多くのシステムは特定のインターフェースに依存しています。そこで、Syllというオープンソースのマルチモーダルエージェント...
AIエージェントが単独のツールから共同で知識を共有する存在へと進化する中で、集団的な知識管理が重要な課題となっています。人間のプラットフォーム管理手法はそのままでは適用できず、エージェントの特性に合わ...
私たちは、複数のAIモデル間の議論を構造化するための「コンシリウムプロトコル」を提案します。このプロトコルは、モデル間の意見の不一致を単なるエラーではなく知識のシグナルとして扱います。言語モデルに異な...
メンタルヘルスの問題は世界中で多くの人々に影響を与えており、医療システムは増加するデータに圧倒されています。この研究では、AIを活用した新しい枠組みを提案し、患者のニーズに応じた臨床情報を処理できるシ...
新開発のAIツール「RAVEN」がNASAのTESS探査機データを解析し31の新惑星を含む100以上の惑星候補を確認。1日未満で公転する超短周期惑星や「海王星砂漠」に存在する希少天体など極端な惑星も多...
エージェントのベンチマークは、AIの能力を測る重要な指標となっていますが、意図しないタスクを達成せずにスコアを最大化する「報酬ハッキング」が問題視されています。この問題を解決するために、ベンチマーク設...
AIモデルは、実際の医療現場で信頼性を持って機能する必要がありますが、従来の訓練データではその複雑さを捉えきれません。医療におけるAIの評価には、タスクやデータセット、指標を組み合わせた基準が必要です...
自己対戦型のレッドチームは、AIの安全性を向上させるための手法で、同じモデルの異なるインスタンスが攻撃者と防御者の役割を果たします。この手法は、ナッシュ均衡に収束することで安全な応答を保証しますが、モ...
会話型AIには知識インターフェースとしての根本的な欠陥があり、媚びるようなチャットボットが合理的なエージェントでさえも誤った信念を引き起こすことがあります。この問題はAIモデル自体に起因するのではなく...
人間とAIのチームは、個々では達成できない性能を向上させるために重要な役割を果たします。最近の強力な生成AIモデルの登場により、さまざまな日常的な作業が人間とAIのチーム作業に変わりました。特に分類タ...
最近の研究では、自律的な科学発見ができるAI科学者の開発が進められています。しかし、これらのAI科学者は完全に自律的な発見には向いていないという意見があります。具体的には、問題の選定や学習データの偏り...
エージェント型AIのセキュリティに関する議論は、主にプロンプトインジェクションに焦点を当てていますが、複数のエージェントシステムでは新たな認可の問題が生じます。この問題は、非人間の主体がデータを取得し...
ChatGPTやClaude等の生成AIが爆発的に普及する中、AIシステムのエネルギー消費と炭素排出量の定量化が急務となっている。本論文はソフトウェアおよびAIに起因するエネルギー使用量・炭素排出量を...
大規模言語モデル(LLM)はコードの読解・生成能力が飛躍的に向上しているが、本論文ではさらに踏み込んだ視点を提唱している。コードは単なる「出力」ではなく、AIエージェントが思考・行動・環境との相互作用...
AIエージェントがデータ分析タスクを自律的に遂行する際、人手で用意したスキル(再利用可能な手順知識)を推論時に注入することで性能向上が見込める。しかし質の高いスキルを効率よく発見する方法には課題が残っ...
大型言語モデル(LLM)を基盤とする自律型AIエージェントの医療・臨床分野への導入が急速に進む中、本論文は49件の関連研究を対象に7次元の評価分類体系(タクソノミー)を提案した。7つの次元は「認知能力...
本研究(arXiv:2606.04010、2026年6月)は、数十億パラメータの脳ファンデーションモデル(BFM)が機能的結合行列からの単純な線形回帰より認知能力の予測精度が低い理由を徹底的に分析した...
2026年2月にarXiv(2602.06176)に投稿されたこの論文は、現代のLLMがどのような場面で推論に失敗するかを体系的に分類・分析したサーベイだ。推論を「身体的(embodied)推論」と「...
2026年1月にarXiv(2601.12538)に発表されたこの論文は、LLM(大規模言語モデル)を受動的な応答機械ではなく、計画を立て・行動し・継続的なインタラクションを通じて自己を進化させる自律...
arXivに2026年5月に投稿されたこの論文は、AIと機械学習がスマート製造(スマートファクトリー)をどのように再形成しているかを包括的に俯瞰する2026年版ロードマップだ。製造現場への効率性・適応...
本論文(arXiv:2603.14473、2026年3月)はAIが「どの研究が科学的に重要か」を判断する能力(科学的センス)を習得できるかを検証するため、コミュニティフィードバックからの強化学習(RL...
拡散型LLMを基盤に画像理解・生成・編集を一体化したマルチモーダルモデルLLaDA2.0-Uniを提案。専門特化モデルに匹敵する理解能力と交互画像テキスト生成・推論を融合し、統合型マルチモーダルAIの...
量子コンピューティングとAIの接点を包括的に整理した論文。量子技術がAI開発を加速する可能性と、逆にAIが量子センシングや誤り訂正を改善する応用について、現状の技術的課題と将来シナリオを詳細に論じてい...
気候変動研究の物理・社会・政策分野を横断する複雑な課題に対し、大規模基盤モデル(Foundation Model)型のAIが効果的な統合ツールになりうると示した論文。気候変動に関する意思決定支援へのA...
人工知能は環境の因果モデルを持つ必要があり、介入や反実仮想についての推論を支援します。本研究では、物体やその関係が変化する状況において、関係構造因果モデルを学ぶ方法を正式に検討しています。観察可能な問...
自律的にツールを使用し、持続的な記憶を保ち、多段階の計画を実行する大規模言語モデルが、政府サービスや医療、金融アドバイスなどの公共分野で増加しています。しかし、これらのシステムを構築するための枠組みが...
今後の無線ネットワークは、複雑な環境や動的なタスクに迅速に対応する必要があります。そのため、従来のルールに基づく管理から、人工知能を活用した資源管理へと移行することが求められています。特に、協調マルチ...
現在の大規模言語モデルに基づくエージェントの設計は、実行の流れや認知機能の観点から説明されていますが、どちらの視点だけでは異なるシステムを明確に区別することができません。私たちは、認知機能と実行トポロ...
現代の人工知能は、参加者が自由な形式で意見を表現する集団意思決定の可能性を広げています。意見をベクトル空間に埋め込むことで、施設配置問題や公正なクラスタリングに関する研究を活用できるようになります。し...
人工知能エージェントは低コストで複製できるため、認知労働の賃金がゼロになると考えられがちですが、これは誤解です。エージェントは労働ではなく、計算資本を効果的な認知労働に変換する生産技術です。この理解に...
人工知能とコンピュータビジョンを活用して、交通データの収集が進化しています。この研究では、既存のCCTVを利用し、歩行者の安全対策が車両の速度や安全性に与える影響を評価しました。ミネアポリスでの実施結...
この研究は、体育の授業を受ける学生が生成AIをどの程度利用しているか、またその利用が学習スタイルやAIに対する態度にどのように影響しているかを調査しました。1,084人の学生を対象に、学習スタイルや技...
AI技術の進展により、研究者や一般市民はその世界的な影響を意識する必要があります。特に軍事用AIの規制が急務となっており、武器製造業者や防衛請負業者がAI技術に投資し、AI企業と連携を強化しています。...
2026年2月、自然言語処理と医学知識グラフを組み合わせたAIシステム「DeepRare」がNature誌に発表され、希少疾患の診断能力において経験豊富な専門医を上回ることが示された。DeepRare...
スタンフォード大学などの研究チームが開発した基盤モデル「SleepFounder」は、米国・中国の35コホートから収集した80万時間超の多民族睡眠データを学習した、睡眠分野で世界最大規模の基盤AIモデ...
本研究はレーダーを内蔵したAI搭載卓上照明「Sleepal AIランプ」の睡眠ステージ判定精度を、ポリソムノグラフィー(PSG、睡眠の標準検査)と照合して検証したものである。1,022夜分の記録を用い...
複数のAIエージェントが連携して動作する「エージェントAI」システムにおいて、安全性・公平性はモデルの規模やアライメント訓練ではなく、エージェント同士の接続・相互作用の構造(相互作用トポロジー)によっ...
本研究は大規模言語モデル(LLM)の安全アライメントにおける「文脈依存バイアス」問題を分析し、安全な振る舞いが表面的な指示の形式ではなく発話者の意図に基づくべきであることを主張する。提案手法「Anch...
arXivに2026年5月に投稿されたこの白書(arXiv:2505.23860)は、量子コンピューティングとAIが互いにどう寄与し合うかという基礎的な問いに答えるための長期研究アジェンダを提示する。...
大腸がん手術後の縫合部漏れは、患者の回復や医療費に大きな影響を与える深刻な合併症です。現在の手術前評価は主に臨床的な判断に頼っており、主観的で誤りやすく、専門家の経験に大きく依存しています。この研究で...
ボストン大学のピエトロ・ビニらが、行動経済学と認知心理学の古典的バイアス実験をLLMに適用し、AIの意思決定に含まれる体系的なバイアスを網羅的に検証した研究(arXiv:2602.09362、2026...
量子コンピュータの技術的課題をAI・機械学習で解決する可能性を体系的に論じた総説。量子回路最適化・エラー訂正・材料探索など主要スケーリング問題に対しAIがどう貢献できるかを整理し、量子AIの融合研究が...
Nature誌が2026年に社会を変える7大技術として量子コンピュータ・mRNA治療・AIなどを選定。各分野の最新研究動向と社会実装の見通しを専門家がわかりやすく解説し、科学者・政策立案者が押さえるべ...
量子コンピュータ内部の複雑な接続構造(コネクトーム)の構築にAIを活用し、機械学習が量子ビット間の最適配線問題を解くことで将来の量子プロセッサ設計を大幅に加速できることを示した。量子コンピューティング...
AIエージェントを予測市場に自律参加させたところ、利益確定を急ぎ損失回避に陥る「処分効果」や最近情報に過剰反応する外挿的信念など行動ファイナンスで定義された人間的バイアスが明確に現れることを実証。プロ...
AIをメンタルヘルスケアに応用する際の評価課題を解決するため、臨床的健全性・社会的文脈・公平性を統合した学際的評価フレームワークを提案。既存の指標では見落とされがちな格差や倫理的リスクを体系的に捉える...
GPT-4.1などのLLMを不確実な逐次的意思決定タスクに投入したところ、損失回避・確率加重などカーネマンとトベルスキーの行動経済学的予測と一致するパターンが自発的に現れることを実証。AI意思決定にお...
LLMが損失回避・過大自信・アンカリングなどの古典的認知バイアスを示すことを行動経済学の枠組みで系統的に分析し、デバイアス手法を提案した研究。AIを意思決定支援に活用する際に無視できない偏りが存在する...
わずかな入力変化に対し大規模言語モデルが正しい答えを維持しながら全く異なる推論を生成することを実証し、Chain-of-Thought推論の信頼性に根本的な疑問を投げかけた研究。AIの説明可能性・信頼...
私たちのコンピュータ環境は、エージェント型AIシステムの普及と量子コンピューティングの進展によって変革されています。エージェント型AIの重要な課題は、所有者の方針に従い、他のエージェントとのやり取りに...
月面・軌道上など宇宙環境でのロボット学習を評価する初のオープンソースフレームワーク。手続き的生成と大規模並列シミュレーションを組み合わせ、多様な訓練分布を持つAIエージェントの開発・評価を可能にする研...
この研究は女子体操におけるスイッチリープからリングポジションへの技術的特徴を明らかにし、認識の一貫性に寄与する要因を探ることを目的としました。AIを用いた採点支援システムと認定された審判の判断を比較し...
良い説明とは何かという定義は、長い間議論されてきたテーマであり、最近では人工知能の出力に関連して再び注目されています。AIの導入には説明可能性が重要ですが、良い説明を作るためにはまずその定義を理解する...
最近、ある人工知能のスタートアップが、学術論文を分析して人間が書いたものかAIが生成したものかを判断するシステムを開発しました。この技術により、文章の出所を明確にすることが可能になります。
テクノロジー
タンパク質の構造予測モデルはどのようにタンパク質を折りたたむのかを探ります。ESMFold、OpenFold、Boltz-1の折りたたみ過程を調査した結果、共通の二段階の計算構造が見つかりました。最初...
ストレスは広く見られる問題であり、真剣なゲームがストレス解消に役立つことが認識されています。本研究では「レヴェリー」という生成型人工知能を活用したゲームを開発し、その効果を初めて評価しました。20人の...
大学での幸福感は学業の成功に重要ですが、多くの大学は満足度の監視やメンタルヘルスリスクの検出に効果的な方法を持っていません。この研究では、フィードバック収集の改善とメンタルヘルス検出の進展を通じてこれ...
遺伝子医療では専門家による遺伝子変異の評価が重要ですが、情報のアクセスが難しく、プロセスが遅れています。ClinVarやCIViCといったリソースはデータ共有を支援しますが、これらのリソースと互換性の...
Googleが開発したVision-Language-Action統合モデル「Gemini Robotics」を発表。複雑な物体操作タスクを滑らかかつ反応的に実行できる汎用ロボット制御の新時代を拓く成...
人間とAIの協力において、効率的で信頼性のあるポリシーを作成することが重要です。従来の手法は主に二つのアプローチに分かれていますが、どちらも解釈性や安全性に課題があります。新たに提案された「コラボレー...
2026年2月にScienceDailyで紹介された研究によると、就寝3時間前に夕食を終わらせ翌朝の食事まで絶食時間を約2時間延長する食習慣を数週間実践したグループは、カロリーや食事内容を変えていない...
2026年3月にScienceDailyが報じたこの研究は、海洋に流出したプラスチックのうち表層海水調査では観測されない「行方不明のプラスチック」の謎を解明した。プラスチックの多くは深海底に沈積するか...
2026年1月にScienceDailyが報じた研究(Journal of Hazardous Materials: Plastics掲載)は、マイクロプラスチックが海洋の「生物学的炭素ポンプ」──大...
一般的な身体を持つエージェントが複雑な現実の課題を解決することは、AIにおいて大きな挑戦です。マルチモーダル大規模言語モデルは、視覚と言語の知識を活用し、推論能力を向上させましたが、難しい状況では脆弱...
教育者は、学生の多様な興味や認知能力に合った魅力的な課題を作成することに苦労しています。従来の一律の課題は学生の関心を失わせ、不正行為を助長することがあります。そこで、Taklif.AIというプラット...
安全性ポリシーは、安全なAI出力と危険なAI出力を定義し、データのアノテーションやモデル開発を導きます。しかし、アノテーションの意見の相違は一般的で、運用の失敗やポリシーの曖昧さ、価値観の多様性などか...
医療AI開発において患者データの保護と学習精度のトレードオフが大きな課題となっている。本サーベイ論文では、医療深層学習への差分プライバシー(DP)適用に関する74本の先行研究(〜2025年3月)を体系...
大規模言語モデル(LLM)は広範な世界知識を持つが、特定のシミュレーション環境では正確な予測を苦手とする。本論文「WorldLLM」は、LLMが未知の環境を自ら能動探索しながら自然言語の仮説を生成・更...
栄養と精神健康の関係を神経科学的観点から包括的にレビューした論文がPubMedに掲載された。腸内細菌が神経伝達物質の合成・免疫調節・迷走神経刺激を介して脳機能に影響を与える「腸脳軸(gut-brain...
本論文(arXiv:2606.05870)は、アルツハイマー病・パーキンソン病といった神経変性疾患において、脳の各領域が特異的な脆弱性を示す仕組みを空間トランスクリプトミクスと生成モデルを組み合わせて...
本論文はAliら(2026年6月)が提案した「Sleep」パラダイムを紹介する。大規模言語モデルが短期記憶を長期の安定した知識へと定着させる仕組みを生物の睡眠中の記憶固定から着想し、モデルが自律的に自...
PubMed Central(PMC12007925)に掲載されたこの包括的レビューは、腸内細菌叢(マイクロバイオーム)と精神的健康の間にある双方向の関係性を詳細に論じた論文だ。腸脳軸(Gut-Bra...
2026年3月に公開されたarXiv論文(arXiv:2603.23271)は、複数の自律ロボットが一人の人間と自然にインタラクションするためのマルチモーダル認知エージェントアーキテクチャを提案した。...
LLMの強力な推論能力を視覚生成へ直接応用する新フレームワーク「UniReasoner」を提案したarXiv論文。テキスト理解の強みを画像生成の制御信号に変換する手法で、テキストと画像を統合した汎用生...
LLM(大規模言語モデル)を用いた評価者は、人間の労力を減らすために利用されますが、その信頼性は人間の評価者との一致に依存しています。本研究では、限られた注釈からLLM評価者の信頼性を推定する「メトリ...
時系列予測モデルは過去のパターンを活用することで精度が向上します。新たに提案された「セマンティクス強化型取得増強時系列予測フレームワーク(SERAF)」は、時系列の類似性だけでなく、自己生成されたテキ...
プロログMCPは、タスクに依存しないオープンソースのサーバーで、モデルコンテキストプロトコルを通じてプロログを状態を持つツールとして提供します。このツールは、エラー報告が整理されており、セッションごと...
人工知能エージェントがチームで協力する際、各エージェントは仲間をどれだけ信頼するかを判断しなければなりません。しかし、エージェント間の信頼を測る標準的な方法が不足しています。私たちは、コストのかかる検...
大規模なデータベースを効率的に検索するための新しい手法が提案されました。この手法は、従来の検索インターフェースの限界を克服し、より柔軟な検索やフィルタリングが可能です。しかし、データ量が増えると処理が...
具現化された人工知能を活用したロボティクスの展開は、ブロックチェーンの基盤に新たな機会をもたらします。信頼できるデータの出所や組織間のガバナンスが求められ、量子コンピュータの進展がこれらのデータ経済の...
洪水は非常に破壊的な自然災害であり、気候変動によりその頻度が増加しています。衛星を利用した洪水のマッピングは、災害対応において重要です。研究では、19の異なる洪水イベントを分析し、土地利用と洪水の種類...
この記事では、チャットボットが問題解決において本物の会話パートナーとして機能するかどうかについて考察しています。チャットボットの能力や限界を、さまざまな学問の視点から説明し、基本的なチャットボットの機...
放射線レポートからのデータ自動抽出は大規模な研究を可能にしますが、オランダの神経放射線レポートに対する大規模言語モデルの性能を評価した研究は少ないです。947件の脳のMRIレポートを分析し、医学生が3...
大規模言語モデルは数学や複雑な計画タスクにおいて優れた推論能力を示しています。CoCoNuTという新しい手法は、モデルが潜在空間で同時に複数の推論経路を探ることを可能にしますが、「概念ボトルネック」と...
音声と映像を扱う大規模言語モデルは、長い動画の理解において大きな可能性を秘めていますが、動画トークンの増加に伴う制約があります。そこで、OmniMemという新しいメモリ効率の良いストリーミングフレーム...
最近の多モーダル大規模言語モデルとエージェントワークフローの進展により、計算病理学において大きな可能性が示されています。しかし、信頼できるパッチレベルの推論は依然として難しい課題です。新たに提案された...
深層言語モデルが医療などの重要な分野で使用される中、その判断理由を理解することが信頼性や安全性を確保するために重要です。しかし、これらのモデルがブラックボックスとして機能するため、内部の状態にアクセス...
フィンランド・オウル大学などの研究チームが発表した大規模疫学研究によると、就寝時刻のバラつきが大きい人は規則的な睡眠スケジュールを維持している人に比べて、心臓発作などの重大な心血管イベントのリスクが約...
英エクセター大学を中心とした研究チームが2026年6月4日にEarth's Future誌で発表した研究は、海面上昇がマングローブ林の炭素貯蔵量に与える影響を森林全体の規模で初めて数理モデル化した。マ...
米ロチェスター大学の研究チームは2026年5月、ハダカデバネズミ(Naked Mole Rat)の長寿に深く関わる遺伝子「HAS2」をマウスに移植し、寿命を約4.4%延伸することに成功した。ハダカデバ...
イタリア技術研究所(IIT)とニューヨークのチャイルド・マインド研究所が主導した研究は、自閉症スペクトラム障害(ASD)を持つ人々のfMRIデータとマウスモデルの神経接続パターンを照合し、ASDには生...
複数の目標を持つ分子最適化は、相反する目標の下で広大な化学空間を探索する必要があります。従来の方法は単一の方針や固定されたスカラー化に依存しており、多様なトレードオフを表現する能力が限られていました。...
混合整数線形計画法(MILP)を用いた意思決定エンジンは、産業システムにおいて最適な計画を提案しますが、実際の運用では計算時の仮定が崩れることが多いです。コストや需要、資源の利用可能性のわずかな変動が...
消化器病学の国際学会DDW(Digestive Disease Week)2026で発表されたこの研究は、老齢マウスに「若い時期の自己腸内細菌」を糞便微生物移植(FMT)で戻すと、肝臓の老化が分子・機...
JWSTのMIRI装置で地球から約50光年にあるスーパーアース惑星LHS 3844bの表面熱放射を直接観測し、大気がなく水星に似た暗い岩石面であることを確認。大気ではなく惑星表面そのものを研究できた初...
若々しい記憶力を保つ80代「超高齢者(SuperAgers)」の研究で、積極的な社会生活と独自の脳生物学的特性が認知機能維持に寄与していることが判明。この知見が認知症予防の新たな介入戦略を生む手がかり...
英ニューカッスル大学の研究で10分間の激しい運動が血中の分子組成を急速に変化させ、大腸がん細胞の増殖抑制とDNA損傷修復の加速をもたらすことが判明。短時間運動の抗がん効果を分子レベルで初めて明らかにし...
米オレゴン健康科学大学の大規模分析で、7時間未満の睡眠が短命と強く関連し、その影響は食事不良や運動不足より顕著に大きいことが判明。十分な睡眠が長寿の最重要因子である可能性が科学的に示された。
知識ベースを行動の影響を反映させるための進展は、一般的に第二階層の論理を必要としますが、第一階層の特別なケースを特定することが重要なテーマです。特定の条件下で、第一階層の進展は多項式的に成長することが...
大規模言語モデルは多くのアプリケーションで推論の役割を果たしていますが、人間の意図に沿った解決策を生み出すのが難しいことがあります。この研究では、限られたユーザーとのやり取りから潜在的な好みを推測し、...
視覚と言語のモデルは、安全が重要な分野での利用が増えていますが、特定の状況で致命的な失敗をすることがあります。そこで、REVELIOというフレームワークを提案し、これらの失敗モードを体系的に明らかにし...
多エージェント強化学習は、現実の状況で外部からの指示に適応する必要がありますが、指示が行動を妨げると価値の不一致が生じることがあります。そこで、指示に従うためのマクロアクション価値修正手法(MAVIC...
ロチェスター大学の研究者がハダカデバネズミのHas2遺伝子をマウスに移植し、高分子ヒアルロン酸の産生増加により中央値で約4.4%の寿命延長を確認した。腫瘍抑制・炎症低減・腸内環境改善も同時に示され、ヒ...
大規模言語モデルは文脈内でどのように学習するのか、パターンマッチングなのか、潜在構造を推測するのかを探る研究です。実験では、二つの異なるグラフ構造を用いて、モデルが全体のトポロジーを追跡しているのか、...
ツールを活用した言語モデルは、小型の言語モデルに外部の実行可能なスキルを追加することができますが、ツールライブラリの拡張には課題があります。新しい再利用可能なサブルーチンが登場する中で、ライブラリは計...
スキルライブラリは、LLMエージェントがタスク間で手続き的な経験を再利用するための実用的な方法となっています。しかし、従来のシステムではスキルを単一の解像度で扱うため、関連性とコストの間に矛盾が生じて...
エピソードメモリを活用することで、LLMエージェントは経験を蓄積し、取り出すことが可能になりますが、従来の方法では各メモリを独立して扱っています。新たに提案するMemQは、メモリのQ値にTD($\la...
大規模言語モデルの訓練後の議論では、監視付き微調整を模倣、強化学習を発見と見なすことが多いが、この区別は不十分である。重要なのは、訓練手法が事前訓練モデルが既に生み出せる行動の確率を高めるのか、または...
人間の好みに合ったマルチモーダル生成モデルを作るには、複雑な判断基準を尊重した報酬信号が必要です。従来の手法では、微妙な好みが単純化されてしまい、脆弱性が生じることがあります。新たに提案する「自動評価...
科学的なチャートからのデータ自動抽出は、大規模な文献分析において重要な作業です。多様な大規模言語モデルは期待されていますが、標準化されていないチャートでの精度向上が課題です。本研究では、モデルの性能向...
視覚と言語モデル(VLM)が信頼できるとされるのは、注意マップが鮮明であるときだという直感があります。この研究では、注意構造と生成ダイナミクスを比較し、正確性との関連性を調査しました。結果として、注意...
強化学習における報酬の検証可能性を重視した新たな手法、探索重視の政策最適化(EXPO)が提案されました。この手法では、固定されたKLペナルティ係数が政策の探索を制限する問題や、均一な問題サンプリングが...
膝の変形性関節症は、関節の可動性を制限し、慢性的な痛みを引き起こす病気です。従来の評価方法は主観的でばらつきがあるため、正確で迅速な診断が求められています。本研究では、深層学習を活用した自動診断アプロ...
カメラ付きのモバイルデバイスやウェアラブル機器の普及により、食事の画像を手軽に撮影できるようになりました。これにより、リアルタイムでの食事監視において食べ物の認識が重要になっています。しかし、実際の食...
バイオメディカル研究エージェントを構築する際の複雑さを解消するために、BioMedArenaというオープンソースのツールキットが発表されました。このツールキットは、異なる基盤モデルを公平に評価できる環...
テキサス大学ダラス校(UT Dallas)脳健康センターが、「認知機能の低下は老化の不可避な結果ではない」という強力なエビデンスを2026年5月に「Nature Scientific Reports」...
無監視パートナーデザイン(UPD)は、事前に訓練されたパートナーを必要とせず、適応的にトレーニングパートナーを生成する手法です。このアプローチにより、パートナーの多様性が向上し、環境選択にも応用できる...
2026年1月20日にMedComm誌で発表されたスペインのPREDIMED-Plusコホート研究(644人の高齢者対象)は、16S rRNA配列解析による腸内細菌叢プロファイリングと食事スコア(ME...
Natureが2026年に掲載したこの論考は、大規模言語モデル(LLM)が政治学・社会学・経済学などの社会科学研究に与える構造的な影響を多角的に考察する。LLMを「模擬回答者」として用いた調査研究や、...
本研究(arXiv:2606.06188、2026年6月)は、LLM(大規模言語モデル)の隠れ状態ベクトルのℓ₂(L2)ノルムが、モデルの推論強度の内因的シグナルとして機能することを初めて実証した。推...
arXiv(2606.05002)に掲載されたYeらの研究(2026年6月3日投稿)は、複数の自律エージェントが競合・協調しながら意思決定するマルチエージェント強化学習(MARL)における課題を解決す...
arXiv(2606.04452)に掲載されたCaiらの研究(2026年6月3日投稿)は、タンパク質の点変異(アミノ酸1個が変化)が構造に与える影響を予測するために物理法則を拡散モデルに組み込んだ「D...
arXiv(2606.02465)に投稿されたこの研究は、現在の推論特化型大規模言語モデル(LLM)が英語以外の入力に対して推論精度が大幅に低下する「多言語推論ギャップ」の原因を分析した。ギャップの主...
本研究は、大規模言語モデル(LLM)が明示的な「思考ステップ」の自己回帰生成を行わずに、作業記憶(ワーキングメモリ)を活用した潜在推論を実現できることを示した。提案手法「RiM(Reasoning i...
GeroScience誌に掲載されたこのRCTは、筋力トレーニング(抵抗運動)が加速型の脳老化(BrainAGE)に与える影響を無作為化対照試験で評価した(DOI: 10.1007/s11357-02...
AdventHealth研究所のルー・ワン博士らが主導した12か月間の単盲検無作為化臨床試験(RCT)において、中等度〜強度の有酸素運動プログラムが脳の生物学的年齢を平均約1歳若返らせることが実証され...
自然言語処理・人間コンピュータインタラクション・責任あるAIの知見を統合した「人間中心型LLM(HCLLM)」の設計フレームワークを提案。ユーザーの多様なニーズや文脈に適応する次世代LLM設計の指針と...
GPT-4以降のフロンティアLLMにおける推論能力の向上のほとんどが隠れたシステムプロンプトや汎用CoT戦略への事前学習に起因しており、真の推論能力の改善は限定的であることを示した研究。AIベンチマー...