2024-12-24 に確認した最新投稿の一部です。
Article: 1
Title:
Observation Interference in Partially Observable Assistance Games
Published:
2024-12-23
Authors:
Scott Emmons, Caspar Oesterheld, Vincent Conitzer, Stuart Russell
Abstract:
私たちは、人間とAIアシスタントが部分的な観察を持つことを可能にする人間とAIの価値の一致問題のモデルである部分観測可能な支援ゲーム(POAG)を研究しています。AIの欺瞞に対する懸念に動機付けられて、私たちは部分的な可観測性によって可能になる質的に新しい現象を研究します:AIアシスタントは人間の観察に干渉するインセンティブを持つのでしょうか?まず、最適なアシスタントは、人間が最適にプレイしているときや、観察を妨げない同等のアクションが利用可能である場合でも、観察に干渉するアクションを取らなければならない場合があることを証明します。この結果は、完全な情報の価値は非負であるという単一エージェントの意思決定の古典的な定理と矛盾しているように見えますが、ポリシー全体で定義された干渉の概念を開発することで、この一見矛盾を解決します。これは、完全な情報の値が協調マルチエージェント設定に非負であるという古典的な結果の延長と見なすことができます。次に、人間が単に直接的な結果に基づいて決定を下している場合、アシスタントは人間の好みを照会する方法として観察に干渉する必要があるかもしれないことを証明します。この干渉のインセンティブは、人間が最適にプレイしている場合、または人間が自分の好みをアシスタントに伝えるためのコミュニケーションチャネルを導入すると、なくなることを示しています。第三に、人間がボルツマンの不合理モデルに従って行動すると、アシスタントが観測に干渉するインセンティブを生み出すことができることを示します。最後に、実験モデルを使用して、観測干渉アクションを取るかどうかを検討する際に、AIアシスタントが実際に直面するトレードオフを分析します。
Article: 2
Title:
Memory makes computation universal, remember?
Published:
2024-12-23
Authors:
Erik Garrison
Abstract:
近年のAI機能のブレークスルーは、ますます洗練されたアーキテクチャとアライメント技術によるものとされていますが、これらの進歩を説明するのは、メモリが計算を普遍的にするという、より単純な原理かもしれません。メモリは、再帰的な状態維持と信頼性の高い履歴アクセスという 2 つの基本的な機能を通じて、ユニバーサル計算を可能にします。これらの要件がユニバーサル計算に必要かつ十分であることを正式に証明します。この原則は、セル計算からニューラルネットワーク、言語モデルまで、さまざまなスケールで現れます。複雑な振る舞いは、高度な処理ユニットからではなく、時間を超えて状態を維持し、アクセスすることから生まれます。ニューラルネットワークのような並列システムが、基本単位の制限にもかかわらず、反復間で状態を維持することにより、ユニバーサル計算を実現する方法を示します。この理論的枠組みは、普遍的なパターンを明らかにしています:計算の進歩は、より複雑な基本操作からではなく、状態を維持しアクセスする強化された能力から一貫して生まれます。私たちの分析は、生物学的システム、人工知能、および人間の認知にわたる計算の理解を統合し、人類自身の計算能力が、口頭伝承、執筆、そして現在のコンピューティングを通じて記憶する技術的能力と歩調を合わせて進化したことを思い出させます。
Article: 3
Title:
Survey of Large Multimodal Model Datasets, Application Categories and Taxonomy
Published:
2024-12-23
Authors:
Priyaranjan Pattnayak, Hitesh Laxmichand Patel, Bhargava Kumar, Amit Agarwal, Ishan Banerjee, Srikant Panda, Tejaswini Kumar
Abstract:
人工知能の分野で急速に進化しているマルチモーダルラーニングは、テキスト、画像、オーディオ、ビデオなど、さまざまな種類のデータを統合および分析することにより、より多様で堅牢なシステムの構築を目指しています。人間が多くの感覚を通じて情報を吸収する能力に着想を得たこの手法は、テキストからビデオへの変換、視覚的な質問応答、画像キャプションなどのアプリケーションを可能にします。この概要では、マルチモーダル言語モデル (MLLM) をサポートするデータセットの最近の開発に焦点を当てています。大規模なマルチモーダルデータセットは、これらのモデルの徹底的なテストとトレーニングを可能にするため、不可欠です。この研究では、この分野への貢献に重点を置き、トレーニング、ドメイン固有のタスク、実世界のアプリケーションなど、さまざまなデータセットを調査しています。また、ベンチマークデータセットが、さまざまなシナリオでのモデルのパフォーマンス、スケーラビリティ、および適用性を評価するためにいかに重要であるかを強調しています。マルチモーダル学習は常に変化しているため、これらの障害を克服することで、AIの研究と応用は新たな高みに到達することができます。
Article: 4
Title:
Knowledge Editing through Chain-of-Thought
Published:
2024-12-23
Authors:
Changyue Wang, Weihang Su, Qingyao Ai, Yiqun Liu
Abstract:
大規模言語モデル(LLM)は、幅広い自然言語処理(NLP)タスクで優れた能力を発揮しています。しかし、進化する世界の知識に合わせてこれらのモデルを最新の状態に保つことは、頻繁な再トレーニングには高いコストがかかるため、依然として大きな課題となっています。この課題に対処するために、モデルを最初から再構築することなく、LLMを新しい情報で更新するナレッジ編集技術が登場しました。その中でも、インコンテクスト編集パラダイムは、モデルの元の機能を維持しながら新しい知識を統合する効果が際立っています。その可能性にもかかわらず、既存のインコンテクストナレッジ編集方法は、多くの場合、タスク固有であり、主に構造化されたナレッジトリプルを使用したマルチホップQAタスクに焦点を当てています。さらに、タスクの分解を数ショットのプロンプトに依存しているため、さまざまなタスク間での一般化が不安定になり、効果が低下します。 これらの制限に対応して、再トレーニングなしでさまざまなタスクにわたってLLMを柔軟かつ効率的に更新する新しい知識編集フレームワークであるEditCoTを提案します。EditCoT は、特定の入力に対して思考の連鎖 (CoT) を生成し、更新されたナレッジに基づいて CoT エディターを使用してこの CoT プロセスを反復的に調整することで機能します。私たちは、複数の言語とタスクをカバーするさまざまなベンチマークでEditCoTを評価します。この結果は、私たちのアプローチが、既存の方法と比較して優れた一般化、有効性、安定性を提供しながら、最先端のパフォーマンスを達成していることを示しており、知識更新の分野における大きな進歩を示しています。コードとデータは、https://github.com/bebr2/EditCoT で入手できます。
Article: 5
Title:
MRANet: A Modified Residual Attention Networks for Lung and Colon Cancer Classification
Published:
2024-12-23
Authors:
Diponkor Bala, S M Rakib Ul Karim, Rownak Ara Rasul
Abstract:
肺がんと結腸がんは、がんによる死亡率の主な原因です。効果的な治療には、早期かつ正確な診断が重要です。さまざまな画像検出でイメージング技術を利用することにより、学習モデルは病理組織学的画像からのがん分類の自動化に有望であることが示されています。これには、がんの種類を特定するための重要な要素である病理組織学的診断が含まれます。この研究は、病理組織学的画像から肺がんと結腸がんを特定するための高効率の深層学習モデルの作成に焦点を当てています。私たちは、修正された残留注意ネットワークアーキテクチャに基づく新しいアプローチを提案しました。このモデルは、いくつかのクラスにわたる25,000枚の高解像度病理組織学的画像のデータセットでトレーニングされました。私たちの提案モデルは、2つ、3つ、5つのクラスでそれぞれ99.30%、96.63%、97.56%という並外れた精度を達成しました。これらは、他の最先端のアーキテクチャを凌駕しています。この研究は、肺がんと結腸がんの分類のための高精度な深層学習モデルを示しています。私たちが提案するモデルの優れた性能は、医療AIアプリケーションの重要なニーズに対応します。