2025-01-18 に確認した最新投稿の一部です。
Article: 1
Title:
PICE: A Semantic-Driven Progressive Inference System for LLM Serving in Cloud-Edge Networks
Published:
2025-01-16
Authors:
Huiyou Zhan, Xuan Zhang, Haisheng Tan, Han Tian, Dongping Yong, Junyang Zhang, Xiang-Yang Li
Abstract:
大規模言語モデル(LLM)は、多数のドメインでインタラクティブなAIアプリケーションの新たな波を牽引する一方で、高い推論コストとクラウドへの大きな依存性に悩まされています。言語学における冗長性現象に動機付けられて、クラウドとエッジをめぐる漸進的な推論パラダイム、すなわち、まずクラウド上のLLMによる回答のスケッチ生成を行い、次にエッジ上の小さなモデル(SLM)による詳細を埋めるための並列拡張を行うというパラダイムを提案します。プログレッシブ推論は、スループットを向上させ、推論のレイテンシを短縮する潜在的な利点を提供しますが、SLMからの応答品質の低下、スケッチの簡潔さと包括性のトレードオフ、ネットワーク伝送とエッジ推論によるレイテンシの増加など、主要な実装上の課題に直面しています。本研究では、セマンティックレベルのクラウドエッジコラボレーションを備えたLLMサービングシステムであるPICEを提案し、実装し、動的推論タスクスケジューリング、アンサンブル学習、および並列エッジ推論を通じて推論のスループットと品質を向上させます。広範なテストベッド実験では、私たちのアプローチが$1.5-2\times$のスループット向上と最大43%の遅延削減を達成し、SOTAシステムと比較して品質を向上させる可能性があることが示されています。
Article: 2
Title:
Cooperative Decentralized Backdoor Attacks on Vertical Federated Learning
Published:
2025-01-16
Authors:
Seohyun Lee, Wenzhi Fang, Anindya Bijoy Das, Seyyedali Hosseinalipour, David J. Love, Christopher G. Brinton
Abstract:
フェデレーテッドラーニング(FL)は、攻撃者がトリガーをデータサンプルに埋め込むことでターゲット分類ラベルのモデルの動作を変更するバックドア攻撃に対して脆弱です。これらの攻撃は水平FLで大きな注目を集めていますが、デバイスがサンプルの異なる特徴を保持し、サーバーのみがラベルを保持する垂直FL(VFL)ではあまり理解されていません。この作業では、VFLに対する新しいバックドア攻撃を提案します。これは、(i)サーバーからの勾配情報に依存しない、(ii)サンプル選択とトリガー埋め込みのための複数の敵対者間の潜在的な共謀を考慮します。当社のラベル推論モデルは、変分オートエンコーダーをメトリック学習で強化し、敵対者がローカルでトレーニングできるようにします。敵対者のグラフトポロジに対するコンセンサスプロセスによって、どのデータポイントをポイズニングするかが決まります。さらに、敵対者間でトリガーを分割する方法を提案し、強度ベースの移植スキームにより、サーバーをトリガーに偏らせます。私たちの収束解析では、学習済みモデルの定常性ギャップで示されるVFLに対するバックドアの摂動の影響が明らかになり、これも経験的に検証されています。私たちは、私たちの攻撃を最近のバックドアVFLアプローチと比較した実験を行い、サーバー情報を使用していないにもかかわらず、同じメインタスクのパフォーマンスで大幅に高い成功率が得られることを発見しました。さらに、私たちの結果は、共謀が攻撃のパフォーマンスに与える影響を検証しています。
Article: 3
Title:
Published:
2025-01-16
Authors:
Tianyu Wang, Nianjun Zhou, Zhixiong Chen
Abstract:
サイバーセキュリティプログラムの多くの非伝統的な学生は、仲間、家族、教授からのアドバイスにアクセスできないことが多く、それが彼らの教育経験を妨げる可能性があります。さらに、これらの学生は、コンテンツの関連性、アドバイスの地域性、最小限の専門知識、タイミングなどの問題により、さまざまなLLM搭載AIアシスタントから十分な恩恵を受けられない場合があります。本稿では、これらの学生のニーズに合わせた知識、スキル、キャリア準備アドバイスに関する質問に答えることで、包括的なサポートを提供するように設計されたアプリケーションを紹介することで、これらの課題に対処します。私たちは、サイバーセキュリティを専攻する学生の多様なニーズと問題点に対処するために、学習ツールプラットフォームであるCyberMentorを開発しました。エージェントワークフローと生成的大規模言語モデル(LLM)を搭載したこのプラットフォームは、Retrieval-Augmented Generation(RAG)を活用して、正確で文脈に関連性の高い情報検索を実現し、アクセシビリティとパーソナライゼーションを実現します。サイバーセキュリティ教育やキャリア市場性のための知識要件への対応、分析やプログラミングの課題に対するスキル要件への取り組み、オンデマンドのリアルタイム学習サポートの提供において、その価値を実証しました。3つの使用シナリオを使用して、知識の習得とキャリアの準備を促進し、シームレスなスキルベースのガイダンスとサポートを提供するCyberMentorを紹介しました。また、LangChainのプロンプトベースの評価手法を採用して、プラットフォームの影響を評価し、有用性、正確性、完全性における強力なパフォーマンスを確認しました。これらの結果は、高等教育における公平性と持続可能性を向上させながら、学生が実践的なサイバーセキュリティスキルを開発するのを支援するシステムの能力を強調しています。さらに、CyberMentorのオープンソース設計により、他の分野への適応が可能になり、教育イノベーションが促進され、その潜在的な影響が広がります。
Article: 4
Title:
LLM-Based Routing in Mixture of Experts: A Novel Framework for Trading
Published:
2025-01-16
Authors:
Kuan-Ming Liu, Ming-Chih Lo
Abstract:
近年の深層学習と大規模言語モデル(LLM)の進歩により、株式投資領域における専門家混合(MoE)メカニズムの展開が促進されています。これらのモデルは有望な取引パフォーマンスを示していますが、多くの場合、モノモーダルであり、テキストデータなどの他のモダリティで利用可能な豊富な情報を無視しています。さらに、従来のニューラルネットワークベースのルーター選択メカニズムは、文脈と現実世界のニュアンスを考慮していないため、専門家の選択が最適ではありません。これらの制限に対処するために、MoEアーキテクチャ内のルーターとしてLLMを採用する新しいフレームワークであるLLMoEを提案します。具体的には、従来のニューラルネットワークベースのルーターをLLMに置き換え、その豊富な世界知識と推論能力を活用して、過去の価格データや株式ニュースから専門家を選抜します。このアプローチは、より効果的で解釈可能な選択メカニズムを提供します。マルチモーダル実世界のストックデータセットに関する私たちの実験は、LLMoEが最先端のMoEモデルや他のディープニューラルネットワークアプローチよりも優れていることを示しています。さらに、LLMoEの柔軟なアーキテクチャにより、さまざまなダウンストリームタスクに簡単に適応できます。
Article: 5
Title:
Embodied Scene Understanding for Vision Language Models via MetaVQA
Published:
2025-01-15
Authors:
Weizhen Wang, Chenda Duan, Zhenghao Peng, Yuxin Liu, Bolei Zhou
Abstract:
ビジョン言語モデル(VLM)は、さまざまなモビリティアプリケーション向けの具現化されたAIエージェントとして大きな可能性を示しています。しかし、空間的推論と逐次的な意思決定能力を評価するための標準化された閉ループのベンチマークは不足しています。これに対処するために、Visual Question Answering(VQA)とクローズドループシミュレーションを通じて、VLMの空間関係とシーンダイナミクスの理解を評価および強化するために設計された包括的なベンチマークであるMetaVQAを紹介します。MetaVQAは、nuScenesおよびWaymoデータセットからのSet-of-Markプロンプトとトップダウンビューのグラウンドトゥルースアノテーションを活用して、さまざまな現実世界のトラフィックシナリオに基づいて広範な質問と回答のペアを自動的に生成し、オブジェクト中心でコンテキストに富んだ指示を保証します。私たちの実験では、MetaVQAデータセットを使用してVLMを微調整すると、セーフティクリティカルなシミュレーションにおけるVLMの空間的推論と具体化されたシーンの理解が大幅に向上し、VQAの精度が向上するだけでなく、新しい安全意識の高い運転操作でも明らかになることが示されています。さらに、この学習は、シミュレーションから実世界の観測への強力な移行性を示しています。コードとデータは https://metadriverse.github.io/metavqa で公開されます。