2025-01-13 Updates

2025-01-13 に確認した最新投稿の一部です。

Article: 1

Title:

ThriftLLM: On Cost-Effective Selection of Large Language Models for Classification Queries

Published:

2025-01-09

Authors:

Keke Huang, Yimin Shi, Dujian Ding, Yifei Li, Yang Fei, Laks Lakshmanan, Xiaokui Xiao

Abstract:

大規模言語モデル(LLM)は、自然言語コンテンツの理解と生成において顕著な能力を発揮しており、近年、産業界と学界の両方で広く人気を集めています。APIを介してさまざまなタスクにLLMを提供するサービスが増えています。異なるLLMは、クエリの異なるドメイン(テキスト分類クエリなど)の専門知識を示します。一方、さまざまな規模、複雑さ、およびパフォーマンスのLLMは、さまざまな価格で提供されます。この観察結果を受けて、費用対効果に重点を置いたLLMアンサンブル戦略を研究する研究者が増えており、パフォーマンスを向上させながら全体的な使用コストを削減することを目指しています。しかし、私たちの知る限りでは、既存の作品はどれも問題、つまり、アンサンブルのパフォーマンスを最大化するためにコスト予算の対象となるLLMアンサンブルをどのように見つけるかという問題に対処していません。 この論文では、私たちが正式に定義する予測精度の概念を使用して、モデルのアンサンブル(LLM)のパフォーマンスを形式化します。私たちは、アンサンブルのパフォーマンスを向上させるために、複数のLLMからの応答を集約するアプローチを開発します。これに基づいて、アンサンブル選択問題を定式化し、全体的な予測精度が最大になるようにコストバジェットの対象となるLLMのセットを選択する問題として定式化します。予測精度関数の非減少および非サブモジュラ特性を理論的に確立し、最適アンサンブル選択問題がNP困難である可能性が高いという証拠を提供します。続いて、動的計画法を適用し、ThriftLLMと呼ばれるアルゴリズムを提案します。私たちは、ThriftLLMがほぼ最適な近似保証を達成することを証明します。さらに、広範な実験的評価において、複数の実世界のデータセットに対して3つの競合他社に対して最先端のクエリパフォーマンスを達成し、私たちの方法の有効性と優位性を強く支持しています。

Article: 2

Title:

Partitioning Strategies for Parallel Computation of Flexible Skylines

Published:

2025-01-07

Authors:

Emilio De Lorenzis, Davide Martinenghi

Abstract:

従来のスカイライン クエリでは、大規模なデータセット内の興味深いデータを特定しますが、柔軟なスカイラインでは、属性の重みの制約を通じて選好が導入され、返されるデータがさらに減少します。ただし、大規模なデータセットでは、これらのクエリの計算に時間がかかる場合があります。本研究では、並列位相と逐次位相からなる並列計算方式を提案・実装し、柔軟なスカイラインに適用します。並列処理の前にデータセットのサイズを縮小するための初期フィルタリングフェーズの追加効果と、シーケンシャル部分(最も時間のかかる部分)を完全に排除する効果を評価します。すべての実験は、PySpark フレームワークで、さまざまなサイズとディメンションのさまざまなデータセットに対して実行されます。

Article: 3

Title:

Partition Constraints for Conjunctive Queries: Bounds and Worst-Case Optimal Joins

Published:

2025-01-07

Authors:

Kyle Deeds, Timo Camillo Merkle

Abstract:

過去10年間で、さまざまな研究が関係に関する統計を使用して、結合クエリ実行の理論と実践の両方を改善してきました。リレーションサイズを利用したAGMバウンドから始まり、後の作品には機能依存性や次数制約などの統計が組み込まれました。新しい統計が出るたびに、2つの線に沿った作業が促されました。結合クエリ出力と最悪の場合の最適結合アルゴリズムのサイズを制限します。この作業では、\emph{partition constraint} と呼ばれる新しい統計を導入することで、この流れを継続します。この統計は、リレーションをサブリレーションに分割し、それぞれがより厳しい次数制約を持つようにすることで、リレーション内の潜在的な構造を捉えます。このアプローチにより、既存のカーディナリティ境界を絞り込み、既存のワーストケースの最適結合アルゴリズムを改善できることを示します。

Article: 4

Title:

TransientVerse: A Comprehensive Real-Time Alert and Multi-Wavelength Analysis System for Transient Astronomical Events

Published:

2025-01-08

Authors:

Jian-Hua Fang, Di Li, Pei Wang, Hua-Xi Chen, Han Wang, Deng-Ke Zhou, Qin-Ping Bao, Hai-Yan Li, Jing-Jing Hu, Jin-Tao Xie, Xiao-Dong Ge, Yi Feng, Dong-Hui Quan, Zhi-Xuan Kang, Xue-Rong Guo, Chen-Wu Jin, Zhi-Lin Wang, Jia-Ying Xu, Chen-Chen Miao, Ru-Shuang Zhao, Chen-Hui Niu

Abstract:

一時的な天体物理学的事象は、短い時間スケール、高エネルギー、多波長放射を特徴とし、しばしば激しいエネルギー放出を伴います。これらの現象は、現代の天文学研究の主要な焦点です。その根底にある物理的メカニズムを明らかにするためには、近時間、多波長、マルチメッセンジャーによる追跡観測が不可欠です。しかし、現在のトランジェントアラートシステムは、メッセージの断片化、一貫性のない形式、遡及的分析の難しさなど、複数の課題に直面しており、これらすべてが観測のトリガーの効率を妨げています。このホワイトペーパーでは、一時的なアラートを統合して配布するための革新的なリアルタイムデータベースプラットフォームである\textbf{TransientVerse}を紹介します。このプラットフォームは、自動化されたパイプラインを使用して、複数のソース(ATel、VOEvent、GCNなど)からのリアルタイムアラートを統合します。オープンソースの大規模言語モデルを使用して、非構造化テキストデータを一時的なアラート用のデュアルフォーマットデータベースに構造化します。TransientVerseは、効率的なイベント追跡と分析のためのレトロスペクティブ検索、データの視覚化、文献レビュー、およびカスタマイズされたサブスクリプションを提供します。さらに、高速電波バースト(FRB)の場合、このプラットフォームは、異なる時間間隔での繰り返しバーストレートに関するリアルタイムの統計を提供し、高周波バースト源について天文学者に警告することで、迅速なフォローアップ観測を可能にし、限られた観測ウィンドウの使用を最適化します。TransientVerseは、トランジェントイベントをリアルタイムで取得する効率を向上させ、同時観測の技術的障壁を下げ、多波長、マルチメッセンジャーの時間領域天文学および天体物理学研究に堅牢な技術サポートを提供します。

Article: 5

Title:

Connection between planetary He I $λ$10830 Å absorption and extreme-ultraviolet emission of planet-host stars

Published:

2025-01-07

Authors:

J. Sanz-Forcada, M. López-Puertas, M. Lampón, S. Czesla, L. Nortmann, J. A. Caballero, M. R. Zapatero Osorio, P. J. Amado, F. Murgas, J. Orell-Miquel, E. Pallé, A. Quirrenbach, A. Reiners, I. Ribas, A. Sánchez-López, E. Solano

Abstract:

文脈。太陽系外惑星の大気中のHe I 10830 Aトリプレットの検出は、大気脱出を含む惑星の特性を調査するための新しい窓を開きました。ライマンαとは異なり、トリプレットはISM吸収の影響をあまり受けません。十分なXUV恒星照射は、惑星大気中の光電離および後部組換えプロセスを介してHe Iトリプレットの形成を引き起こす可能性がある。これまでのところ、恒星XUVと惑星のHe Iの強さとの間の弱い傾向のみが観測されています。目的。私たちは、この系外惑星大気中でのHe I吸収の生成メカニズムを、惑星系のサンプルを調べることで確認することを目指しています。メソッド。惑星のHe I線EWの均質な測定値を取得し、恒星のXUV電離照射を一貫して計算しました。私たちはまず、惑星ホスト星の新しいコロナモデルを導き出しました。X系外惑星データベースからの更新データ、M型星(AU MicやProxima Cenを含む)のアーカイブX線スペクトル、およびCARMENESプロジェクトで得られた新しいXMM-NewtonX線データを使用しました。これらのデータは、一般に公開されているHST、FUSE、およびEUVEスペクトルを使用して、より長い波長で補完されました。合計75個の星を慎重に分析して、X線とEUVの放射の間の新しいキャリブレーションを取得します。業績。恒星X線放射(5-100 A)とEUV_H(100-920 A)またはEUV_He(100-504 A)放射との間には2つの異なる関係があり、後期型恒星コロナからの放射をスケーリングする。報告された惑星He I 10830 Aの研究を含む合計48のシステムは、惑星のHe Iの特徴と、恒星と惑星の半径によって補正された惑星が受け取る電離XUV_Heと、惑星の重力ポテンシャルとの間に強固な関係を示しています。一部の外れ値は、異なる大気組成または惑星のガス状大気の欠如によって説明できます。この関係は、太陽系外惑星の大気中でのHe I 10830 Aの吸収を予測するために利用できる。

Licensed under CC BY-NC-SA 4.0
Hugo で構築されています。
テーマ StackJimmy によって設計されています。