2025-01-14 Updates

2025-01-14 に確認した最新投稿の一部です。

Article: 1

Title:

Data fusion of complementary data sources using Machine Learning enables higher accuracy Solar Resource Maps

Published:

2025-01-08

Authors:

J Rabault, ML Sætra, A Dobler, S Eastwood, E Berge

Abstract:

本研究では、数値モデル(ERA5、NORA3)と衛星観測(CMSAF-SARAH3)の両方から得られたいくつかのプロダクトから、太陽放射照度と大気条件のデータを収集します。次に、これらの製品を予測変数として使用し、ノルウェー上空の直接in-situ全球水平放射照度(GHI)測定をグラウンドトゥルースとして使用して、単純な教師あり機械学習(ML)データ融合モデルをトレーニングします。これらの製品を組み合わせることで、トレーニング済みのMLモデルを適用することで、個別に取得した製品から得られるGHI推定値よりも大幅に正確なGHI推定値が得られることを示しています。学習したモデルを使用して、ノルウェーのGHIの30年間のML補正マップを生成し、新しいオープンデータ製品としてリリースします。当社のMLベースのデータ融合方法論は、適切なトレーニングと入力データの選択後、地球上のあらゆる地理的領域に適用することができます。

Article: 2

Title:

A Practical Cross-Layer Approach for ML-Driven Storage Placement in Warehouse-Scale Computers

Published:

2025-01-10

Authors:

Chenxi Yang, Yan Li, Martin Maas, Mustafa Uysal, Ubaid Ullah Hafeez, Arif Merchant, Richard McDougall

Abstract:

ストレージ システムは、ウェアハウス規模のコンピューターの総所有コスト (TCO) の大部分を占めているため、システム全体の効率に大きな影響を与えます。データ配置など、ストレージシステムの効率に関する主要な問題を解決するための機械学習(ML)ベースの手法は、大きな期待が寄せられています。ただし、このような方法の実用的な展開はほとんど知られていません。この問題を Google の実際のハイパースケール データセンターのデプロイのコンテキストで調査した結果、この実用的な採用の欠如の原因と思われるいくつかの課題が特定されました。具体的には、以前の研究では、ストレージレイヤー内に完全に存在するモノリシックモデルを想定しており、実際のデータセンターのデプロイでは非現実的な仮定です。MLをストレージシステムから移動し、その上で実行されているアプリケーションで実行し、これらのアプリケーションレベルのモデルからの予測を消費するストレージレイヤーのスケジューリングアルゴリズムと共同設計するクロスレイヤーアプローチを提案します。このアプローチは、小さくて解釈可能なモデルと、さまざまなオンライン環境に適応する共同設計されたヒューリスティックを組み合わせたものです。このアプローチの概念実証を、Googleの本番環境の分散計算フレームワークで構築します。テストデプロイメントの評価と、プロダクショントレースを使用した大規模なシミュレーションスタディでは、最先端のベースラインと比較して、TCOの節約が最大3.47倍改善されていることが示されています。この作業は、倉庫規模のコンピューターでのより実用的な ML 主導のストレージ配置に向けた重要な一歩を表していると考えています。

Article: 3

Title:

Benchmarking Different Application Types across Heterogeneous Cloud Compute Services

Published:

2025-01-10

Authors:

Nivedhitha Duggi, Masoud Rafiei, Mohsen Amini Salehi

Abstract:

Infrastructure as a Service(IaaS)クラウドは、最新のスマートテクノロジーの運用の主要な基盤インフラストラクチャになっています。IaaSクラウドは、コストの削減、速度と効率の向上、信頼性とスケーラビリティの向上など、さまざまな理由で有用であることが証明されています。このようなクラウドが提供するコンピューティング サービスは異種混在であり、さまざまなワークロードを効率的に実行するのに適した、アーキテクチャ的に多様なマシンのセットを提供します。しかし、異なるクラウドにまたがるこれらの異種コンピューティングサーバー上での一般的なアプリケーションタイプのパフォーマンスを明らかにする研究はほとんどありませんでした。このような調査は、組織が(コスト、レイテンシ、スループット、消費エネルギー、二酸化炭素排出量などの点で)クラウドコンピューティングサービスを最適に採用するのに役立ちます。HPCCラボでは、さまざまな研究プロジェクトにおけるこのようなベンチマークに焦点を当ててきましたが、このレポートでは、これらのベンチマークを1つのドキュメントにまとめ、コミュニティの他の研究者がそれらを使用するのを支援します。具体的には、産業用アプリケーション向けのディープニューラルネットワーク(DNN)推論、支援技術アプリケーション向けの機械学習(ML)推論、マルチメディアユースケース向けのビデオトランスコーディングという3つの異なるドメインの3つのアプリケーションタイプのベンチマークデータセットを紹介します。

Article: 4

Title:

rmlnomogram: An R package to construct an explainable nomogram for any machine learning algorithms

Published:

2025-01-10

Authors:

Herdiantri Sufriyana, Emily Chia-Yu Su

Abstract:

背景: 現在のノモグラムは、回帰アルゴリズムに対してのみ作成できます。機械学習(ML)アルゴリズムにノモグラムを提供することで、臨床現場でのモデルの展開を加速したり、モデルの可用性を向上させたりできる可能性があります。私たちは、任意のMLアルゴリズムのモデル説明可能性を備えたノモグラムを構築するためのRパッケージとWebアプリケーションを開発しました。方法:ML予測モデルをノモグラムに変換する関数を定式化し、(1)予測変数の値のすべての可能な組み合わせ。(2)モデルの対応する出力。(3)各予測変数に対応する説明可能性値(オプション)。Webアプリケーションも作成されました。結果: R パッケージでは、確率なしのカテゴリ予測変数とバイナリ結果 (1)、確率 (2) または連続結果 (3) のカテゴリ予測変数とバイナリ結果、単一の数値予測変数と確率 (4) または連続結果 (5) のバイナリ結果に対して、5 種類のノモグラムを作成できます。それぞれ、最初と残りのタイプは、最大 15 個と 5 個の予測変数を最大 3,200 の組み合わせで最適に許可しました。Webアプリケーションには、このような制限があります。説明可能性の値は、タイプ 2 から 5 で可能でした。結論: 私たちの R パッケージと Web アプリケーションは、かなりの数の予測子を使用して、任意の ML アルゴリズムのモデル説明可能性を備えたノモグラムを構築できます。

Article: 5

Title:

Error Floor of Spinal Codes under ML Decoding

Published:

2025-01-09

Authors:

Aimin Li, Shaohua Wu, Xiaomeng Chen, Sumei Sun

Abstract:

Spinal codesは、Raptorコード、Striderコード、およびレートレス低密度パリティチェック(LDPC)コードと比較して優れたレートパフォーマンスを達成することが示されている、容量達成レートレスコードの新しいファミリーです。この対応は、有限ブロック長領域における脊髄符号の性能制限に対処し、高い信号対雑音比(SNR)でのエラーフロア現象を明らかにします。誤差下限を近似するための解析的表現を開発し、誤差下限が始まるSNRの閾値を考案します。{Additive White Gaussian Noise (AWGN)、rayleigh、nakagami-m フェージング チャネル} にわたる数値結果により、解析の精度が検証されています。また、解析結果と数値結果から、シンボルのパス数を増やすとエラーの下限は下がるが、SNRの閾値には影響しないことが示され、性能目標、作業中のSNR領域、およびコード設計に関する洞察が得られます。

Licensed under CC BY-NC-SA 4.0
Hugo で構築されています。
テーマ StackJimmy によって設計されています。