2025-01-02 に確認した最新投稿の一部です。
Article: 1
Title:
Identifying Split Vacancies with Foundation Models and Electrostatics
Published:
2024-12-26
Authors:
Seán R. Kavanagh
Abstract:
点欠陥は固体化合物に遍在し、導電性、触媒活性、キャリア再結合などの多くの機能特性を決定します。過去10年間で、準安定欠損形状の普及率と、関連する特性に対するその重要性がますます認識されるようになりました。この特に顕著な例は、孤立した原子空孔が2つの空孔と間質($V_X \rightarrow [V_X + X_i + V_X]$)からなる化学量論保存複合体に変化する分割空孔であり、欠陥エネルギーの劇的な低下と行動の変化を伴うことがあります。このような種は、この再構成の「非局所的」な性質のために、計算から同定するのが特に困難です。ここでは、幾何学的解析、静電エネルギー、および基礎機械学習(ML)モデルを組み合わせた段階的スクリーニングを通じて、固体化合物中のそのような種を効率的に同定するためのアプローチを紹介します。このアプローチにより、Materials Projectデータベース内のすべての化合物(ICSDのすべてのエントリと数千の予測された準安定材料を含む)をスクリーニングし、これまで知られていなかった数千の分割空孔構成を特定できます。この研究は、欠陥調査における機械学習の可能性の潜在的な有用性と、重要な注意点と、安定した欠陥形状を正しく特定するためのグローバル最適化アプローチの重要性の両方を強調しています。
Article: 2
Title:
Artificial Intelligence for Quantum Error Correction: A Comprehensive Review
Published:
2024-12-29
Authors:
Zihao Wang, Hao Tang
Abstract:
量子エラー訂正(QEC)は、デコヒーレンスや量子ノイズが発生しやすい量子システムのエラーを検出して修正するプロセスです。QECは、安定して高精度な量子コンピューティングシステムを開発するために重要であるため、最適なQEC戦略を開発するためにいくつかの研究努力がなされてきました。最近、Googleのブレークスルーは、既存のエラー訂正方法の精度を向上させる大きな可能性を示しています。この調査では、既存のノイズ中規模量子(NISQ)システムのQECスキームを強化するための人工知能(AI)ツールの使用の進歩を包括的にレビューします。具体的には、機械学習(ML)戦略に焦点を当て、教師なし、教師あり、半教師あり、強化学習の方法にまたがっています。これらの手法は、従来のアプローチと比較して、QECパイプラインにおいて最近優れた効率と精度を示していることは証拠から明らかです。私たちのレビューは150以上の関連研究をカバーしており、この分野の進歩と展望の包括的な概要を提供しています。レビューされた文献は、採用されたAI戦略とエラー訂正性能の改善に基づいて整理されました。また、量子エラーデータセットの制限によるデータのスパース性や、量子システムの量子ビット(qubit)の数が非常に急速に増加し続けることによるスケーラビリティの問題など、今後の課題についても説明します。本稿では、既存の研究の要約と、AI技術をQEC戦略に深く統合することを目的とした将来の研究の方向性をまとめて、論文を締めくくります。
Article: 3
Title:
Published:
2024-12-30
Authors:
Md Mahadi Hasan Nahid, Sadid Bin Hasan
Abstract:
機械学習(ML)モデルは、機密情報や個人情報を含む可能性のあるトレーニングデータに依存することが多く、プライバシーに関する大きな懸念が生じます。一般データ保護規則(GDPR)やカリフォルニア州消費者プライバシー法(CCPA)などの法的枠組みにより、データの有用性を維持しながらプライバシーを保護する戦略の開発が必要とされています。この論文では、大規模言語モデル(LLM)が差分プライバシー(DP)メカニズムと統合された合成データセットを生成する能力を調査し、それによって機密情報を直接公開することなくデータ駆動型の研究とモデルトレーニングを可能にします。私たちのアプローチでは、ラプラス分布やガウス分布などのDPベースのノイズ注入法をデータ生成プロセスに組み込んでいます。次に、これらのDP拡張合成データセットで訓練されたMLモデルのパフォーマンスを元のデータで訓練されたモデルと比較することにより、これらのDP拡張合成データセットの有用性を評価します。プライバシーの保証を実証するために、生成された合成データのメンバーシップ推論攻撃および関連する脅威に対する回復力を評価します。実験結果は、LLM駆動型の合成データ生成にDPを統合することで、プライバシー保護とデータユーティリティの実行可能なバランスが得られることを示しています。この調査では、LLM のプライバシー保護機能に関する基本的な方法論と洞察を提供し、コンプライアンスに準拠した効果的な ML の研究とアプリケーションへの道を開きます。
Article: 4
Title:
Enhancing Transfer Learning for Medical Image Classification with SMOTE: A Comparative Study
Published:
2024-12-28
Authors:
Md. Zehan Alam, Tonmoy Roy, H. M. Nahid Kawsar, Iffat Rimi
Abstract:
この論文では、脳腫瘍クラスと糖尿病性網膜症の病期検出に焦点を当てて、医用画像における多盲検画像分類のための転移学習(TL)の応用を検討し、強化します。ImageNetデータセットで事前学習済みモデルを使用したTLの有効性は、ドメイン固有の課題によって異なります。Brain Tumor MRI と APTOS 2019 の 2 つのデータセットで、MobileNet、Xception、InceptionV3、ResNet50、DenseNet201 の 5 つの事前学習済みモデルを評価します。私たちの結果は、TLモデルが脳腫瘍の分類に優れており、ほぼ最適な指標を達成していることを示しています。ただし、糖尿病性網膜症の検出におけるパフォーマンスは、クラスの不均衡によって妨げられます。これを軽減するために、SMOTE(Synthetic Minority Over-sampling Technique)をTLおよび従来の機械学習(ML)手法と統合することで、精度が1.97%、再現率(感度)が5.43%、特異度が0.72%向上しました。これらの知見は、TLをリサンプリング技術およびML手法と組み合わせてデータの不均衡に対処し、分類性能を向上させる必要性を強調しており、これにより、より正確で信頼性の高い医用画像解析への道筋を提供し、最小限の計算能力で患者の転帰を改善することができます。
Article: 5
Title:
Published:
2024-12-26
Authors:
Adamantios Ntakaris, Gbenga Ibikunle
Abstract:
高頻度取引(HFT)は現代の金融市場を変革し、信頼性の高い短期価格予測モデルが不可欠になっています。本研究では、2022年9月から11月までの期間にS&P 500指数の米国株式100銘柄に焦点を当て、NASDAQのレベル1の指値注文帳(LOB)データを用いたミッドプライス予測の斬新なアプローチを紹介します。平均減少不純物(MDI)と勾配降下法(GD)に基づく自動特徴重要度技術を活用した放射基底関数ニューラルネットワーク(RBFNN)に関する以前の研究を拡張し、バッチフリーで即時の中間価格予測のために設計された強化学習(RL)ベースのエージェントである適応学習ポリシーエンジン(ALPE)を導入します。ALPE は、探索と活用のバランスを動的に取るために適応型イプシロン減衰を組み込んでおり、予測パフォーマンスにおいてさまざまな高効率の機械学習 (ML) モデルやディープラーニング (DL) モデルを凌駕しています。