2025-01-10 に確認した最新投稿の一部です。
Article: 1
Title:
An innovative data collection method to eliminate the preprocessing phase in web usage mining
Published:
2025-01-08
Authors:
Ozkan Canay, Umit Kocabicak
Abstract:
Web 使用状況マイニング (WUM) の基になるデータ ソースは、一般にサーバー ログであると考えられています。ただし、アクセスログファイルは、クライアントに関する非常に限られたデータを保証します。この乱雑なデータからセッションを特定するにはかなりの労力が必要であり、この目的のために実行される操作は必ずしも優れた結果をもたらすとは限りません。また、このデータはWeb分析に効率的に使用することはできません。この研究では、ユーザー追跡、セッション管理、およびWeb使用データの収集のための革新的な方法を提案します。この方法は主に、収集したデータをWeb分析抽出にWeb使用マイニングのデータソースとして使用するための新しいアプローチに基づいています。アプリケーションベースのAPIは、ログデータを取得および処理するための従来のクライアント側の方法とは異なる戦略で開発されました。ログ・データは、この手法をエンタープライズWebアプリケーションに統合することにより、正常に収集されています。その結果、この方法で収集および保存された均質な構造化データは、Web サーバーのログよりも参照、フィルタリング、および処理に便利であることがわかります。リレーショナルデータベースに保存されたこのデータは、高性能なWeb使用マイニングアクティビティ、リアルタイムのWeb分析、または機能的な推奨システムのための信頼性の高いデータソースとして簡単に使用できます。
Article: 2
Title:
Published:
2025-01-07
Authors:
Mickaël Martin Nevot, Sébastien Nedjar, Lotfi Lakhal
Abstract:
データ ウェアハウス内の OLAP クエリに効率的に応答するために、データ キューブを事前に計算する多くのアプローチが提案されています。しかし、考えられるすべての結果を統合した解決策を提案している人はほとんどおらず、この考え方がこれらの応答に階層的な次元を統合することにつながります。このニーズを満たすために、このホワイトペーパーでは、フレームワークの完全な再定義と、階層的次元のプリズムを通じた従来のデータベース分析の形式的な定義を提案します。階層データキューブの格子を特徴付けた後、階層データキューブと、その最も簡潔な縮小表現である閉じた階層データキューブを紹介します。コンパクトなレプリケーションを提供し、強く相関したデータの冗長性を排除することでストレージスペースを最適化します。このようなデータは、データウェアハウス、特に私たちの研究や実験の分野であるビデオゲームでは、階層的な次元属性が広く表現されています。
Article: 3
Title:
Published:
2025-01-08
Authors:
Khalil Khan, Farhan Ullah, Ikram Syed, Irfan Ullah
Abstract:
先天性心疾患は、最も一般的な胎児の異常と先天性欠損症の1つです。その発症に影響を与える多数のリスク要因を特定しているにもかかわらず、多様な集団におけるその発生と管理についての包括的な理解は依然として限られています。近年の機械学習の進歩により、患者データを活用して先天性心疾患の早期検出が可能になる可能性が実証されています。過去7年間、研究者たちはこの課題に対処するために、さまざまなデータ駆動型およびアルゴリズムによるソリューションを提案してきました。この論文は、機械学習を使用した先天性心疾患の認識の系統的レビューを提示し、2018年から2024年の間に発表された主要なジャーナルからの432の参考文献のメタアナリシスを実施しました。74の学術研究の詳細な調査により、データベース、アルゴリズム、アプリケーション、ソリューションなどの主要な要素が浮き彫りになりました。さらに、この調査では、機械学習の専門家が先天性心疾患の認識に使用する報告されたデータセットの概要を示しています。この研究では、体系的な文献レビュー手法を使用して、先天性心疾患に機械学習を適用する際の重要な課題と機会を特定します。
Article: 4
Title:
Exact Matching in Correlated Networks with Node Attributes for Improved Community Recovery
Published:
2025-01-06
Authors:
Joonhyuk Yang, Hye Won Chung
Abstract:
私たちは、ノードとエッジが共同で相関している複数のネットワークにおけるコミュニティ検出を研究しています。この設定は、ソーシャルプラットフォームなどのアプリケーションで自然に発生し、共有されたユーザーのセットが異なるプラットフォーム間で相関する友情パターンと相関属性の両方を示す可能性があります。古典的なストキャスティクスブロックモデル(SBM)とそのコンテキスト対応モデル(CSBM)を拡張して、グラフ間で構造相関と属性相関を組み込んだ相関CSBMを紹介します。直感を構築するために、まず相関ガウス混合モデルを分析し、相関ノード属性のみがエッジなしで使用可能であり、属性間の距離を最小化する推定量が2つのデータベース間でノードの正確な一致を達成する条件を特定します。相関 CSBM の場合、最初にエッジ情報を使用してほとんどのノードに $k$-core マッチングを適用し、次に距離ベースの推定器で属性を活用して残りの一致しないノードのマッチングを絞り込む 2 段階の手順を開発します。アルゴリズムが正確なノード対応を回復する条件を特定し、相関エッジをマージし、相関属性を平均化してコミュニティ検出を強化できるようにします。重要なことは、グラフを整列させて組み合わせることで、単一のグラフではコミュニティ検出が不可能であるが、相関グラフからのサイド情報を組み込むことで実現可能になるレジームを特定することです。私たちの結果は、グラフマッチングとコミュニティリカバリーの相互作用がパフォーマンスを向上させ、マルチグラフの属性ベースのコミュニティ検出の範囲を広げる方法を示しています。
Article: 5
Title:
Optimal Oblivious Algorithms for Multi-way Joins
Published:
2025-01-08
Authors:
Xiao Hu, Zhiang Wu
Abstract:
クラウドデータベースでは、クライアントによってアップロードされた機密データに対するクラウド計算は、必然的にデータのセキュリティとプライバシーに関する懸念を引き起こします。暗号化プリミティブとトラステッド コンピューティング環境がクエリ処理に統合され、データの実際の内容が保護されている場合でも、アルゴリズムのアクセス パターンによってデータに関する個人情報が漏洩する可能性があります。Oblivious Random Access Memory(ORAM)と回路は、この問題に対処するための2つの一般的なアプローチであり、アルゴリズムのアクセスパターンがデータに気づかないようにします。ただし、これらの方法を安全でないアルゴリズム (特に多方向結合処理) にデプロイすることは、計算コストが高く、本質的に困難です。 この論文では、ORAMシミュレーションやその他のセキュリティの仮定に依存せずに動作する、多方向結合処理のための新しいソートベースのアルゴリズムを提案します。私たちのアルゴリズムは、基本的なプリミティブの自明ではなく、証明可能な忘却の構成であり、時間の複雑さは、安全でない最悪の場合の最適結合アルゴリズムと一致し、対数係数まで一致します。さらに、キャッシュに依存せず、キャッシュの複雑さは安全でない下限と一致し、対数係数まで一致します。このクリーンでわかりやすいアプローチは、他のセキュリティ設定にも拡張し、実際のデータベース システムに実装できる可能性があります。