アルゴ取引

NeurIPS/ICMLからの知見をFXアルゴリズム取引に応用する

序論:金融市場の複雑性とAI研究の最前線

外国為替(FX)市場は、その本質的な特性として、極めて低いシグナル対ノイズ比(SNR)、非定常性、そしてカオス的なダイナミクスによって特徴づけられる 1。価格変動は、マクロ経済指標、地政学的リスク、中央銀行の政策、市場参加者のセンチメントといった無数の要因が非線形に絡み合った結果として生じる。このような複雑なシステムを前に、伝統的な線形時系列モデルや計量経済学的アプローチは、その表現力に限界を抱えていることが長らく指摘されてきた。

近年、人工知能(AI)研究の最前線を牽引するトップカンファレンスであるNeurIPS (Conference on Neural Information Processing Systems) およびICML (International Conference on Machine Learning) では、この金融市場の複雑性に挑戦するための新たな理論的・技術的ブレークスルーが次々と発表されている。しかし、これらの学術的成果は、アルゴリズム取引における「銀の弾丸」を提供するものではない。むしろ、市場の複雑性を解剖し、その構造をより深く理解するための、根本的に新しい、より強力な概念的ツールと方法論の集合体を提供するものである。

本稿の目的は、この抽象度の高い学術理論と、日々の損益に直結するアルゴリズム取引の実践との間に存在する大きな隔たりを埋めることにある。これは、AI MQL合同会社の核となる哲学、すなわち、単なる技術ベンダーとしてではなく、クライアントと共に持続可能なアルファを「共創」する戦略的研究開発(R&D)パートナーとしてのコミットメントを体現するものである 4。我々は、最先端の研究成果を、クライアントの競争優位性となる具体的な「矛」へと昇華させる。

真の専門性とは、単一の「最強」モデルを見つけ出すことではない。それは、異なるアプローチ間に存在する複雑なトレードオフを深く理解し、それらをナビゲートする能力にある。例えば、Transformerモデルが持つ高い表現力は、その解釈性や計算コストと常に比較衡量されなければならない。真のR&Dパートナーは、クライアント固有のインフラ、リスク許容度、そして戦略的目標に合わせて、これらのトレードオフを最適化するオーダーメイドのソリューションを設計・構築する。本稿では、近年のNeurIPSおよびICMLで提示された知見を、以下の三つの柱に沿って詳述し、それらが如何にしてFXアルゴリズム取引に応用可能であるかを示す。

  1. 予測のパラダイムシフト: Transformerアーキテクチャによる市場構造の再解釈
  2. 予測から最適行動へ: 深層強化学習による執行戦略の革新
  3. 「知らないこと」を知る: 不確実性定量化(UQ)によるリスク管理の高度化

これらの分析を通じて、AI MQLが提供する価値が、単なるコードの納品ではなく、深い学術的知見に裏打ちされた継続的な研究開発プロセスそのものであることを論証する。

第1章:予測のパラダイムシフト – Transformerアーキテクチャによる市場構造の再解釈

1.1 逐次処理の限界

金融時系列予測の分野では、長らくLSTM (Long Short-Term Memory) やGRU (Gated Recurrent Unit) といった再帰型ニューラルネットワーク(RNN)が主流であった。これらのモデルは、過去の情報を内部状態(メモリ)に保持しながら、データを時系列に沿って一つずつ処理していくことで、時間的依存関係を学習する 3。しかし、この逐次的な処理構造は、金融市場のような複雑なシステムをモデル化する上で、本質的なボトルネックを抱えている。

市場における価格変動は、必ずしも直近の過去だけに依存するわけではない。数週間前の重要な経済指標の発表や、数ヶ月前の地政学的イベントが、今日の価格変動に昨日よりも強い影響を与えることは頻繁に起こり得る。RNNの逐次的な情報伝達メカニズムでは、このような時間的に離れた、しかし因果的に強く関連するイベント間の関係性を効率的に捉えることが困難であった 1。情報が時間ステップを一つずつ経るごとに希釈または変質する可能性があり、長期的な依存関係の学習が構造的に難しいという課題があったのである。

1.2 自己注意機構による関係性のモデリング

この逐次処理の限界を打破するために、自然言語処理(NLP)の分野で登場したのがTransformerアーキテクチャである 1。Transformerの最大の特徴は、再帰的な構造を完全に排除し、代わりに自己注意機構(Self-Attention Mechanism)と呼ばれるメカニズムを全面的に採用した点にある 1

自己注意機構は、入力された時系列データ内の全ての時点を、他の全ての時点と直接比較し、それぞれの関連性の強さを動的に計算する。これにより、モデルは時系列上の距離に関わらず、予測に最も重要な過去の時点に「注意」を向け、その情報を重点的に利用することが可能となる。

これは、時系列データの捉え方における根本的なパラダイムシフトを意味する。従来のモデルが時系列を「線形な情報の連鎖」として捉えていたのに対し、Transformerは時系列を「全ての時点が相互に関連し合う、完全結合グラフ」として捉える。この視点は、過去の重要な高値・安値、ボラティリティの急騰、あるいは特定のニュースイベントといった複数の要因が、時間的な隔たりを超えて現在の市場環境に複雑な影響を与え合う金融市場の現実を、より忠実に表現するものである。

1.3 金融時系列への適応

しかし、「バニラ」と呼ばれる標準的なTransformerをそのまま金融時系列データに適用するだけでは、最適な結果は得られない。金融データ特有の性質、すなわち非定常性、高いノイズレベル、そして連続的な値といった特性に対応するため、学術界では様々な改良が提案されている。

  • 非定常性への対応: ICMLで発表されたTimeBridgeモデルは、金融時系列が時間スケールによって異なる統計的性質を持つことに着目した好例である 5。このモデルは、短期的な価格変動に含まれる非定常性(統計的性質が時間と共に変化する性質)を抑制し安定した局所的パターンを捉えるための注意機構と、長期的な変数間の関係性(共和分など)を捉えるために非定常性を敢えて保持する注意機構を使い分ける。これは、金融データに対する深い洞察に基づいたアーキテクチャ設計の重要性を示している。
  • 時間情報の保持: Transformerの自己注意機構は、本質的に入力の順序を考慮しない「順序不変(permutation-invariant)」な処理であるため、時系列データの命である時間的な順序情報が失われるリスクがある。この問題を解決するため、Time2Vecのような洗練された位置エンコーディング手法が開発された 6。これは、各時点に固有の時間的な特徴ベクトルを学習し、モデルに入力することで、時間的文脈を保持する。
  • トークン化: Transformerは元来、単語のような離散的なトークンを扱うことを想定している。連続的な価格データを適切に処理するため、時系列を一定の長さの「パッチ」に分割し、各パッチを一つのトークンとして扱うパッチングと呼ばれる手法が有効であることが示されている 5
  • 特化型アーキテクチャ: これらの汎用的な改良に加え、金融市場の特性に特化したモデルも開発されている。Stockformerは、マルチモーダルな分析を自己注意機構によって実現する変種であり 1、近年ではLENSのような、金融データ特有の高いノイズと確率的な振る舞いをモデル化するために、数十億もの観測データで事前学習された大規模な基盤モデルも登場している 9

これらの研究動向は、「Transformerを使う」という行為が、単にライブラリをインポートするような単純な作業ではないことを明確に示している。金融時系列特有の病理(pathology)に対応するためには、アーキテクチャレベルでの深い理解と、目的に応じた適切な改良を選択・実装するドメイン知識が不可欠である。

このTransformerモデルの進化の軌跡は、クオンツ取引そのものの進化と軌を一にしている。初期のモデルが単一の価格時系列に依存する自己回帰モデルであったのに対し、現代的なアプローチは、価格データ、オーダーブックのフロー、ニュースセンチメント、マクロ経済指標といった異種のデータソースを統合するマルチモーダルな方向へと向かっている 10。自己注意機構は、まさにこれらの異なるモダリティ(データ種別)の間に潜む未知の関係性を発見するために、極めて適したツールである。真のアルファは、しばしばこの異種情報間の相互作用の中に隠されており、その発見こそが次世代のアルゴリズム取引における競争優位性の源泉となるのである。

第2章:予測から最適行動へ – 深層強化学習による執行戦略の革新

2.1 予測の不完全性

極めて精度の高い価格予測モデルを構築できたとしても、それだけでは継続的な収益を保証することはできない。なぜなら、取引の成功は予測そのものではなく、その予測に基づいて実行される一連の「行動(アクション)」、すなわち売買やポジションの保持、そしてその規模の決定によって決まるからである。実際の取引環境には、取引コスト、スリッページ、そして自己の取引が市場に与える影響(マーケットインパクト)といった、予測モデルが直接的には考慮しない無数の現実的な制約が存在する。

したがって、アルゴリズム取引における真の課題は、「価格を予測する」という教師あり学習の問題から、「与えられた市場環境下で、取引コストなどの制約を考慮しつつ、特定の財務的目標(例:リスク調整後リターン)を最大化するための一連の最適な行動方針を学習する」という逐次的意思決定の問題へと移行する。この問題設定は、まさに深層強化学習(Deep Reinforcement Learning, DRL)が対象とする領域である 11

2.2 強化学習による目的関数の直接最適化

強化学習のパラダイムでは、エージェント(取引アルゴリズム)が環境(金融市場)と相互作用しながら、試行錯誤を通じて最適な行動方針(ポリシー)を学習する。エージェントの各行動に対して、環境は「報酬(リワード)」を与える。エージェントの目標は、長期的に得られる累積報酬を最大化することである。

この枠組みの強力な点は、取引の最終目標となる財務的指標を、報酬関数として直接設計し、最適化できることにある。NeurIPSで発表された基礎研究では、強化学習エージェントが、単純な利益だけでなく、シャープ・レシオのようなリスク調整後リターンを直接最大化するように訓練可能であることが示された 11。この研究における重要な貢献の一つが、微分シャープ・レシオ(Differential Sharpe Ratio) の提案である 14。これは、各時点での取引がポートフォリオ全体のシャープ・レシオに与える限界的な影響を定量化するものであり、オンライン学習に適した報酬関数として設計されている。

その数学的定義は以下のように与えられる 14。時刻$t$におけるリターンを$R_t$とし、$A_t$と$B_t$をそれぞれリターンの一次および二次モーメントの指数移動平均とすると、微分シャープ・レシオ$\Delta S_t$は次式で表される。

$$\Delta S_t = \frac{B_{t-1} (R_t – A_{t-1}) – \frac{1}{2} A_{t-1} (R_t^2 – B_{t-1})}{(B_{t-1} – A_{t-1}^2)^{3/2}}$$

このアプローチは、予測精度といった代理の指標ではなく、トレーダーが最終的に関心を持つビジネス目標そのものをエージェントの学習プロセスに直結させる。これにより、例えば取引コストを考慮した上で純利益を最大化する、あるいはドローダウンを抑制しながらリターンを安定させるといった、より現実に即した複雑な取引戦略の自動的な獲得が期待できる。

2.3 実装の現実:MLOpsとシミュレーション環境

理論的な優雅さとは裏腹に、強化学習エージェントを実際の取引環境で訓練し、安定的に運用することは、極めて高度なエンジニアリング上の挑戦を伴う。金融市場はノイズが多く、その統計的性質は時間と共に変化し(非定常性)、過去のデータが未来を保証しない。このような環境で訓練されたエージェントが、未知の市場環境に対しても頑健に(ロバストに)振る舞うことを保証するのは容易ではない。

この課題に対応するため、近年の研究では、アルゴリズムそのものだけでなく、それを支えるインフラの重要性が強調されている。これには、モデルの継続的な訓練、統合、デプロイを自動化するRLOps(Reinforcement Learning Operations)のパイプライン構築や、現実の市場の微細な特徴を忠実に再現する高忠実度な市場シミュレーション環境の整備が含まれる 15

NeurIPSで発表されたNeoFinRLフレームワークは、この方向性を示す代表的な事例である 16。NeoFinRLは、金融データの処理プロセスをDRL戦略の設計パイプラインから分離し、オープンソースのデータエンジニアリングツールを提供することで、データ準備の負担を軽減する。さらに、様々な取引タスクに対応した標準的な「準リアル市場環境」を提供し、GPUコアを大規模に活用した並列シミュレーションを可能にすることで、ノイズの多い大規模データ上での効率的なエージェント訓練を実現する。

このような堅牢なエンジニアリング基盤の構築は、AI MQLが提唱する「矛と盾」モデルと完全に一致する 4。強化学習エージェントが利益を生み出す鋭い「矛」であるならば、それを支えるRLOps/MLOpsのパイプラインとサイト信頼性エンジニアリング(SRE)は、システムの安定稼働を保証し、予期せぬ損失から資産を守る強固な「盾」なのである。

金融強化学習における最も困難な核心部分は、実はQ学習やPPOといった特定のアルゴリズムの選択ではない。それは、環境の定義と報酬関数の設計にある。金融市場は、多数のエージェントが相互作用し、ルール自体が変動する、部分的にしか観測できない非定常な環境である。この環境で、過去のデータに対する過学習(カーブフィッティング)を避け、未知の状況にも対応できる汎化能力の高い行動をエージェントに学習させるには、どのような状態を観測させ(状態空間の設計)、どのような行動を許可し(行動空間の設計)、そしてその行動をどう評価するか(報酬関数の設計)が決定的に重要となる。このプロセスは、既製品のアルゴリズムを適用するだけでは完結せず、深いドメイン知識と継続的な研究を要するコンサルテーションそのものであり、AI MQLがR&Dパートナーとして提供する中核的価値の一つである。

第3章:「知らないこと」を知る – 不確実性定量化(UQ)によるリスク管理の高度化

3.1 点予測の危険性

従来の多くの機械学習モデルは、「1時間後のEUR/USDの価格は1.0850になる」といった単一の予測値、すなわち点予測を出力する。しかし、この予測値には、モデルがその予測に対してどれほどの「自信」を持っているかという情報が全く含まれていない。プロフェッショナルなリスク管理の世界では、予測値そのものと同じくらい、あるいはそれ以上に、その予測の不確実性を把握することが重要である。

モデルが非常に不確実な予測を出しているにもかかわらず、その点予測値を鵜呑みにして大きなポジションを取ることは、破滅的な損失につながる可能性がある。確率論的機械学習(Probabilistic Machine Learning)は、この不確実性を数学的に厳密な形で定量化するための principled な枠組みを提供する 17

3.2 不確実性の分解:アレアトリック不確実性とエピステミック不確実性

近年のAI研究では、予測における不確実性が、その源泉によって二つの異なる種類に分類されることが常識となっている 17。この二つを区別することは、実践的なリスク管理において極めて重要である。

  • アレアトリック不確実性 (Aleatoric Uncertainty): 「データ不確実性」とも呼ばれる。これは、データ生成プロセス自体に内在する本質的なランダム性やノイズに起因する。例えば、市場のマイクロストラクチャーに由来する微細な価格の揺らぎや、予測不可能なニュース速報による突発的な変動などがこれにあたる。この種の不確実性は、たとえ無限にデータを集めたとしても、原理的に削減不可能である 22
  • エピステミック不確実性 (Epistemic Uncertainty): 「モデル不確実性」とも呼ばれる。これは、モデル自身の「知識不足」に起因する。例えば、特定の市場レジーム(例:高ボラティリティ局面)に関する学習データが不足している場合や、過去に前例のない全く新しい事象(例:パンデミック、大規模な地政学的紛争)に遭遇した場合に高くなる。この種の不確実性は、関連性の高い多様なデータを追加で学習させることで削減可能である 20

この二つの不確実性の分解は、単なる学術的な分類に留まらない。それは、トレーディング戦略に直接的な示唆を与える。アレアトリック不確実性が高いということは、現在の市場が本質的に予測困難な状況(高ボラティリティなど)にあることを意味し、ボラティリティ・ブレイクアウト戦略など、その状況に適した戦略への切り替えを示唆するかもしれない。一方で、エピステミック不確実性が高いということは、現在の市場環境がモデルの「未知の領域」であり、モデルの予測が全く信頼できないことを示す明確な危険信号である。このシグナルを検知した場合、システムはポジションサイズを大幅に削減するか、あるいは取引を完全に停止すべきである。

以下の表は、これら二つの不確実性の概念を、FXアルゴリズム取引の文脈で具体的に整理したものである。

特徴アレアトリック不確実性(データ不確実性)エピステミック不確実性(モデル不確実性)
定義市場自体に内在する、削減不可能な本質的ランダム性。モデルの知識やデータ不足に起因する「無知」。
源泉確率的な市場ダイナミクス、マイクロストラクチャーノイズ、予測不可能なイベント。特定の市場レジームに対する学習データ不足、過去に前例のないイベント、モデルの誤特定。
削減可能性不可。同じ分布からデータを追加しても削減できない 22可能。関連性の高い多様な学習データを追加することで削減できる 20
FX取引における具体例米国非農業部門雇用者数(NFP)発表時のような、価格変動が本質的にカオス的でノイズが多い局面。突発的かつ前例のない地政学的イベント(例:フラッシュ・ウォー)が発生し、モデルが対応するための過去データを持たない状況。
戦略への示唆ボラティリティに基づいた戦略の根拠となる。テイクプロフィット/ストップロスの幅を広げる、あるいは高ボラティリティ用モデルに切り替える等の判断材料となる。リスク削減の直接的なシグナル。エピステミック不確実性が高い場合、モデルの予測は信頼できない。システムはポジションサイズを系統的に削減するか、取引を停止すべきである。

3.3 ベイズ深層学習による不確実性の定量化

では、これらの不確実性をどのようにして定量化するのか。そのための強力な枠組みがベイズ深層学習(Bayesian Deep Learning, BDL)である 18

従来の深層学習モデルが、ニューラルネットワークの重み(パラメータ)を単一の最適値(点推定値)として学習するのに対し、BDLでは、重みを確率変数とみなし、その確率分布を学習する。ベイズの定理を用いて、観測されたデータを条件として、重みの事後分布を推定するのである。

このアプローチにより、モデルは単一の予測値ではなく、予測値の確率分布(予測分布)を出力することが可能になる。この予測分布の幅(分散や標準偏差)が、予測の総不確実性を表す。特に、エピステミック不確実性は、この枠組みによって自然に捉えられる。モデルが学習データから大きく外れた未知の入力に遭遇した際、重みの事後分布は広く不確かなものとなり、結果として生成される予測分布もまた幅の広い、不確実性の高いものとなるのである。

3.4 実践的応用:不確実性を考慮したポジションサイジング

不確実性定量化(UQ)の最も強力かつ直接的な応用の一つが、定量化されたエピステミック不確実性を、ポジションサイジングの動的な入力として利用することである。ある研究論文では、ベイズニューラルネットワークによって推定された予測の不確実性(予測分布の標準偏差)に反比例するようにポジションサイズを調整することで、システマティックな取引戦略のパフォーマンスが改善されることが示されている 27

この戦略は、以下の数式で表すことができる 27。$N$個の事後予測分布からのサンプルを$y^{(i)}_t$とすると、予測の不確実性$s_t$(標準偏差)と、それを用いて調整されたポジション$p_t$は次のように計算される。

$$s_t = \sqrt{\frac{1}{N-1} \sum_{i=1}^{N} (y^{(i)}_t – \bar{y}_t)^2}$$

$$p_t = \frac{1}{s_t} \cdot \bar{y}_t$$

ここで、$\bar{y}_t$は予測リターンの平均値である。このアプローチは、モデルが自らの予測に対して「自信がない(I don’t know!)」と表明したとき(すなわち、エピステミック不確実性が高く$s_t$が大きいとき)、自動的に賭け金(ポジションサイズ)を減らすという、 principled なリスク管理オーバーレイを構築する。これは、静的なストップロス設定よりもはるかに洗練されており、現代的な取引システムが備えるべき究極の「盾」を形成する。

3.5 補完的アプローチ:Conformal Prediction

BDLは強力な枠組みであるが、唯一のアプローチではない。近年、Conformal Prediction(共形的予測)と呼ばれる、より新しいノンパラメトリックな手法が注目を集めている 28。Conformal Predictionは、データの分布に関する仮定をほとんど置かずに、指定したカバレッジ率(例:95%)を統計的に厳密に保証する予測区間を構築することができる。

ICMLで発表された研究では、このConformal Predictionによって生成される予測集合が、自身のリスク指標(Value at Risk, VaR)を最適化したいと考えるリスク回避的な意思決定者にとって、最適な不確実性表現であることが理論的に示されている 30。BDLがモデルの内部状態(重みの分布)から不確実性を導出するのに対し、Conformal Predictionはモデルをブラックボックスとして扱い、その予測誤差の分布から直接的に信頼区間を構築する。これらのアプローチは相互に補完的であり、特定の金融規制やリスク管理フレームワークの要件に応じて使い分けることが、包括的なリスク管理体制の構築につながる。

結論:学術的知見と実践的価値の融合 – 次世代R&DパートナーとしてのAI MQL

本稿では、AI研究の最高峰であるNeurIPSおよびICMLで発表された最新の知見を基に、それらがFXアルゴリズム取引の現場でいかにして具体的な競争優位性へと転換され得るかを、三つの柱に沿って論じてきた。

  1. 高度な予測(矛): 市場を単純な時系列ではなく、相互に関連し合う複雑なグラフ構造として捉え直す。この新しい視点を実装する上で、自己注意機構を核とするTransformerアーキテクチャは、金融データ特有の性質に対応するための適切な改良を施すことで、従来のモデルでは捉えきれなかった長期的な依存関係や異種情報間の関係性をモデル化する強力なツールとなる。
  2. 最適な行動(矛): 予測そのものではなく、取引コストやマーケットインパクトを含む現実的な制約下での財務的目標の直接的な最適化へと焦点を移行する。この課題に対して、深層強化学習は、微分シャープ・レシオのような洗練された報酬関数と、RLOpsに代表される堅牢なエンジニアリング基盤を組み合わせることで、より現実に即した最適な取引執行戦略を自動的に学習する可能性を秘める。
  3.  principled なリスク管理(盾): 全ての予測には不確実性が伴うという事実を直視し、それを積極的に定量化・活用する。不確実性定量化(UQ)、特にベイズ深層学習の手法は、モデルの「知識不足」に起因するエピステミック不確実性を特定し、それを動的なポジションサイジングに組み込むことで、システムが自らの能力の限界を認識し、リスクを自律的に管理する究極の「盾」を構築する。

これらは、単なる個別の学術的トピックではない。これらは相互に連携し、次世代のクオンツ取引システムを構成する不可欠なコンポーネントである。この複雑で日進月歩の技術的ランドスケープを正確に把握し、難解な理論論文を堅牢で実用的な本番稼働コードへと翻訳し、そして何よりもクライアント固有のニーズと制約に合わせた最適なソリューションを共同で創造する能力こそが、AI MQLを定義するものである。

我々は単なる開発者ではない。我々は、クライアントのドメイン知識と我々の研究開発能力を融合させ、持続可能な競争優位性を構築する「共生的R&D(Symbiotic R&D)」モデルを信奉する、真の意味での研究パートナーである 4。学術界の最先端と金融市場の最前線とを繋ぐ架け橋となること、それこそがAI MQLの使命である。

引用文献

  1. Transformer Based Time-Series Forecasting For Stock – arXiv,  https://arxiv.org/html/2502.09625v1
  2. Reviews on Transformer-based Models for Financial Time Series Forecasting,  https://www.researchgate.net/publication/386138875_Reviews_on_Transformer-based_Models_for_Financial_Time_Series_Forecasting
  3. Attention Mechanisms in Deep Learning for Stock Market Prediction – ResearchGate,  https://www.researchgate.net/publication/392103620_Attention_Mechanisms_in_Deep_Learning_for_Stock_Market_Prediction
  4. AI MQL事業戦略書 (改訂版 v6.0 – 価値共創モデル).pdf
  5. ICML Poster TimeBridge: Non-Stationarity Matters for Long-term …,  https://icml.cc/virtual/2025/poster/43973
  6. Transformer Encoder and Multi-features Time2Vec for Financial Prediction – arXiv,  https://arxiv.org/abs/2504.13801
  7. Transformers with Attentive Federated Aggregation for Time Series Stock Forecasting – arXiv,  https://arxiv.org/pdf/2402.06638
  8. [2502.09625] Transformer Based Time-Series Forecasting for Stock – arXiv,  https://arxiv.org/abs/2502.09625
  9. LENS: Large Pre-trained Transformer for Exploring Financial Time Series Regularities,  https://arxiv.org/html/2408.10111v3
  10. Modality-aware Transformer for Financial Time series Forecasting – arXiv,  https://arxiv.org/html/2310.01232v2
  11. Reinforcement Learning for Trading – NIPS papers,  https://papers.nips.cc/paper/1551-reinforcement-learning-for-trading
  12. 7 Applications of Reinforcement Learning in Finance and Trading – neptune.ai,  https://neptune.ai/blog/7-applications-of-reinforcement-learning-in-finance-and-trading
  13. Reinforcement Learning for Real Life – ICML 2025,  https://icml.cc/virtual/2021/workshop/8354
  14. Reinforcement Learning for Trading – NIPS papers,  http://papers.neurips.cc/paper/1551-reinforcement-learning-for-trading.pdf
  15. A Terminology of Reinforcement Learning and Finance – NIPS papers,  https://papers.nips.cc/paper_files/paper/2022/file/0bf54b80686d2c4dc0808c2e98d430f7-Supplemental-Datasets_and_Benchmarks.pdf
  16. NeurIPS Data-Driven Deep Reinforcement Learning in Quantitative …,  https://neurips.cc/virtual/2021/38246
  17. Financial Time Series Uncertainty: A Review of Probabilistic AI Applications – ResearchGate,  https://www.researchgate.net/publication/396224232_Financial_Time_Series_Uncertainty_A_Review_of_Probabilistic_AI_Applications
  18. Bayesian Deep Learning for Uncertainty Quantification in … – ijrpr,  https://ijrpr.com/uploads/V6ISSUE5/IJRPR45489.pdf
  19. Uncertainty: a Tutorial – Eric Jang,  https://blog.evjang.com/2018/12/uncertainty.html
  20. Introduction to Uncertainty in Machine Learning Models: Concepts and Methods – part 1,  https://blog.paperspace.com/aleatoric-and-epistemic-uncertainty-in-machine-learning/
  21. A Comprehensive Guide to Model Uncertainty in Machine Learning – iMerit,  https://imerit.net/resources/blog/a-comprehensive-introduction-to-uncertainty-in-machine-learning-all-una/
  22. From Aleatoric to Epistemic: Exploring Uncertainty Quantification Techniques in Artificial Intelligence – arXiv,  https://arxiv.org/html/2501.03282v1
  23. From Aleatoric to Epistemic: Exploring Uncertainty Quantification Techniques in Artificial Intelligence – arXiv,  https://arxiv.org/pdf/2501.03282?
  24. imerit.net,  https://imerit.net/resources/blog/a-comprehensive-introduction-to-uncertainty-in-machine-learning-all-una/#:~:text=While%20epistemic%20uncertainty%20can%20be,%2C%20and%20as%20such%2C%20irreducible.
  25. Position: Bayesian Deep Learning is Needed in the Age of Large-Scale AI – arXiv,  https://arxiv.org/html/2402.00809v5
  26. Uncertainty-Aware Parking Prediction Using Bayesian Neural Networks – MDPI,  https://www.mdpi.com/1424-8220/25/11/3463
  27. Bayesian Neural Networks for Financial Asset … – DiVA portal,  https://www.diva-portal.org/smash/get/diva2:1320142/FULLTEXT01.pdf
  28. Uncertainty quantification – van der Schaar Lab,  https://www.vanderschaar-lab.com/uncertainty-quantification/
  29. ICML Poster Conformal Prediction as Bayesian Quadrature,  https://icml.cc/virtual/2025/poster/45390
  30. ICML Poster Decision Theoretic Foundations for Conformal …,  https://icml.cc/virtual/2025/poster/45101

関連記事

TOP