私は 지난 3년간 HolySheep AI のAPIを活用して、数多くの高频取引システムを構築・最適化してきました。本稿では、金融市場の
Order Book予測とは:高频取引の本質
Order Bookとは、証券取引所で特定の銘柄に対して出された買い注文と売り注文の一覧であり、板情報とも呼ばれます。高频取引(HFT: High-Frequency Trading)では、このOrder Bookの変動をミリ秒単位で予測し、微細な価格差から利益を上げる戦略が主流です。
従来の機械学習アプローチ(LightGBM、XGBoostなど)は、時系列データを独立した特徴量として処理していましたが、Order Bookの本質的な構造——買い手・売り手の関係性、価格レベル間の依存関係、大口注文の連鎖的影響——を十分に捉えきれませんでした。GNNは、この
Graph Neural Network の Order Book への適用アーキテクチャ
1. グラフ構築の考え方
Order Bookをグラフとして表現する場合、以下の3種類のアプローチがあります:
- 完全グラフ(Fully Connected):全価格レベル間を接続
- 近傍グラフ(K-Nearest):各価格レベルからK個先のレベルと接続
- レイヤーグラフ(Layered):買い側・売り側を別グラフとして処理
私の实践经验では、K=3の近傍グラフ + レイヤー分離のハイブリッド構成が best balance を示しました。以下に、このアーキテクチャの詳細を説明します。
2. メッセージパッシングネットワークの選定
Order Book予測では、以下のGNN層が主に使用されます:
"""
Order Book予測向けGNNアーキテクチャ定義
HolySheep AI API compatible version
"""
import torch
import torch.nn as nn
from torch_geometric.nn import GATConv, SAGEConv, global_max_pool
class OrderBookGNN(nn.Module):
"""
双方向Order Bookグラフを処理するGNNモデル
買い側(bid)と売り側(ask)を別グラフとして定義し、
相互の依存関係を捉えるCross-Graph Attention機構を含む
"""
def __init__(self, input_dim=8, hidden_dim=64, num_heads=4, num_layers=3):
super().__init__()
# 入力埋め込み層
self.input_encoder = nn.Sequential(
nn.Linear(input_dim, hidden_dim),
nn.LayerNorm(hidden_dim),
nn.ReLU(),
nn.Dropout(0.1)
)
# Bidグラフ用GAT層(売り圧力伝播)
self.bid_gat_layers = nn.ModuleList([
GATConv(hidden_dim, hidden_dim // num_heads, heads=num_heads, concat=True)
for _ in range(num_layers)
])
# Askグラフ用GAT層(買い圧力伝播)
self.ask_gat_layers = nn.ModuleList([
GATConv(hidden_dim, hidden_dim // num_heads, heads=num_heads, concat=True)
for _ in range(num_layers)
])
# グラフ間attention(Bid/Ask相互作用捕获)
self.cross_attention = nn.MultiheadAttention(
embed_dim=hidden_dim,
num_heads=2,
dropout=0.1
)
# 時系列処理(LSTMで直近のグラフ状態变化を追跡)
self.lstm = nn.LSTM(
input_size=hidden_dim * 2,
hidden_size=hidden_dim,
num_layers=2,
batch_first=True,
dropout=0.2
)
# 予測層(方向分類 + 価格変動回帰)
self.direction_head = nn.Linear(hidden_dim, 3) # 上昇/横ばい/下落
self.price_change_head = nn.Linear(hidden_dim, 1) # 連続値予測
def forward(self, bid_data, ask_data, seq_len=10):
"""
Args:
bid_data: [batch, seq_len, num_nodes, input_dim] 買い側特徴量
ask_data: [batch, seq_len, num_nodes, input_dim] 売り側特徴量
Returns:
direction_logits: [batch, 3] 方向予測
price_change: [batch, 1] 価格変動予測
"""
batch_size = bid_data.size(0)
# 時系列方向に処理
bid_sequence = []
ask_sequence = []
for t in range(seq_len):
# Bidグラフ処理
bid_x = self.input_encoder(bid_data[:, t]) # [batch, num_nodes, hidden_dim]
bid_edge_idx = self._build_bid_edges(bid_data.size(2)) # 近傍グラフ接続
for layer in self.bid_gat_layers:
bid_x = layer(bid_x, bid_edge_idx)
bid_x = torch.relu(bid_x)
# Askグラフ処理
ask_x = self.input_encoder(ask_data[:, t])
ask_edge_idx = self._build_ask_edges(ask_data.size(2))
for layer in self.ask_gat_layers:
ask_x = layer(ask_x, ask_edge_idx)
ask_x = torch.relu(ask_x)
# Bid/Ask相互作用(Cross-Attention)
bid_pooled = global_max_pool(bid_x, torch.zeros(bid_x.size(0), dtype=torch.long))
ask_pooled = global_max_pool(ask_x, torch.zeros(ask_x.size(0), dtype=torch.long))
bid_sequence.append(bid_pooled)
ask_sequence.append(ask_pooled)
# 時系列結合
combined = torch.stack([
torch.cat([bid_sequence[t], ask_sequence[t]], dim=-1)
for t in range(seq_len)
], dim=1) # [batch, seq_len, hidden_dim*2]
# LSTMで系列依存性を建模
lstm_out, _ = self.lstm(combined)
final_state = lstm_out[:, -1, :] # 最終タイムステップ
# 出力
direction = self.direction_head(final_state)
price_change = self.price_change_head(final_state)
return direction, price_change
def _build_bid_edges(self, num_nodes):
"""買い側近傍グラフの構築(価格上位K個と接続)"""
edges = []
k = 3
for i in range(num_nodes):
for j in range(max(0, i-k), min(num_nodes, i+k+1)):
if i != j:
edges.append([i, j])
return torch.tensor(edges, dtype=torch.long).t().contiguous()
def _build_ask_edges(self, num_nodes):
"""売り側近傍グラフの構築"""
return self