どのように解析しているのか

複雑系のパターンをどう炙り出す?

数分後の株価の値動きを機械的に予測したとして、その予測を出した瞬間に鮮度はすぐに落ちてしまい、秒を刻めば刻むほど予測はランダムの波に打ち消されてしまいます。しかしながら、そのようなランダムな数値の流れの下に、予測を可能にできる規則的なパターンが潜んでいることがあります。人間の肉眼で見つけ出すことができるパターンならば、長い歴史のあるチャート分析がありますが、実際のところ、マーケットで役に立つようなわかりやすいものは誰もが考え付くことであり、それよりもさらに複雑系ともいえる相場のパターンを炙(あぶり)だすためには、様々な解析手段を試す必要があります。

海岸に打ち寄せる波の高さを予測することは不可能なことです。しかしながら、沖の近くをフェリーが一定の速度である角度で近づいてきた場合、何分後に砂浜に波が到達するかは、数学の計算でも解けそうです。では株式マーケットにおいて、通り過ぎるフェリーの存在はなんであるか、それはタンカーなのか、ボートなのか、それともイルカの群れなのか、それぞれがどのような波の形なるのかとなるど、それぞれの波形の特徴やインパクトを分析すると何とか解けそうな気がします。しかしながら、到達タイミングで強力なうねりや障害物が来た場合、計算された波は打ち消されてしまいます。その瞬間の風力や風向きは、水深は、果ては気圧や月の位置はどうか。どれほど影響するのか‥‥ やはり、暴騰、暴落のタイミングを予測することには限界があるのでは・・

カオスに立ち向かう!

どのように解析しているのか

ランダムな動きを体現する株価の予測において、はなから無理と予測解析を半ばあきらめる人、いや、必ず何か見つかるはずだとロマンを求める人、ファンダメンタルズ分析で長期的にもうかればよいと長期計画をとる人など様々です。しかし、誰しもがテクニカル分析を使って自動取引ができれば、相場の周期に合わせて売り買い両方で収益がえられるのではとも考えるでしょう。そこでデータサイエンスに長けた人であれば、株価になんらかの周期性を見つけだそうと考えます。いわゆる時系列分析です。「アルゴリズムにたち向かう!」では、確率的に鮮度が続いている超短期スケールに予測可能性を見つけようとしています。一般的な時系列分析において意味を持つノイズの存在においても、超短期予測では一定の変動予測可能なトレンドととらえます。

フィルタリング・・データ解析において不要なデータを取り除くこと、データの絞り込み、取捨選択。

クラスタリング・・階層化、グルーピングのこと。データ間の類似度に基づいてデータをグループ化すること。そのグループはクラスタと呼ばれる。ソフトクラスタリングとは、各データが複数のグループに所属することを許容してグループ分けしていく手法。

フィルタリングとクラスタリング

指標となる変数に時間スケールを取り入れているのか「アルゴリズムにたちむかう!」の分析の大きな特徴です。短時間ごとの微小な動きからトレンドを探るには、過去データをいくつかの要素でソフトクラスタリングすることで、限られる日経平均データの中から多くの変数パータンを生成することができます。次に来るであろうイベントまでの待ち時間を、単純に現在からとするか、当日の寄り付きとするか、または、昨日の最高値・最安値値発生時刻、特定の特異点と思しき時点を想定するかなど、様々に自由なラグ(タイムラグ)を設定することで、目的変数となる天井・大底のタイミングまでの待ち時間データも多く取れます。さらに、ラグの長さは相場の勢いと相関があるかもしれないと考えれば、勢いの要素を何から取り出すか、ボラティリティや出来高であったり、特定のMAからの乖離、MAの傾きであったりなどが考えられます。初期値をどこに置くか、ときどき発生する異常な数値をどう扱うかなど、フィルタリング処理も大きな意味を持ちます。

複雑系に立ち向かう!

ゲノム解析において、全ゲノムショットガン法というものがあります。ゲノム全体を最初から物理的手段で断片化し、大量の断片を片端からシーケンサで読んだ後、それぞれの配列を断片ごとに照合して、同じ配列をもつものを探し出して重ね合わせてゆく作業です。たった4つの反復配列なので、膨大な量の塩基配列情報が整列することになりますが、相当のコンピューター処理能力と、これらに何らかのアルゴリズムを加えることで、決定的に有意な情報を得ることができます。

ショットガンという名前がついているのは、データをボロボロに細かく砕くというとですが、「アルゴリズムに立ち向かう!」では、日経平均先物データをまさに分刻み、秒刻みで細かく刻み、片っ端から解析していくプロセスをとっています。問題は、そこから意味のあるデータを取り出すためのアルゴリズムですが、エラー処理やマッピング処理、ノイズ処理など、おおよそ統計的ではない部分における苦心が必要となります。

1昨年、ソフトクラスタリング解析プログラムを自作したので、解析のスピードは格段に上がりました。クラスタ構成をどのようにするか、非常に重要で、株価データ解析結果における影響力が大きいです。プログラムではクラスタ間の類似度を評価する指標となるべき最適変数を見つけ出す過程と、クラスタ内の標本数を同一に調整するための変数パラメーター自動調整機能を持ち合わせています。使われる変数は現在のところ400個、クラスタは144個です。当然、クラスタリング手法の選択においても、評価変数選択とは別に基準となる要素を何にとるか、それは複数必要かなどを、あらゆるパターンの相関を走らせて最適な組み合わせを選びます。その付け合わせ工程は数十億パターンに及びます。

クラスタリング解析プログラム

ブラックボックスモデリングとは

この手法は、1990年代アメリカにおいて「カオス理論」を研究していた元物理学者が設立した「プレディクションカンパニー」が取り入れた『ブラックボックスモデリング』という発想です。つまり、「相場がこう動けば、こうなる」という理由が説明できない、その名の通り、中身が見えないアプローチです。

私は以前、当時のスイス銀行(Swiss Bank Corporation *現在のスイスユニオン銀行)で働いていましたが、その際にクオンツの先駆けもいえる「オコナー&アソシエイツ」のアメリカ人メンバーがいました。オコナー社といえば1987年のブラックマンデー暴落時に『修正版ブラック・ショールズ・モデル』で対応して成功を収めていた、オプション取引に特化した頭脳集団ですが、スイス銀行(当時SBC)に買収される前に、前記の「プレディクションカンパニー」のオーナーとなって共同でこの手法を取り入れていました。業務開始から15年間のリスク調整リターンは代表的な株価指数であるS&P500のリターンを100以上回ってまっていました。当時、入社2年目の私は、そのような天才クオンツ集団であるということは知る由もなく、ときどきトレーディングルームやマシンルームに入っておしゃべりをしていました。マシンルームには、オコナー社メンバーであるMIT(マサチューセッツ工科大学)出身のプログラマーが2人いて、彼らの開発環境が、あのAppleの創始者であるスティーブン・ジョブズが一時期Appleを退社して創業したNextSoftware社の「NeXTSTEP」だったので、コンピューターオタクの私は、革新的なオブジェクト指向型オペレーティングシステムと当時喧伝されていたこのソフトについて大変興味そそられ、使い道が無いにもかかわらず自宅でも使っていました

『ブラックボックスモデリング』とは

適切なモデリングとは何か?

時系列分析においては、「誤差項」を取り入れながら、少しずつ変化する周期成分を推定していく手法がとられますが、その時点で周期パターンは移動平均をゴールとする平滑化がおこなわれますので、精度があいまいになることは避けられず、超短期分析の指標としてはあまり効果的ではありません。計測スケールをどうとるかでノイズの定義も変わります。

超短期予測では売り時はいつか、買い時はいつかが重要項目ですので、トレンドのベクトルは、サインカーブ1周分(上げ、下げ、上げ or 下げ、上げ、下げ)と単純化しており、周期性を推定することをあまり重要視しません。

誤差については、相関順位におけるウェイトの割当、予測レポート内インデックスコラムにある反転率(Reversal Effect Ratio)など、いくつかのトレンドライン予測計算の様々な重要箇所で利用されております。

短期予測における時系列分析手法

無条件に過去の分足データから時間スケールの変数とマーケットデータから抜き取った変数と無理やりな条件どうしを競わせ、いくつかの答えが勝ち残ったら、相関順位により任意に確率を割り当てて期待値を求め、その中からまたランダムに突き合わせ、競わせる。予測となるべきシナリオは無視しながら、ランダムに付加をかけたり、ある条件で切り分けしたり、やり方はいろいろとありますが、大量のデータを網羅し、一度に数億件のアルゴリズムを試し、実際さまざまな条件を試してみて、一番うまくいったものをとりいれるというやり方で最適解を見つけ出します。当然、炙(あぶ)り出されたものを市場のモデルに照らして、実測値との間隔をどんどん縮める作業を繰り返しながら検証する必要があります。これらのルーティーンはプログラムで自動化されます。

すべてを疑い、 標本となるデータもできるだけ多くのパターンを用意し、検証、生き残った各種の分布関数の適合度の良否をさらにふるいにかけて客観的に評価するなどして、仮定したモデルが“機能していない”ことをプログラムで検証する作業が続きます。このような学習機能(AI)を使った解析により、予測の正確性を確保します。これらの統計処理作業により出された、完全に「ブラックボックス化された」データは、本来であれば、おおよそ予測通りの動きに収まるはずです。

入社2年目で世間知らずだった私は、「オコナー社」メンバー全員を月曜祝日を入れた2泊3日の蔵王スキーツアー連れていき、一泊数千円の超格安旅館に男女別々で雑魚寝で泊まらせてしまったことがあります。本人たちは喜んでいましたが・・・(コインを入れないとテレビが映らないシステムに困惑していた)

『ブラックボックスモデリング』とは

どのような解析モデルを使うか」はAIが決める

今日、AIテクノロジーの進化に伴い、前述の「プレディクションカンパニー」や「オコナー社」の複雑系アナリストが推し進めていた手法に新たなモデリングを付け加える必要があります。膨大な量の株価の変動データを様々な配列に重ね合わせ、その中から何らかの相関があるものを紡ぎ出し、また新たな条件を加え、より相関が高いものを見つけ出す。ある時はこのアルゴリズムで、またある時は別のスキームでという風に、断片的で人間の直観では理解しえない、特定のモデルに条件依存しない『ブラックボックスモデリング』により、最も通るであろう最新の株価の道筋を求める選択的パッケージが出来上がりました。

新しい時代の分析コンテンツを楽しみください。

2023年6月23日No.14 PM14:45 End Analysis (short terms)

No.14 PM14:45 End Analysis (Short Terms)

2023年5月18日Free! No.15 Morning Pack (short & long)

Free! No.15 AM8:45 Morning Pack (Opening Analysis)

2023年5月17日お知らせ

No.7 AM14:15 End Analysis (Long Terms)