在上一篇文章中,我們討論了子圖指標選擇的邏輯思路和實踐環節的注意事項,並在文章末尾留下了兩個互動問題。 本文將沿用上一節的思路,嘗試討論和解決所選指標的相關性如何判斷,以及遇到相關性相關的指標時如何處理的問題,並在此基礎上提供子圖中指標選擇的具體步驟和標準。
我們打算設計乙個同大鑫子圖指標系統,作用是**管理的量化提示,核心計算公式是**=2*勝率-1,目前的進展是從數理統計的角度解決“勝率”的定量問題。
之前,我們將指標的相關性定義為公式(或邏輯)在指標的最低水平是否相同,因為公式是指標勝率的關鍵因素,或者說是影響預期回報的概率。 這是根據直覺常識給出的簡單定義,目的是使其更容易理解。
讓我們以 KDJ 指標為例。 在同大新**介面,按CTRL+S快捷鍵,我們調出“程式交易評估系統”,選擇KDJ交易,然後下一步,所有設定均由系統預設使用,在品種中選擇中國平安(隨機選擇),然後開始評估。 系統顯示勝率為7143%。
如果您在“設定報告”頁面上,請單擊“優化引數”,勾選彈出對話方塊中的所有框,然後單擊“開始評估”。 該操作意味著根據相同的條件逐個回測KDJ引數組合,總共有360個組合。 其效果相當於將 360 個高度相關的指標放在一起。 此時,總勝率降低到4412%,大幅下降。
通過上面的簡單對比,可以直觀地感受到高相關指標組對最終結果的影響。 但是,通大鑫的基礎指標很多,成百上千,變形無數,如果乙個乙個的去人工判斷,效率低,就會有很大的誤差。
那麼如何科學判斷指標的相似性呢? 在這裡,讓我們換個角度思考。 將這些指標視為量化交易中的因素(實際上,它們被稱為技術指標因素)。 成交量和價格交易中有乙個多因素策略,已經是乙個成熟的策略,裡面有多因素相關處理。
下面**是多因子策略中挖掘因子的過程,如果將因子換成技術指標,是否和我們選擇子圖表指標的邏輯思路相同。
具體解釋一下:
1.選擇有效n個因子:
在量化中,評價**良率有效性的評價方法是IC和IR值,鬆動濾波條件為IC 002,ir>0.3。哪裡:
1)IC是資訊係數,代表因子***返回的能力。IC的計算方法是計算再平衡週期開始時所有**的排名與再平衡週期結束時的收益排名之間的線性相關係數(correlation)。 IC越大,選股能力越強。
2)IR是資訊比率,它代表了因子在歷史上表現的穩定性。IR = IC 平均值 IC 的波動性。 不同歷史時期的因素表現可能會有很大差異,有時表現很好,有時表現很差,表現在IC上,即IC的波動性非常大。 假設均值IC為常數,IC的波動性越小,因子效能越穩定,IR越大。
2、因素相關性分析:
計算因子IC序列的Spearman相關係數。 具體的計算原理和過程太學術了,有興趣的可以上網搜尋一下。 一般來說,與同一類別的相關性更強; 不同類別之間的相關性較弱。
現在,讓我們回到文章開頭的兩個問題。 通過上述介紹,在定量多因素策略中給出了科學的解決方案。 計算過程複雜,需要使用python,但不能直接在通大信中實現。
那麼就有兩種解決方案了,一種是編寫自己的python程式,搭建乙個指標評估框架,然後把所有可訪問的指標都扔進去,讓系統執行,最後輸出乙個結果。 這個太複雜了,門檻很高,效益科學,準確率高。 二是簡化條件,降低要求和精度,以滿足同大鑫環境的要求。
對於初始版本,重點是框架,所以我選擇了第二個選項,簡化條件和要求,在同大信中,我們用勝率代替IC,用夏普比率代替IR。 在實際操作中,給出了選擇子圖表指標的具體步驟和標準:
基於同大新系統自帶的指標樹,每個指標都用歷史5年的資料進行回測,並保留回測報告;
在回測結果中,選擇勝率為50%的指標;
在回測結果中,選擇夏普比率(= alpha yield beta yield ) 1;
篩選後的剩餘指標按照評分公式從大到小排序=勝率*權重1+夏普比*權重2;
根據同大鑫系統的自動索引樹框架,根據篩選索引樹的自動索引樹框架建立新的索引樹;
在新的指標樹中,僅保留同一類別中的指標,並在步驟 4 中得分最高,其餘指標將從新指標樹中刪除。
重新篩選後保留的指標是為子圖選擇的指標。
對網路上其他基本指標的變體重複上述步驟,以更新和迭代子圖指標。
上述步驟介紹了指標選擇和迭代更新的具體操作步驟和標準。 初始權重 1 和權重 2 可以設定為 05、可以靈活調整,勝率和夏普比,更要注意哪個權重,只要權重1+權重2=1即可。
在下一節中,我們將按照上述步驟和標準來篩選同大新的基本指標,看看它的效果如何。 因為指標多,會比較費時,我們邊做邊分享後續結果。
end】