秦同學
2025-10-20 22:28information gain應該是with the help of Large cap - without the help of Large Cap嗎?那是不是-0.225? 如何解讀
所屬:FRM Part I > Quantitative Analysis 視頻位置 相關(guān)試題
來源: 視頻位置 相關(guān)試題
1個回答
黃石助教
2025-10-21 17:44
該回答已被題主采納
同學你好。information game指的是在考慮了large cap的幫助之后和考慮了large cap的幫助之前,基尼系數(shù)的下降幅度。計算的話,在這道題里就應該是0.48-0.255=0.225。這個0.225的解讀要追溯到基尼系數(shù)的定義,基尼系數(shù)本身衡量的是系統(tǒng)當中的一種不確定性。這個系數(shù)越大、不確定性就越高(可以通過一個例子來理解:假設只有兩種可能的結(jié)果,不確定性最大的時候應是這兩種結(jié)果發(fā)生的概率各為0.5的時候,此時Gini = 1 - 0.5^2 - 0.5^2 = 0.5;不確定性最小的時候應是這兩種結(jié)果有一種發(fā)生概率為1,也就是有一個結(jié)果是必然會發(fā)生的,此時Gini = 1 - 1^2 - 0^2 = 0)。在這里,考慮了large cap這個特征之后,不確定性下降了0.225。在構(gòu)建決策樹時,每個節(jié)點上選擇的特征應是該節(jié)點上令不確定性下降最多的特征,這有助于我們做出決策。還是舉一個極端的例子,比如說只要是large cap就必付股息,反之則必不付股息。此時,Gini = 1 - 1^2 - 0^2 = 0;對于決策而言,這告訴我們,只要看到large cap就無腦認為該公司是支付股息的就行,所以我們此時會最想把該特征放在當前的節(jié)點上。
-
追問
老師,一定是大-小嗎?因為這里考慮了large cap之前是0.48,而考慮了large cap之后是0.255呀? 為什么還是0.48-0.255呢
-
追答
同學你好。注意information gain對應著不確定性的下降幅度,所以要用一開始的不確定性水平減去考慮某個特征后的不確定性水平。
