t檢驗的自由度為什么是n-k-1呢?
這部分內(nèi)容感覺很混亂,一會說詞出現(xiàn)的頻率高,說明是stop words,沒有真正的含義要刪掉;一會又說TF、DF、MI越高越好,指標(biāo)越高說明詞越特殊,要保留。
老師,請您解釋一下Document frequency的計算和含義。分母總句數(shù)是文件集的總句數(shù)還是單個文件的總句數(shù)?相應(yīng)的分子中的含有某個詞的文件數(shù)(“句數(shù)”)能說明是指文件集的總句數(shù)嗎?教材的一個例子中的分母2180這個數(shù)怎么來的,我沒看明白
lasso能講下嗎
這道題不是讓判斷哪個是同方差嗎? 圖二是同方差吧?
infinite variance是什么,老師沒解釋
考試的時候Di會給嗎還是要自己算?
MLR非線性關(guān)系的單個因素與y的散點圖一定是曲線嗎
with drift, b0不等于 0,這是的知識點是?
為什么standard_error都是一樣的?180和181的區(qū)別是?
老師,第三小題的B選項我覺得會有影響的,權(quán)衡做的更好不就要涉及到做更多計算嗎,那不也是cost嗎?
19分30s提到付費研報需要fully disclose,包括多少錢,記得之前好像說只要披露nature不用披露amount?
老師,第三小題的sampling error一定會導(dǎo)致標(biāo)準(zhǔn)誤變大嗎?為什么不會導(dǎo)致它變小呢?
可否展示一個有MULTICOLLINEARITY 和沒有的圖給參考?如何在圖中看出?
請問這里的step1,如果是supervised,也可用dimension reduction 去削減k ?
程寶問答