- 数学 · 决策树(一)· 混乱程度 , pi ∈ [0,1] → H(Y) ≥ 0 , 所以最小值是0,这样的话,说明在一个分支内,异质性很小。 , 这个可以总结一下。
决策树理论部分可以参考 Brett Lantz Machine Learning with R - Second Edition.pdf的126页附近。 决策树的解释意思就是 它会给出一个可能性,如果你的答案是1或0,那么答案就是1的概率为p,0的概率为1 − p。
在看完决策树后,可以了解一下随机森林,具体的之后我再准备给你。他们之间大致的关系如下图。
## Error in `library()`:
## ! there is no package called 'DiagrammeR'
## Error in `grViz()`:
## ! could not find function "grViz"
## Error:
## ! object 'xgboost' not found
这是随机森林需要看到的地方, 贝叶斯、支持向量机、神经网络也是用到的常用方法,这个可以之后跟你说,我先说我最熟悉的。