安装水蟒环境,由于国内登陆不了他的官网https://www.continuum.io/downloads,不过可以使用国内的镜像站点:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/
添加绘图工具Graphviz http://www.graphviz.org/Download_windows.php
安装后,将本目录内容添加到环境变量路径即可
参考博客:https://www.jb51.net/article/169878.htm
官网技术文档:http://scikit-learn.org/stable/modules/tree.html tree-algorithms-id3-c4-5-c5-0-and-cart
csv文件读取https://docs.python.org/3.5/library/csv.html& # 63;突出=csv # module-csv
https://docs.python.org/2/library/csv.html& # 63;突出=csv # module-csv
# - * -编码:utf - 8 - * ”“” 创建alt=" python使用sklearn实现决策树的方法示例">
车算法
决策树的优势
-
<李>简单易用,而且输出的结果易于解释,树能够被图形化,加深了直观的理解。李>
<李>几乎不需要对数据进行预处理。李>
<李>算法的开销不大,而且决策树一旦建立,对于未知样本的分类十分快,最坏情况下的时间复杂度是O (w), w是树的最大深度。李>
<李>能够用于多类的分类。李>
<李>能够容忍噪点。李>
决策树的劣势
-
<李>容易过拟合。李>
<李>容易被类别中占多数的类影响而产生偏见,所以推荐在送入算法之间先平衡下数据中各个类别所占的比例。李>
<李>决策树采用的是自顶向下的递归划分法,因此自定而下到了末端枝叶包含的数据量会很少,我们会依据很少的数据量取做决策,这样的决策是不具有统计意义的,这就是数据碎片的问题。李>
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。