python使用sklearn实现决策树的方法示例 - 行业资讯 - 肥雀云

安装水蟒环境,由于国内登陆不了他的官网https://www.continuum.io/downloads,不过可以使用国内的镜像站点:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

添加绘图工具Graphviz http://www.graphviz.org/Download_windows.php
　　

安装后,将本目录内容添加到环境变量路径即可
　　

参考博客:https://www.jb51.net/article/169878.htm

官网技术文档:http://scikit-learn.org/stable/modules/tree.html tree-algorithms-id3-c4-5-c5-0-and-cart

csv文件读取https://docs.python.org/3.5/library/csv.html& # 63;突出=csv # module-csv
　　

https://docs.python.org/2/library/csv.html& # 63;突出=csv # module-csv

　　# - * -编码:utf - 8 - * 　　”“” 　　创建alt=" python使用sklearn实现决策树的方法示例">

车算法
　　

决策树的优势

　　<李>简单易用,而且输出的结果易于解释,树能够被图形化,加深了直观的理解。　　<李>几乎不需要对数据进行预处理。　　<李>算法的开销不大,而且决策树一旦建立,对于未知样本的分类十分快,最坏情况下的时间复杂度是O (w), w是树的最大深度。　　<李>能够用于多类的分类。　　<李>能够容忍噪点。　　　　

决策树的劣势

　　<李>容易过拟合。　　<李>容易被类别中占多数的类影响而产生偏见,所以推荐在送入算法之间先平衡下数据中各个类别所占的比例。　　<李>决策树采用的是自顶向下的递归划分法,因此自定而下到了末端枝叶包含的数据量会很少,我们会依据很少的数据量取做决策,这样的决策是不具有统计意义的,这就是数据碎片的问题。　　　　

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。