python使用sklearn实现决策树的方法示例

  

  

安装水蟒环境,由于国内登陆不了他的官网https://www.continuum.io/downloads,不过可以使用国内的镜像站点:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/

  

添加绘图工具Graphviz http://www.graphviz.org/Download_windows.php
  

  

安装后,将本目录内容添加到环境变量路径即可
  

  

参考博客:https://www.jb51.net/article/169878.htm

  

官网技术文档:http://scikit-learn.org/stable/modules/tree.html tree-algorithms-id3-c4-5-c5-0-and-cart

  

  

csv文件读取https://docs.python.org/3.5/library/csv.html& # 63;突出=csv # module-csv
  

  

https://docs.python.org/2/library/csv.html& # 63;突出=csv # module-csv

  

  


  

  

 python使用sklearn实现决策树的方法示例”>,<br/>
  </p>
  <p>这是一个给定4个属性,年龄,收入,学生,credit_rating以及一个标记属性class_buys_computer的数据集,我们需要根据这个数据集进行分析并构建一颗决策树</p>
  <p>代码实现:</p>
  <p> <em>核心就是调用树的DecisionTreeClassifier方法对数据进行训练得到一颗决策树</em> </p>
  
  <pre类=   # - * -编码:utf - 8 - *   ”“”   创建alt=" python使用sklearn实现决策树的方法示例">

  

车算法
  

  

 python使用sklearn实现决策树的方法示例

  

  

决策树的优势

  
      <李>简单易用,而且输出的结果易于解释,树能够被图形化,加深了直观的理解。   <李>几乎不需要对数据进行预处理。   <李>算法的开销不大,而且决策树一旦建立,对于未知样本的分类十分快,最坏情况下的时间复杂度是O (w), w是树的最大深度。   <李>能够用于多类的分类。   <李>能够容忍噪点。   
  

决策树的劣势

  
      <李>容易过拟合。   <李>容易被类别中占多数的类影响而产生偏见,所以推荐在送入算法之间先平衡下数据中各个类别所占的比例。   <李>决策树采用的是自顶向下的递归划分法,因此自定而下到了末端枝叶包含的数据量会很少,我们会依据很少的数据量取做决策,这样的决策是不具有统计意义的,这就是数据碎片的问题。   
  

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。

python使用sklearn实现决策树的方法示例