python使用learning_curve的方法

介绍

小编给大家分享一下python使用learning_curve的方法,希望大家阅读完这篇文章后大所收获、下面让我们一起去探讨吧! python learning_curve

 python使用learning_curve的方法

一个交叉验证发生器将整个数据集分割k次,分割成训练集和测试集。

不同大小的训练集的子集将会被用来训练评估器并且对于每一个大小的训练子集都会产生一个分数,然后测试集的分数也会计算。然后,对于每一个训练子集,运行k次之后的所有这些分数将会被平均。

<强>这个函数需要引用sklearn包

进口sklearnfrom sklearn。learning_curve进口learning_curve

<强>这个函数的调用格式是:

learning_curve(估计量,X, y, train_sizes=数组([0.1,0.325,0.55,0.775,1。]),简历=None,得分=None, exploit_incremental_learning=False, n_jobs=1, pre_dispatch=& # 39;所有# 39;,verbose=0)

估计量:所使用的分类器

X:数组类,形状(n_samples n_features)

训练向量,n_samples是样本的数量,n_features是特征的数量

y:数组类,形状(n_samples)或(n_samples n_features),可选

目标相对于X分类或者回归

train_sizes:数组类,形状(n_ticks,), dtype浮动或int

训练样本的相对的或绝对的数字,这些量的样本将会生成的学习曲线。如果dtype是浮动,他将会被视为最大数量训练集的一部分(这个由所选择的验证方法所决定)。否则,他将会被视为训练集的绝对尺寸。要注意的是,对于分类而言,样本的大小必须要充分大,达到对于每一个分类都至少包含一个样本的情况。

简历:int,交叉验证发电机或iterable,可选

确定交叉验证的分离策略

——没有,使用默认的三倍交叉验证,

——整数,确定是几折交叉验证

——一个作为交叉验证生成器的对象

——一个被应用于训练/测试分离的迭代器

详细:整数,可选

控制冗余:越高,有越多的信息

返回值:

train_sizes_abs:数组,形状=(n_unique_ticks,), dtype int

用于生成的学习曲线的训练集的样本数。由于重复的输入将会被删除,所以蜱虫可能会少于n_ticks。

train_scores:数组,形状(n_ticks n_cv_folds)

在训练集上的分数

test_scores:数组,形状(n_ticks n_cv_folds)

在测试集上的分数

看完了这篇文章,相信你对python使用learning_curve的方法有了一定的了解,想了解更多相关知识,欢迎关注行业资讯频道,感谢各位的阅读!

python使用learning_curve的方法