介绍
这篇文章将为大家详细讲解有关如何在python中实现数据变换,文章内容质量较高,因此小编分享给大家做个参考,希望大家阅读完这篇文章后对相关知识有一定的了解。
python是什么意思
python是一种跨平台的,具有解释性,编译性,互动性和面向对象的脚本语言,其最初的设计是用于编写自动化脚本,随着版本的不断更新和新功能的添加,常用于用于开发独立的项目和大型项目。
<强> 1,数据规范化,即归一化的方法强>
常见方法:最小——最大规范化,z分数规范化,小数定标规范化
import pandas as pd df=pd.DataFrame (A.data[:三6]) df.columns=A.feature_names [3:6] #最小——最大规范化,支持矢量运算 (df-df.min ())/(df.max () -df.min ()) , #使用sklearn中的预处理模块 得到sklearn import 预处理 preprocessing.minmax_scale (df) , # z分数规范化:结果=(数值——均值)/标准差,处理后数据的均值为0,标准差为1 (df-df.mean ())/df.std () , #使用sklearn中的预处理模块 得到sklearn import 预处理 preprocessing.scale (df) , #小数定标规范化:常见落在[1]区间,通过移动小数点的位数实现,移动位数取决于属性绝对值的最大值的位数 #装天花板向上取整 import numpy  as np df/10 * * np.ceil (np.log10 (df.abs () .max ()))
<强> 2,连续属性离散化强>
常见方法:分箱法(等宽法,等频法),聚类
import pandas as pd #等宽法5个箱子,标签为0 - 4 pd.cut (df.AGE 5标签=范围(5)) #等频法 pd.qcut (df.AGE 5标签=范围(5))
关于如何在python中实现数据变换就分享到这里了,希望以上内容可以对大家有一定的帮助,可以学到更多知识。如果觉得文章不错,可以把它分享出去让更多的人看的到。