熊猫的使用技巧

  介绍

小编给大家分享一下熊猫的使用技巧,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获、下面让我们一起去了解一下吧!

熊猫有一种功能非常强大的方法,它就是<强>访问器强,可以将它理解为一种属性接口,通过它可以获得额外的方法,其实这样说还是很笼统、下面我们通过代码和实例来理解一下。

在祝辞祝辞pd.Series._accessors   {& # 39;猫# 39;& # 39;str # 39;, & # 39; dt # 39;}复制代码

对于系列数据结构使用_accessors方法,我们得到了3个对象:<强>猫,str, dt

    <李> <强>。猫:用于分类数据(分类数据) <李> <强>。str: 用于字符数据(字符串对象数据) <李> <强>。dt: 用于时间数据(datetime-like数据)

下面我们依次看一下这三个对象是如何使用的。

str对象的使用

系列数据类型:str字符串

 #定义一个系列序列
  在在在addr=pd.Series ([
  …& # 39;华盛顿特区20003 & # 39;
  …& # 39;布鲁克林,纽约11211 - 1755 & # 39;
  …& # 39;奥马哈市东北68154 & # 39;
  …& # 39;宾夕法尼亚州匹兹堡15211 & # 39;
  …])
  
  在在在addr.str.upper ()
  华盛顿特区0 20003
  1布鲁克林,纽约11211 - 1755
  2奥马哈,NE 68154
  3宾夕法尼亚州匹兹堡15211
  dtype:对象
  
  在在在addr.str.count (" # 39; \ d # 39;)
  0 5
  1 9
  2个5
  3个5
  dtype: int64复制代码

关于以上str对象的2个方法说明:

    <李> <强> Series.str.upper: 将系列中所有字符串变为大写; <李> <强> Series.str。数:对系列中所有字符串的个数进行计数;

其实不难发现,该用法的使用与Python中字符串的操作很相似。没错,在熊猫中你一样可以这样简单的操作,而不同的是你操作的是一整列的字符串数据。仍然基于以上数据集,再看它的另一个操作:

祝辞祝辞祝辞regex=(" # 39;(?术;city> [A-Za-z] +), & # 39;#一个或更多字母   …" # 39;(?术;state> [a - z] {2}) & # 39;#两个大写字母   …" # 39;(?术;zip> \ d {5} (?: - \ d{4}) ?) & # 39;) #可选的4个延伸数字   …   在在在addr.str.replace(& # 39;强生# 39;,& # 39;& # 39;).str.extract(正则表达式)   城市国家邮政编码   0华盛顿20003   1布鲁克林纽约11211 - 1755   奥马哈NE 68154   宾夕法尼亚州匹兹堡15211复制代码

关于以上str对象的2个方法说明:

    <李> <强> Series.str.replace: 将系列中指定字符串替换; <李> <强> Series.str。精华:强通过正则表达式提取字符串中的数据信息;

这个用法就有点复杂了,因为很明显看的到,这是一个链式的用法。通过<强>替换将“. “;替换为““,即为空,强紧接着又使用了<强> 3个正则表达式(分别对应的城市,国家,邮政编码)通过对提取数据进行了提取,并由原来的系列数据结构变为了DataFrame数据结构。

当然,除了以上用法外,常用的属性和方法还有<强> .rstrip,。包含,分裂等,我们通过下面代码查看一下<强> str 属性的完整列表:

祝辞祝辞祝辞[我因为我在dir (pd.Series.str)如果不是i.startswith (& # 39; _ # 39;))   [& # 39;利用# 39;   & # 39;猫# 39;   & # 39;中心# 39;   & # 39;包含# 39;   & # 39;计数# 39;   & # 39;解码# 39;   & # 39;编码# 39;   & # 39;endswith # 39;   & # 39;提取# 39;   & # 39;extractall& # 39;   & # 39;发现# 39;   & # 39;findall& # 39;   & # 39;得到# 39;   & # 39;get_dummies& # 39;   & # 39;指数# 39;   & # 39;isalnum& # 39;   & # 39;isalpha& # 39;   & # 39;isdecimal& # 39;   & # 39;isdigit& # 39;   & # 39;islower& # 39;   & # 39;isnumeric& # 39;   & # 39;isspace& # 39;   & # 39;istitle& # 39;   & # 39;isupper& # 39;   & # 39;加入# 39;   & # 39;len # 39;   & # 39;ljust& # 39;   & # 39;低# 39;   & # 39;lstrip& # 39;   & # 39;比赛# 39;   & # 39;规范化# 39;   & # 39;垫# 39;   & # 39;分区# 39;   & # 39;重复# 39;   & # 39;取代# 39;   & # 39;rfind& # 39;   & # 39;rindex& # 39;   & # 39;rjust& # 39;   & # 39;rpartition& # 39;   & # 39;rsplit& # 39;   & # 39;rstrip& # 39;   & # 39;片# 39;   & # 39;slice_replace& # 39;   & # 39;分裂# 39;   & # 39;startswith # 39;   & # 39;带# 39;   & # 39;swapcase& # 39;   & # 39;标题# 39;   & # 39;翻译# 39;   & # 39;上# 39;   & # 39;包# 39;   & # 39;zfill& # 39;]复制代码

熊猫的使用技巧