介绍
小编给大家分享一下熊猫的使用技巧,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获、下面让我们一起去了解一下吧!
熊猫有一种功能非常强大的方法,它就是<强>访问器>强,可以将它理解为一种属性接口,通过它可以获得额外的方法,其实这样说还是很笼统、下面我们通过代码和实例来理解一下。
在祝辞祝辞pd.Series._accessors {& # 39;猫# 39;& # 39;str # 39;, & # 39; dt # 39;}复制代码
对于系列数据结构使用_accessors方法,我们得到了3个对象:<强>猫,str, dt 强>。
- <李> <强>。猫:强>用于分类数据(分类数据)李> <李> <强>。str: 强>用于字符数据(字符串对象数据)李> <李> <强>。dt: 强>用于时间数据(datetime-like数据)李>
下面我们依次看一下这三个对象是如何使用的。
str对象的使用
系列数据类型:str字符串
引用>#定义一个系列序列 在在在addr=pd.Series ([ …& # 39;华盛顿特区20003 & # 39; …& # 39;布鲁克林,纽约11211 - 1755 & # 39; …& # 39;奥马哈市东北68154 & # 39; …& # 39;宾夕法尼亚州匹兹堡15211 & # 39; …]) 在在在addr.str.upper () 华盛顿特区0 20003 1布鲁克林,纽约11211 - 1755 2奥马哈,NE 68154 3宾夕法尼亚州匹兹堡15211 dtype:对象 在在在addr.str.count (" # 39; \ d # 39;) 0 5 1 9 2个5 3个5 dtype: int64复制代码关于以上str对象的2个方法说明:
<李> <强> Series.str.upper: 强>将系列中所有字符串变为大写;李> <李> <强> Series.str。数:强>对系列中所有字符串的个数进行计数;李>
其实不难发现,该用法的使用与Python中字符串的操作很相似。没错,在熊猫中你一样可以这样简单的操作,而不同的是你操作的是一整列的字符串数据。仍然基于以上数据集,再看它的另一个操作:
祝辞祝辞祝辞regex=(" # 39;(?术;city> [A-Za-z] +), & # 39;#一个或更多字母 …" # 39;(?术;state> [a - z] {2}) & # 39;#两个大写字母 …" # 39;(?术;zip> \ d {5} (?: - \ d{4}) ?) & # 39;) #可选的4个延伸数字 … 在在在addr.str.replace(& # 39;强生# 39;,& # 39;& # 39;).str.extract(正则表达式) 城市国家邮政编码 0华盛顿20003 1布鲁克林纽约11211 - 1755 奥马哈NE 68154 宾夕法尼亚州匹兹堡15211复制代码关于以上str对象的2个方法说明:
<李> <强> Series.str.replace: 强>将系列中指定字符串替换;李> <李> <强> Series.str。精华:>强通过正则表达式提取字符串中的数据信息;李>
这个用法就有点复杂了,因为很明显看的到,这是一个链式的用法。通过<强>替换将“. “;替换为““,即为空,>强紧接着又使用了<强> 3个正则表达式(分别对应的城市,国家,邮政编码)通过对提取数据进行了提取,强>并由原来的系列数据结构变为了DataFrame数据结构。
当然,除了以上用法外,常用的属性和方法还有<强> .rstrip,。包含,分裂强>等,我们通过下面代码查看一下<强> str 强>属性的完整列表:
祝辞祝辞祝辞[我因为我在dir (pd.Series.str)如果不是i.startswith (& # 39; _ # 39;)) [& # 39;利用# 39; & # 39;猫# 39; & # 39;中心# 39; & # 39;包含# 39; & # 39;计数# 39; & # 39;解码# 39; & # 39;编码# 39; & # 39;endswith # 39; & # 39;提取# 39; & # 39;extractall& # 39; & # 39;发现# 39; & # 39;findall& # 39; & # 39;得到# 39; & # 39;get_dummies& # 39; & # 39;指数# 39; & # 39;isalnum& # 39; & # 39;isalpha& # 39; & # 39;isdecimal& # 39; & # 39;isdigit& # 39; & # 39;islower& # 39; & # 39;isnumeric& # 39; & # 39;isspace& # 39; & # 39;istitle& # 39; & # 39;isupper& # 39; & # 39;加入# 39; & # 39;len # 39; & # 39;ljust& # 39; & # 39;低# 39; & # 39;lstrip& # 39; & # 39;比赛# 39; & # 39;规范化# 39; & # 39;垫# 39; & # 39;分区# 39; & # 39;重复# 39; & # 39;取代# 39; & # 39;rfind& # 39; & # 39;rindex& # 39; & # 39;rjust& # 39; & # 39;rpartition& # 39; & # 39;rsplit& # 39; & # 39;rstrip& # 39; & # 39;片# 39; & # 39;slice_replace& # 39; & # 39;分裂# 39; & # 39;startswith # 39; & # 39;带# 39; & # 39;swapcase& # 39; & # 39;标题# 39; & # 39;翻译# 39; & # 39;上# 39; & # 39;包# 39; & # 39;zfill& # 39;]复制代码熊猫的使用技巧