今天就跟大家聊聊有关如何让充分利用R + Python,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
如果你从事数据科学的工作,可能会立即想到两种编程语言:R和Python。
事实上,R和Python本身是很好的工具,但通常被认为是竞争对手。今天推荐的这篇文章将会把两者进行比较,而不是将它们视为两种选择。
如果你在谷歌搜索栏中输入R vs Python,会立即获得大量有关一方的优势的文章。
产生这种结果的原因之一,是人们根据他们根据对编程语言使用的选择将数据科学领域划分为阵营,一个R营地和一个Python营地。而且这两个阵营往往不能和谐相处,其中的成员都相信他们的语言优于对方,因此,在某种程度上,分歧并不在于工具,而在于,终止,和终止,
<强>为什么不同时使用呢?强>
数据科学中有很少一部分人同时使用Python和R .但事实上,有很多人虽然只用一种编程语言,但他们也想要使用另一个软件的某些功能,例如,R用户有时会想要使用Python本机的面向对象能力,同样,一些Python用户也想用R中的各种统计分布。
<强> Python 强>
自1991年发布以来,Python一直非常受欢迎,并广泛用于数据处理。优点有:
- <李>
面向对象的语言。
李> <李>广泛的用途。
李> <李>有很多扩展(功能)和强大的社区支持。
李> <李>简单,易与理解和学习。
李> <李>在熊猫,numpy和scikit-learn这样的软件包上,Python是机器学习活动的* * *选择。
李>但是,与R不同,Python没有用于统计计算的专用包。
<强> R 强>
R的* * *个版本发布于1995年,从那时起它就成为业界最常用的数据科学工具之一。
- <李>
几乎包含所有可以想到的统计应用程序的安装包.CRAN目前拥有超过10 k的包。
李> <李>配备了完备的?可视化库,如ggplot2。
李> <李>能够进行独立分析。
李>性能良好的R不是最快的语言,并且在处理大型数据集时有时可能会内存过多。
<>强充分利用这两种语言强>
我们能否同时利用R的统计能力和Python的编程能力吗?当我们可以轻松地在R或Python脚本中嵌入SQL代码时,为什么不将R和Python混合在一起呢?
基本上有两种方法可以在一个项目中同时使用Python和R。
<>强在Python中使用R 强>
- <李>
<强> pyp 强>
李>(http://bioinfo.ihb.ac.cn/softwares/PypeR/)
pyp提供了一种简单的方法,通过管道从Python访问R.PypeR也包含在Python的包,指数中,它提供了一种更方便的安装方式。当Python和R之间不需要频繁的交互式数据传输时,pyp特别有用。通过管道运行R, Python程序在流程操作系统平台(包括窗户,,GNU Linux和Mac OS)的子流程控制下,可以获得内存控制和可移植性方面的灵活性。
<强> pyRserve 强>
(https://pypi.org/project/pyRserve/)
pyRserve使用Rserve作为RPC连接网关。通过这种连接,可以在Python中用R设置变量,也可以远程调用R函数R对象作为Python实现的类的实例公开,在许多情况下R函数作为这些对象的绑定方法。
- <李>
<强> rpy2 强>
李>(https://rpy2.bitbucket.io/)
rpy2在Python进程中运行嵌入式R .它创建了一个框架,可以将Python对象转换为R对象,将它们传递给R函数,并将R输出转换回Python对象.rpy2更常用,并且在积极开发中。