今天就跟大家聊聊有关火花属性的配置方式有哪些,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。
1,火花属性:这个可以控制应用程序的绝大部分属性。并且可以通过SparkConf对象或者Java系统属性进行设置;
2,环境变量(环境变量):这个可以分别对每台机器进行相应的设置,比如IP。这个可以在每台机器的SPARK_HOME/conf/spark-env美元。sh脚本中进行设置;
3日志:所有的日志相关的属性可以在log4j。属性文件中进行设置。
<强>下面对这三种属性设定进行详细的说明。强>
<强>一、火花属性强>
火花属性可以控制应用程序的绝大部分属性,并且可以分别在每个应用上进行设置。这些属性可以直接在SparkConf对象上设定,该对象可以传递给SparkContext.SparkConf对象允许你去设定一些通用的属性(比如大师URL,应用的名称等),这些属性可以传递给组()方法的任意键-值对。如下:
瓦尔 conf =new SparkConf () ,,,,,,.setMaster (“local") ,,,,,,.setAppName (“CountingSheep") ,,,,,,这里(“spark.executor.memory",,“1 g") 瓦尔 sc =new SparkContext(参看)
<强>动态加载火花属性强>
在一些场景中,你可能想避免在代码中将SparkConf对象的属性进行设死,比如,你可能想在不同的主人上面或者不同内存容量运行你的应用程序。这就需要你运行程序的时候进行设置,火花允许你创建一个空的设计及其对象,如下:
瓦尔 sc =new SparkContext(新 SparkConf ())
然后你可以在运行的时候通过命令行进行一些属性的配置:
/bin/spark-submit ——name “My app" ,,,,,,,,,,,,,,master 当地[4] ,,,,,,,,,,,,,,conf spark.shuffle.spill=false ,,,,,,,,,,,,,,conf “spark.executor.extraJavaOptions=- xx: + PrintGCDetails ,,,,,,,,,,,,,,,,,,,- xx: + PrintGCTimeStamps" ,,,,,,,,,,,,myApp。jar
引发壳和spark-submit工具支持两种方式来动态加载配置属性第。一种是命令行方式,比如——主;spark-submit工具可以通过——配置标记接收任何的火花属性。运行。/bin/spark-submit——帮助将会显示全部的选项。
。/bin/spark-submit工具也会从conf/spark-defaults。参看配置文件中读取配置选项。在conf/spark-defaults。参看配置文件中,每行是键值对,中间可以是用空格进行分割,也可以直接用等号进行分割。如下:
spark.master ,,,,,火花://iteblog.com: 7077 spark.executor.memory 512米 spark.eventLog.enabled 真正的 spark.serializer ,, org.apache.spark.serializer。KryoSerializ
每个值将作为一个旗帜传递到应用中并个SparkConf对象中相应的属性进行合并。通过SparkConf对象配置的属性优先级最高;其次是对spark-submit或spark-shell通过国旗配置;最后是spark-defaults。参看文件中的配置。
<强>哪里可以查看配置好的火花属性强>
在应用程序对应的WEB UI (http://
<强>二、环境变量强>
有很大一部分的火花设定可以通过环境变量来进行设定。这些环境变量设定在conf/spark-env。sh脚本文件中(如果你是windows系统,那么这个文件名称是conf/spark-env。cmd)。在独立和便模式下,这个文件可以设定一些和机器相关的信息(比如主机名)。
需要注意,在刚刚安装的火花中conf/spark-env.sh文件是不存在的。但是你可以通过复制conf/spark-env.sh。模板文件来创建,你的确保这个复制之后的文件是可运行的。
<强> 强> <强>下面的属性是可以在conf/spark-env。上海文件中配置强>
JAVA_HOME Java的安装目录 PYSPARK_PYTHON Python  binary executable 用use for PySpark。 SPARK_LOCAL_IP IP  address of 从而machine 用bind 。 SPARK_PUBLIC_DNS Hostname  your Spark program  will advertise 用other 机器。火花属性的配置方式有哪些