pySpark乱码
1.现象
python的变量包含中文,用format放入SQL中时,出现乱码
2.原因
python2默认编码是ascii
3.解决办法
使用python3,并且把所有print,改成带括号的
4.在pyspark中加入参数
spark.pyspark.driver.python=/usr/bin/python3
spark.pyspark.python=/usr/bin/python3
5.使用用format放入SQL中时,非数字,一定要加单引号,例如:'{name}'