[GitHub] spark pull request #20849: [SPARK-23723] New charset option for json datasou...

HyukjinKwon Sun, 25 Mar 2018 19:13:51 -0700

Github user HyukjinKwon commented on a diff in the pull request:

    https://github.com/apache/spark/pull/20849#discussion_r176966887
  
    --- Diff: python/pyspark/sql/readwriter.py ---
    @@ -176,7 +176,7 @@ def json(self, path, schema=None, 
primitivesAsString=None, prefersDecimal=None,
                  allowComments=None, allowUnquotedFieldNames=None, 
allowSingleQuotes=None,
                  allowNumericLeadingZero=None, 
allowBackslashEscapingAnyCharacter=None,
                  mode=None, columnNameOfCorruptRecord=None, dateFormat=None, 
timestampFormat=None,
    -             multiLine=None, allowUnquotedControlChars=None):
    +             multiLine=None, allowUnquotedControlChars=None, charset=None):
    --- End diff --
    
    Shall we ues `encoding` to be consistent with CSV? `charset` had an alias 
`encoding` to look after Pandas and R.



---

---------------------------------------------------------------------
To unsubscribe, e-mail: [email protected]
For additional commands, e-mail: [email protected]

[GitHub] spark pull request #20849: [SPARK-23723] New charset option for json datasou...

Reply via email to