programing

왜 PHP json_encode 함수는 UTF-8 문자열을 16진수 엔티티로 변환합니까?

nicescript 2023. 2. 2. 21:22
반응형

왜 PHP json_encode 함수는 UTF-8 문자열을 16진수 엔티티로 변환합니까?

다양한 언어에 대응하는 PHP 스크립트를 가지고 있습니다.아쉽게도 제가 이걸 쓰려고 할 때마다json_encode모든 Unicode 출력이 16진수 엔티티로 변환됩니다.이게 예상된 동작인가요?출력을 UTF-8 문자로 변환하는 방법이 있습니까?

다음은 예를 제시하겠습니다.

입력

echo $text;

산출량

База данни грешка.

입력

json_encode($text);

산출량

"\u0411\u0430\u0437\u0430 \u0434\u0430\u043d\u043d\u0438 \u0433\u0440\u0435\u0448\u043a\u0430."

PHP/5.4.0 이후로는 다음과 같은 옵션이 있습니다.JSON_UNESCAPED_UNICODE. 확인해 보세요:

https://php.net/function.json-encode

따라서 다음 작업을 수행해야 합니다.

json_encode( $text, JSON_UNESCAPED_UNICODE );

JSON_ESCAPED_UNICODE는 PHP 버전 5.4 이상에서 사용할 수 있습니다.
다음 코드는 버전 5.3용입니다.

갱신했다

  • html_entity_decode보다 조금 더 효율적입니다.pack+mb_convert_encoding.
  • (*SKIP)(*FAIL)백슬래시 자체 및 지정된 문자를 건너뜁니다.JSON_HEX_*플래그를 설정합니다.

 

function raw_json_encode($input, $flags = 0) {
    $fails = implode('|', array_filter(array(
        '\\\\',
        $flags & JSON_HEX_TAG ? 'u003[CE]' : '',
        $flags & JSON_HEX_AMP ? 'u0026' : '',
        $flags & JSON_HEX_APOS ? 'u0027' : '',
        $flags & JSON_HEX_QUOT ? 'u0022' : '',
    )));
    $pattern = "/\\\\(?:(?:$fails)(*SKIP)(*FAIL)|u([0-9a-fA-F]{4}))/";
    $callback = function ($m) {
        return html_entity_decode("&#x$m[1];", ENT_QUOTES, 'UTF-8');
    };
    return preg_replace_callback($pattern, $callback, json_encode($input, $flags));
}

문자 집합과 이스케이프되지 않은 유니코드를 설정하는 것을 좋아합니다.

 header('Content-Type: application/json;charset=utf-8');  
 json_encode($data,JSON_UNESCAPED_UNICODE|JSON_PRETTY_PRINT);

한 가지 해결책은 먼저 데이터를 인코딩한 후 동일한 파일로 디코딩하는 것입니다.

$string =json_encode($input, JSON_UNESCAPED_UNICODE) ; 
echo $decoded = html_entity_decode( $string );

여기 다양한 PHP 버전을 위한 통합 솔루션이 있습니다.

저희 회사에서는 다양한 PHP 버전을 가진 다양한 서버를 사용하고 있기 때문에 모두에게 맞는 솔루션을 찾아야 했습니다.

$phpVersion = substr(phpversion(), 0, 3)*1;

if($phpVersion >= 5.4) {
  $encodedValue = json_encode($value, JSON_UNESCAPED_UNICODE);
} else {
  $encodedValue = preg_replace('/\\\\u([a-f0-9]{4})/e', "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode($value));
}

크레딧은 Marco Gasi & abu에게 돌려야 합니다.PHP > = 5.4용 솔루션은 json_documents에 나와 있습니다.

json_encode($text, JSON_UNESCAPED_UNICODE|JSON_UNESCAPED_SLASHES);

위의 raw_json_encode() 함수는 문제를 해결하지 못했습니다(어떤 이유에서인지 콜백 함수가 PHP 5.2.5 서버에서 오류를 발생시켰습니다).

하지만 이 다른 해결책은 실제로 효과가 있었습니다.

https://www.experts-exchange.com/questions/28628085/json-encode-fails-with-special-characters.html

크레딧은 마르코 가시가 받아야json_encode()를 호출하는 대신 함수를 호출합니다.

function jsonRemoveUnicodeSequences( $json_struct )
{ 
    return preg_replace( "/\\\\u([a-f0-9]{4})/e", "iconv('UCS-4LE','UTF-8',pack('V', hexdec('U$1')))", json_encode( $json_struct ) );
}

이게 예상된 동작인가요?

json_encode()는 UTF-8 부호화 데이터에서만 동작합니다.

여기서 변환할 수 있는 답을 얻을 수 있을지도 모릅니다.키릴 문자 변환자 인 펩스-제이슨 문자

언급URL : https://stackoverflow.com/questions/16498286/why-does-the-php-json-encode-function-convert-utf-8-strings-to-hexadecimal-entit

반응형