Re: RFR: 8285255: refine StringLatin1.regionMatchesCI_UTF16 [v3]

XenoAmess Mon, 25 Apr 2022 13:16:49 -0700

On Mon, 25 Apr 2022 15:10:01 GMT, Claes Redestad <[email protected]> wrote:


> Unfortunately this leads to an error for case-insensitive `regionMatches` 
> between a latin-1-string that contains either of `\u00b5` or `\u00ff` (these 
> two code-points have upper case codepoints outside of the latin-1 range) and 
> a UTF-16 string:
> 
> ```
> jshell> "\u00b5".regionMatches(true, 0, "\u0100", 0, 1)
> |  Exception java.lang.ArrayIndexOutOfBoundsException: Index 924 out of 
> bounds for length 256
> |        at CharacterDataLatin1.getProperties (CharacterDataLatin1.java:74)
> |        at CharacterDataLatin1.toLowerCase (CharacterDataLatin1.java:140)
> |        at StringLatin1.regionMatchesCI_UTF16 (StringLatin1.java:420)
> |        at String.regionMatches (String.java:2238)
> |        at (#4:1)
> ```

@cl4es Yes, you are correct.

And if change it to `CharacterDataLatin1.instance.toLowerCase(u1)`, it would 
strongly harm performance.

-------------

PR: https://git.openjdk.java.net/jdk/pull/8308

Re: RFR: 8285255: refine StringLatin1.regionMatchesCI_UTF16 [v3]

Reply via email to