I has an issue with parsing unicode tag. Input: `<リンク> This a second unicode tag</リンク>` Expected output: `<リンク> This a second unicode tag</リンク>` Real output: `<�リンク> This a second unicode tag</リンク>` I don't know why there is `�` here.