博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Java unicode中文编码转换和反转
阅读量:6582 次
发布时间:2019-06-24

本文共 1340 字,大约阅读时间需要 4 分钟。

参考网址

在java的很多配置文件中,尤其是国际化资源中经常遇到类似\uf432这样的unicode编码,搜集了下该编码相关的资料,大致处理方法有如下:

1、Unicode转 汉字字符串。

这个过程最简单的方式就是直接获取。比如

String cnStr = "\ufeff\u4e2d\u56fd\u4eba";

System.out.println(cnStr); 即可获取对应的汉字字符  “中国人”;

但是呢,每次从输出读的话也未免过于不方便了,我们使用方法来做转换,直接获取。

参考如下

public static String unicodeToString(String str) {        Pattern pattern = Pattern.compile("(\\\\u(\\p{XDigit}{4}))");            Matcher matcher = pattern.matcher(str);        char ch;        while (matcher.find()) {            ch = (char) Integer.parseInt(matcher.group(2), 16);            str = str.replace(matcher.group(1), ch + "");            }        return str;    }

2、获取字符串的unicode编码,这个我们可以通过直接获取字符串的unicode二进制,然后将其byte转换成对应的16进制表示即可,函数示例如下

static String getUnicode(String s) {		try {			StringBuffer out = new StringBuffer("");			byte[] bytes = s.getBytes("unicode");			for (int i = 0; i < bytes.length - 1; i += 2) {				out.append("\\u");				String str = Integer.toHexString(bytes[i + 1] & 0xff);				for (int j = str.length(); j < 2; j++) {					out.append("0");				}				String str1 = Integer.toHexString(bytes[i] & 0xff);				out.append(str1);				out.append(str);							}			return out.toString();		} catch (UnsupportedEncodingException e) {			e.printStackTrace();			return null;		}	}

 

通过上面的方式便可完整的使用unicode编码了,大家有其他方式的转换也可以告诉我下,互相学习

转载于:https://www.cnblogs.com/xignzou/p/3329438.html

你可能感兴趣的文章
解决 Ubuntu 16.04 LTSSublime text3中文问题
查看>>
mysql主从复制实现数据库同步
查看>>
面试-1
查看>>
CentOS自动登录Gnome
查看>>
第一章,重点总结
查看>>
LeetCode - 49. Group Anagrams
查看>>
移动前端不得不了解的html5 head 头标签
查看>>
Tomcat 服务器性能优化
查看>>
【框架学习】ibatis DAO框架分析
查看>>
ZOJ 3640 Help Me Escape
查看>>
putty与emacs
查看>>
C#下实现的半角转与全角的互转
查看>>
PreparedStatement vs Statement
查看>>
使用texturePaker批量转化pvr为pn
查看>>
自我介绍
查看>>
截取指定网站Html编码
查看>>
作业一 统计软件简介与数据操作
查看>>
css布局
查看>>
HBase-java api 基本操作
查看>>
POJ2229 Sumsets
查看>>