gbk怎么转换成utf8(gbk怎么转换成utf-8)-冯金伟博客园

如何将gbk编码的字符串转换成utf

GBK编码的文本,将其转换为UTF的方法

1.先打开一个文档,可以是txt、doc、docx,只要是word支持的。

2.可以先检查一下这个文档当前的编码方式,点击左上角的文件,然后选择选项。

3.向下滚动到常规部分,然后单击Web选项。

4.选择编码,然后您将看到当前的编码方法。我们这边是GB2312。

5.假设你要转换成UTF-8编码,那么此时点击另存为,弹出保存的弹出框,然后点击工具选择Web选项。

6.选择相同的编码,将GB2312更改为UTF-8,然后单击“确定”。

7.点击保存后,文档解码成功。

小刚SEO为你解答。

dede模板文件UTF-8编码与GBK编码如何互相转换?

GBK(gb2312)织梦dede模板文件转换为UTF-8编码dede模板文件第一步:把每个模板的头部<metahttp-equiv=”Content-Type”content=”text/html;charset=gb2312″>改为<metahttp-equiv=”Content-Type”content=”text/html;charset=utf-8″/>第二步:把所有的模板文件用editplus(文本编辑软件,很好用,网上很多下载)打开,选择“文档/文件编码方式/批量更改文件编码方式”菜单,然后选中全部打开的文件,然后选择utf-8,点确定,全部转化格式,即可。UTF-8编码织梦dede模板转换为GBK(gb2312)步骤同上。备注:editplus到多特或者crsky下载,很好用。

如何将WCHAR转成std:string?

C++11的std::wstring_convert配合std::codecvt模板类完全可以解决这个问题,不会出现

@vczh

所说修改了全局locale会导致污染其他库的问题。

这两个模板类的功能是:

std::wstring_convert:转码器,接收一个类似codecvt描述编码转换特性的模板参数,用于将本地化的宽字符wstring和指定编码的字节化string进行互转。

std::codecvt:编码转换特性类,用在wstring_convert的模板参数中来指定使用哪种编码。

所以编码A和B互转的实现方式就是:借助本地化宽字符串,先将以A编码的string转为本地化的wstring,再将本地化的wstring转为B编码后的string。

codecvt一般使用下面两个特化子类:
std::codecvt_utf8<wchar_t>:用于UTF8和本地化wchar_t的互转
std::codecvt_byname<wchat_t, char, std::mbstate_t>:用于其他编码(例如GBK)和本地化wchar_t的互转,类的构造函数需要传入编码的locale name,

由于编码的locale name是操作系统决定的(例如GBK在linux下的locale名可能是”zh_CN.GBK”,而windows下是”.936″),因此做跨平台的话仍然要给不同的系统做适配。

这里给一个windows下,GBK string转UTF8 string的例子:首先将GBK string转wstring

再将wstring转为UTF8 string转码就完成了。utf8_str里的内容应该是”xE7x83xAB”(烫的UTF8)。

如何将许多ANSI格式的txt文档批量转换成UTF8格式?

假设你的文件是ansi(gbk),用Replace Pioneer批量转换为UTF8的方法如下:

第一步:选文件 1.打开Tools->Batch Runner菜单 2.点击Pick Files,用鼠标对需要处理的多个文件进行多选。

第二步:变换编码 1.点击Change Encode按钮 2.点击input encoding,设置成CN->gbk 3.点击output encoding,设置成utf-8 4.点击start,完成 注:如果你想把输出保存到新文件里,可以在点击Start之前修改set output filename,把它从${FILENAME}改成新的规则,比如${FILENAME}.new,还要注意备份,以防操作失误。 另外,你还可以把输出保存到新文件夹里。

如果你要的utf-8文件带BOM标识,需要选utf-8-BOM而不是utf-8

linux下怎么把文件转化字符集?

将gbk编码的文件转化为utf8编码, 将转化后的结果存到file.utf8中

iconv -f gbk -t utf8 file.gbk -o file.utf8

从oracle中取出的数据是gbk字符集格式的,如何转换成UTF-8字符集?

Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储,处理,检索数据。

它使数据库工具,错误消息,排序次序,日期,时间,货币,数字,和日历自动适应本地化语言和平台。 影响Oracle数据库字符集最重要的参数是NLS_LANG参数。它的格式如下: NLS_LANG = language_territory.charset它有三个组成部分(语言、地域和字符集),每个成分控制了NLS子集的特性。

其中:Language: 指定服务器消息的语言, 影响提示信息是中文还是英文Territory: 指定服务器的日期和数字格式,Charset: 指定字符集。如:AMERICAN _ AMERICA. ZHS16GBK从NLS_LANG的组成我们可以看出,真正影响数据库字符集的其实是第三部分。所以两个数据库之间的字符集只要第三部分一样就可以相互导入导出数据,前面影响的只是提示信息是中文还是英文。