《什么是UTF-8,本文给出最正确解释》的相关内容
相关讨论
深入了解字符集和编码
一、什么是字符集?什么是编码?
字符(Character)是文字与符号的总称,包括文字、图形符号、数学符号等。
一组抽象字符的集合就是字符集(Charset)。
字符集常常和一种具体的语言文字对应起来,该文字中的所有字符或者大部分常用字符就构成了该文字的字符集,比如英文字符集。
一组有共同特征的字符也可以组成字符集,比如繁体汉字字符集、日文汉字字符集。
字符集的子集也是字符集。
计算机要处理各 ...
by hideto 2007-07-04 浏览 (3892) 回复 (3) 关键字: 字符集 编码
Struts原理与实践(4)
本篇我们来讨论一下struts的国际化编程问题,即所谓的i18n编程问题,这一篇我们讨论其基础部分。与这个问题紧密相关的是在各java论坛中被频繁提及的中文乱码问题,因为,英、美编程人员较少涉及到中文乱码问题,因此,这方面的英文资料也是非常奇缺的,同时也很少找到这方面比较完整的中文资料,本文也尝试对中文乱码问题做一些探讨。要解决上述问题,需要有一定的字符集方面的知识,下面,我们就先介绍字符集的有关 ...
by letle 2007-01-10 浏览 (2893) 回复 (1) 关键字:
字符串编码(charset,encoding/decoding)问题原理
字符串编码(charset, encoding/decoding)问题原理
编码问题很重要,关于编码问题的文章也很多。我本来没有兴趣重复这个主题。
一个朋友问我有没有比较好的编码介绍文章。我记得以前看过几篇很不错的,但是当时搜索到的时候,就比较费劲,一时想不起来。于是,我就说,我攒一篇好了。
---------------------------------------
编码无处不在。Dat ...
by buaawhl 2006-10-31 浏览 (16994) 回复 (18) 关键字:
相关博客
谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
文章一,本文转载自:http://fmddlmyy.home4u.china.com/text6.html
谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题:
问题一:
使用Windows记事本的“另存为”,可以在GBK、 ...
by saillanbo 2008-04-23 浏览 (149) 回复 (0) 关键字:
看到两个写的很好的关于字符集,编码的文章,推荐大家看看,另外纠正了一下原文中的小bug(UTF-8 UniCode UTF-16 UCS 等)
文章一,本文转载自:http://fmddlmyy.home4u.china.com/text6.html
谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题:
问题一:
使用Wi ...
by dreamstone 2006-11-28 浏览 (345) 回复 (0) 关键字:
用编码的发展详述Unicode
Unicode是一种字符编码规范 。
先从ASCII说起。ASCII是用来表示英文字符的一种编码规范,每个ASCII字符占用1个字节(8bits) 因此,ASCII编码可以表示的最大字符数是256,其实英文字符并没有那么多,一般只用前128个(最高位为0),其中包括了控制字符、数字、大小写字母和其他一些符号。
而最高位 ...
by fishermen 2006-09-27 浏览 (1470) 回复 (0) 关键字:
JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础
第一篇:JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础
本部分采用重用,转载一篇文章来完成这部分的目标。
来源:holen'blog 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
地址:http://blog.donews.com/holen/archive/2004/11/ ...
by igogogo9 2007-07-25 浏览 (800) 回复 (0) 关键字: java字符编码
JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础
这两天抽时间又总结/整理了一下各种编码的实际编码方式,和在Java应用中的使用情况,在这里记录下来以便日后参考。
为了构成一个完整的对文字编码的认识和深入把握,以便处理在Java开发过程中遇到的各种问题,特别是乱码问题,我觉得组成一个系列来描述和分析更好一些,包括三篇文章:
第一篇:JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础
第二篇:JAVA字符编码 ...
by muyuqian 2008-09-17 浏览 (64) 回复 (0) 关键字:
相关圈子讨论
有关字符和字符串的问题
这段代码
import std.stdio;
int main(char[][] args)
{
wchar[] p = "你好";
writefln(p);
return 0;
}
为什么输出的结果是"浣犲ソ"
难道是我什么概念没有搞清楚?
第二个问题,char不是UTF-8码的吗 ...
by codekitten 2007-06-29 浏览 (2195) 回复 (18)

