《深入了解字符集和编码》的相关内容
相关讨论
Struts原理与实践(4)
本篇我们来讨论一下struts的国际化编程问题,即所谓的i18n编程问题,这一篇我们讨论其基础部分。与这个问题紧密相关的是在各java论坛中被频繁提及的中文乱码问题,因为,英、美编程人员较少涉及到中文乱码问题,因此,这方面的英文资料也是非常奇缺的,同时也很少找到这方面比较完整的中文资料,本文也尝试对中文乱码问题做一些探讨。要解决上述问题,需要有一定的字符集方面的知识,下面,我们就先介绍字符集的有关 ...
by letle 2007-01-10 浏览 (2759) 回复 (1) 关键字:
字符串编码(charset,encoding/decoding)问题原理
字符串编码(charset, encoding/decoding)问题原理
编码问题很重要,关于编码问题的文章也很多。我本来没有兴趣重复这个主题。
一个朋友问我有没有比较好的编码介绍文章。我记得以前看过几篇很不错的,但是当时搜索到的时候,就比较费劲,一时想不起来。于是,我就说,我攒一篇好了。
---------------------------------------
编码无处不在。Dat ...
by buaawhl 2006-10-31 浏览 (15416) 回复 (18) 关键字:
Web开发中的字符集问题和解决方案(完全版)
很多人在开发网站开始阶段没有注意到字符集统一的重要性,因此开发的网站不是数据库中存有乱码就是web页面显示为乱码。现以web开发中的字符集为主体讨论在个人和团队web开发中需要注意的问题,和相应的解决方法。
1. 常见问题的解决
比如我在网站开发阶段就遇到两个严重的问题:
我使用的是Zend studio的开发工具,保存代码时也是默认保存的,没有注意到字符集的问题,开始一切正常,但是当我想在 ...
by xombat 2007-05-06 浏览 (1703) 回复 (0) 关键字: php
《碰到的一个编码问题》的回答:UTF-8的汉字字节!
埋伏:
1、UTF-8用几个字节表示一个汉字?
这各答案你可能了解,但也可能不了解,我敢打保票一半人会不清楚(包括特意查资料之前的我)。
了解这个对编程有什么影响?
以下我把对yoolywu的回答,转为帖子发表,以表重视。
yollywu的问:引用系统有两个子系统,一个是BS的,一个是delphi做的CS,中间的数据传输是通过XML进行传输的。在XML传输的功能实现后,要求对XML进行加 ...
by Qieqie 2007-08-17 浏览 (4166) 回复 (15) 关键字:
相关博客
谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
文章一,本文转载自:http://fmddlmyy.home4u.china.com/text6.html
谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题:
问题一:
使用Windows记事本的“另存为”,可以在GBK、 ...
by saillanbo 2008-04-23 浏览 (103) 回复 (0) 关键字:
看到两个写的很好的关于字符集,编码的文章,推荐大家看看,另外纠正了一下原文中的小bug(UTF-8 UniCode UTF-16 UCS 等)
文章一,本文转载自:http://fmddlmyy.home4u.china.com/text6.html
谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题:
问题一:
使用Wi ...
by dreamstone 2006-11-28 浏览 (295) 回复 (0) 关键字:
JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础
第一篇:JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础
本部分采用重用,转载一篇文章来完成这部分的目标。
来源:holen'blog 对字符编码与Unicode,ISO 10646,UCS,UTF8,UTF16,GBK,GB2312的理解
地址:http://blog.donews.com/holen/archive/2004/11/ ...
by igogogo9 2007-07-25 浏览 (690) 回复 (0) 关键字: java字符编码
_关于字符编码_
Unicode:
unicode.org制定的编码机制, 要将全世界常用文字都函括进去.
在1.0中是16位编码, 由U+0000到U+FFFF. 每个2byte码对应一个字符; 在2.0开始抛弃了16位限制, 原来的16位作为基本位平面, 另外增加了16个位平面, 相当于20位编码, 编码范围0到0x10FFFF.
UCS:
ISO制定的ISO10646标准所定义的 Un ...
by warmheart_999 2007-05-17 浏览 (204) 回复 (0) 关键字: java
常用字符集编码的概要特性(二)
BIG5
Big5是双字节编码,高字节编码范围是0x81-0xFE,低字节编码范围是0x40-0x7E和0xA1-0xFE。和GBK相比,少了低字节是0x80-0xA0的组合。0x8140-0xA0FE是保留区域,用于用户造字区。
Big5收录的汉字只包括繁体汉字,不包括简体汉字,一些生僻的汉字也没有收录。GBK收录的日文假名字符、俄文字符Big5也没有收录。因为Big5当中收录的字符有限,因此有 ...
by kewb 2007-09-13 浏览 (87) 回复 (0) 关键字:
相关圈子讨论
有关字符和字符串的问题
这段代码
import std.stdio;
int main(char[][] args)
{
wchar[] p = "你好";
writefln(p);
return 0;
}
为什么输出的结果是"浣犲ソ"
难道是我什么概念没有搞清楚?
第二个问题,char不是UTF-8码的吗,为什么不能表示中文呢?
by codekitten 2007-06-29 浏览 (1962) 回复 (18)
有没有人愿意加入 dotmars 的开发
Dotmars 意图采用 .Net Framework 的总体设计,把 C# 实现的 Mono .net 类库移植到D语言。Dotmars 的实现中立于 tango 和 phobos,可以与二者之一同时使用。总之 dotmars 是一个面向D的对 .Net Framework 的改良和精炼。
.Mars 目前实现的部分有:
dotmars.base.random 线程安全随机数发生器
dotma ...
by oldrev 2007-04-29 浏览 (3132) 回复 (43)
在索引从数据库中读取的文档时的转码问题
环境:lucene2.0+pdfbox0.7.3+oracle10.2
中文分词jar包是IKAnalyzer.jar,很常用的。
我把文档以ordsys.orddoc类型存储的oracle数据库中,可以获取到数据的byte[]和inputstream,
InputStream is = ordDoc.getDataInStream();//获取inputstream
Document doc ...
by xxwang1984 2008-07-09 浏览 (113) 回复 (2)
VC编译器CL能不能指定源码的字符集?
VC2005
我的源码是UTF-8的,操作系统是中文的.
所以编译时候会出错.把源码文件换成gb2312就好了.
但是我需要源码是UTF-8编码的.
CL的参数中有没有设定源代码字符集的选项啊. 就像javac那样指定指定encoding.
我找了半天没找到.
by zjumty 2007-06-29 浏览 (726) 回复 (4)
喜欢发短信问问题的同学,请注意
有问题请发到圈子里。直接发短信给他人请教问题,是不礼貌的。以后我不会理会。
引用
2008-03-30 yanweidong 发给 我 的消息
标题: 关于lucene 索引的建立
正文:
你好.我在论坛上看到你的贴子.想请教你几个问题我最近要建立一个40W条数据库的索引.可是我用单线程来处理非常的慢.我想采用并发.但是我主要不是做 JAVA的.我是做PHP的.不知道你有没有这方面的代码可以参考 ...
by imjl 2008-04-03 浏览 (399) 回复 (3)
相关新闻
推荐知识库条目
Comming soon

