亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

? 歡迎來(lái)到蟲(chóng)蟲(chóng)下載站! | ?? 資源下載 ?? 資源專輯 ?? 關(guān)于我們
? 蟲(chóng)蟲(chóng)下載站

?? java 編程技術(shù)中漢字問(wèn)題的分析及解決(轉(zhuǎn)自ibm).txt

?? Java技術(shù)收集很多各種技術(shù)總結(jié)
?? TXT
?? 第 1 頁(yè) / 共 2 頁(yè)
字號(hào):
作者:sonymusic
email: sonymusic@china.com
日期:2000-12-18 1:13:46
[h1]Java 編程技術(shù)中漢字問(wèn)題的分析及解決[/h1]

段明輝
自由撰稿人
2000 年 11月 8日
[hr]在基于 Java 語(yǔ)言的編程中,我們經(jīng)常碰到漢字的處理及顯示的問(wèn)題。一大堆看不懂的亂碼肯定不是我們?cè)敢饪吹降娘@示效果,怎樣才能夠讓那些漢字正確顯示呢?Java 語(yǔ)言默認(rèn)的編碼方式是UNICODE ,而我們中國(guó)人通常使用的文件和數(shù)據(jù)庫(kù)都是基于 GB2312 或者 BIG5 等方式編碼的,怎樣才能夠恰當(dāng)?shù)剡x擇漢字編碼方式并正確地處理漢字的編碼呢?本文將從漢字編碼的常識(shí)入手,結(jié)合 Java 編程實(shí)例,分析以上兩個(gè)問(wèn)題并提出解決它們的方案。[hr]


現(xiàn)在 Java 編程語(yǔ)言已經(jīng)廣泛應(yīng)用于互聯(lián)網(wǎng)世界,早在 Sun 公司開(kāi)發(fā) Java 語(yǔ)言的時(shí)候,就已經(jīng)考慮到對(duì)非英文字符的支持了。Sun 公司公布的 Java 運(yùn)行環(huán)境(JRE)本身就分英文版和國(guó)際版,但只有國(guó)際版才支持非英文字符。不過(guò)在 Java 編程語(yǔ)言的應(yīng)用中,對(duì)中文字符的支持并非如同 Java Soft 的標(biāo)準(zhǔn)規(guī)范中所宣稱的那樣完美,因?yàn)橹形淖址恢灰粋€(gè),而且不同的操作系統(tǒng)對(duì)中文字符的支持也不盡相同,所以會(huì)有許多和漢字編碼處理有關(guān)的問(wèn)題在我們進(jìn)行應(yīng)用開(kāi)發(fā)中困擾著我們。有很多關(guān)于這些問(wèn)題的解答,但都比較瑣碎,并不能夠滿足大家迫切解決問(wèn)題的愿望,關(guān)于 Java 中文問(wèn)題的系統(tǒng)研究并不多,本文從漢字編碼常識(shí)出發(fā),分析 Java 中文問(wèn)題,希望對(duì)大家解決這個(gè)問(wèn)題有所幫助。

[b]漢字編碼的常識(shí)[/b]

我們知道,英文字符一般是以一個(gè)字節(jié)來(lái)表示的,最常用的編碼方法是 ASCII 。但一個(gè)字節(jié)最多只能區(qū)分256個(gè)字符,而漢字成千上萬(wàn),所以現(xiàn)在都以雙字節(jié)來(lái)表示漢字,為了能夠與英文字符分開(kāi),每個(gè)字節(jié)的最高位一定為1,這樣雙字節(jié)最多可以表示64K格字符。我們經(jīng)常碰到的編碼方式有 GB2312、BIG5、UNICODE 等。關(guān)于具體編碼方式的詳細(xì)資料,有興趣的讀者可以查閱相關(guān)資料。我膚淺談一下和我們關(guān)系密切的 GB2312 和 UNICODE。GB2312 碼,中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)漢字信息交換用編碼,是一個(gè)由中華人民共和國(guó)國(guó)家標(biāo)準(zhǔn)總局發(fā)布的關(guān)于簡(jiǎn)化漢字的編碼,通行于中國(guó)大陸地區(qū)及新加坡,簡(jiǎn)稱國(guó)標(biāo)碼。兩個(gè)字節(jié)中,第一個(gè)字節(jié)(高字節(jié))的值為區(qū)號(hào)值加32(20H),第二個(gè)字節(jié)(低字節(jié))的值為位號(hào)值加32(20H),用這兩個(gè)值來(lái)表示一個(gè)漢字的編碼。UNICODE 碼是微軟提出的解決多國(guó)字符問(wèn)題的多字節(jié)等長(zhǎng)編碼,它對(duì)英文字符采取前面加“0”字節(jié)的策略實(shí)現(xiàn)等長(zhǎng)兼容。如 “A” 的 ASCII 碼為0x41,UNICODE 就為0x00,0x41。利用特殊的工具各種編碼之間可以互相轉(zhuǎn)換。

[b]Java 中文問(wèn)題的初步認(rèn)識(shí)[/b]

我們基于 Java 編程語(yǔ)言進(jìn)行應(yīng)用開(kāi)發(fā)時(shí),不可避免地要處理中文。Java 編程語(yǔ)言默認(rèn)的編碼方式是 UNICODE,而我們通常使用的數(shù)據(jù)庫(kù)及文件都是基于 GB2312 編碼的,我們經(jīng)常碰到這樣的情況:瀏覽基于 JSP 技術(shù)的網(wǎng)站看到的是亂碼,文件打開(kāi)后看到的也是亂碼,被 Java 修改過(guò)的數(shù)據(jù)庫(kù)的內(nèi)容在別的場(chǎng)合應(yīng)用時(shí)無(wú)法繼續(xù)正確地提供信息。 

String sEnglish = “apple”; 

String sChinese = “蘋果”; 

String s = “蘋果 apple ”; 

sEnglish 的長(zhǎng)度是5,sChinese的長(zhǎng)度是4,而 s 默認(rèn)的長(zhǎng)度是14。對(duì)于 sEnglish來(lái)說(shuō), Java 中的各個(gè)類都支持得非常好,肯定能夠正確顯示。但對(duì)于 sChinese 和 s 來(lái)說(shuō),雖然 Java Soft 聲明 Java 的基本類已經(jīng)考慮到對(duì)多國(guó)字符的支持(默認(rèn) UNICODE 編碼),但是如果操作系統(tǒng)的默認(rèn)編碼不是 UNICODE ,而是國(guó)標(biāo)碼等。從 Java 源代碼到得到正確的結(jié)果,要經(jīng)過(guò) “Java 源代碼-> Java 字節(jié)碼-> ;虛擬機(jī)->操作系統(tǒng)->顯示設(shè)備”的過(guò)程。在上述過(guò)程中的每一步驟,我們都必須正確地處理漢字的編碼,才能夠使最終的顯示結(jié)果正確。 

“ Java 源代碼-> Java 字節(jié)碼”,標(biāo)準(zhǔn)的 Java 編譯器 javac 使用的字符集是系統(tǒng)默認(rèn)的字符集,比如在中文 Windows 操作系統(tǒng)上就是 GBK ,而在 Linux 操作系統(tǒng)上就是ISO-8859-1,所以大家會(huì)發(fā)現(xiàn)在 Linux 操作系統(tǒng)上編譯的類中源文件中的中文字符都出了問(wèn)題,解決的辦法就是在編譯的時(shí)候添加 encoding 參數(shù),這樣才能夠與平臺(tái)無(wú)關(guān)。用法是 

javac –encoding GBK。 

“ Java 字節(jié)碼->虛擬機(jī)->操作系統(tǒng)”, Java 運(yùn)行環(huán)境 (JRE) 分英文版和國(guó)際版,但只有國(guó)際版才支持非英文字符。 Java 開(kāi)發(fā)工具包 (JDK) 肯定支持多國(guó)字符,但并非所有的計(jì)算機(jī)用戶都安裝了 JDK 。很多操作系統(tǒng)及應(yīng)用軟件為了能夠更好的支持 Java ,都內(nèi)嵌了 JRE 的國(guó)際版本,為自己支持多國(guó)字符提供了方便。 

“操作系統(tǒng)->顯示設(shè)備”,對(duì)于漢字來(lái)說(shuō),操作系統(tǒng)必須支持并能夠顯示它。英文操作系統(tǒng)如果不搭配特殊的應(yīng)用軟件的話,是肯定不能夠顯示中文的。 

還有一個(gè)問(wèn)題,就是在 Java 編程過(guò)程中,對(duì)中文字符進(jìn)行正確的編碼轉(zhuǎn)換。例如,向網(wǎng)頁(yè)輸出中文字符串的時(shí)候,不論你是用 

out.println(string);       // string 是含中文的字符串 

還是用 

<%=string%>,都必須作 UNICODE 到 GBK 的轉(zhuǎn)換,或者手動(dòng),或者自動(dòng)。在 JSP 1.0中,可以定義輸出字符集,從而實(shí)現(xiàn)內(nèi)碼的自動(dòng)轉(zhuǎn)換。用法是 

<%@page ContentType=”text/html;charset=gb2312” %> 

但是在一些 JSP 版本中并沒(méi)有提供對(duì)輸出字符集的支持,(例如 JSP 0.92),這就需要手動(dòng)編碼輸出了,方法非常多。最常用的方法是 

String s1 = request.getParameter(“keyword”); 

String s2 = new String(s1.getBytes(“ISO-8859-1”),”GBK”); 

getBytes 方法用于將中文字符以“ISO-8859-1”編碼方式轉(zhuǎn)化成字節(jié)數(shù)組,而“GBK” 是目標(biāo)編碼方式。我們從以ISO-8859-1方式編碼的數(shù)據(jù)庫(kù)中讀出中文字符串 s1 ,經(jīng)過(guò)上述轉(zhuǎn)換過(guò)程,在支持 GBK 字符集的操作系統(tǒng)和應(yīng)用軟件中就能夠正確顯示中文字符串 s2 。 

[b]Java 中文問(wèn)題的表層分析及處理[/b]

背景 
 
開(kāi)發(fā)環(huán)境 
 JDK1.15 
 Vcafe2.0 
 JPadPro 
 
服務(wù)器端 
 NT IIS 
 Sybase System 
 Jconnect(JDBC) 
 
客戶端 
 IE5.0 
 Pwin98 
   
 

.CLASS 文件存放在服務(wù)器端,由客戶端的瀏覽器運(yùn)行 APPLET , APPLET 只起調(diào)入 FRAME 類等主程序的作用。界面包括 Textfield ,TextArea,List,Choice 等。 

I.       取中文 

用 JDBC 執(zhí)行 SELECT 語(yǔ)句從服務(wù)器端讀取數(shù)據(jù)(中文)后,將數(shù)據(jù)用 APPEND 方法加到 TextArea(TA) ,不能正確顯示。但加到 List 中時(shí),大部分漢字卻可正確顯示。 

將數(shù)據(jù)按“ISO-8859-1” 編碼方式轉(zhuǎn)化為字節(jié)數(shù)組,再按系統(tǒng)缺省編碼方式 (Default Character Encoding) 轉(zhuǎn)化為 STRING ,即可在 TA 和 List 中正確顯示。 

程序段如下: 

dbstr2 = results.getString(1); 

//After reading the result from DB server,converting it to string. 

dbbyte1 = dbstr2.getBytes(“iso-8859-1”); 

dbstr1 = new String(dbbyte1); 

在轉(zhuǎn)換字符串時(shí)不采用系統(tǒng)默認(rèn)編碼方式,而直接采用“ GBK” 或者 “GB2312” ,在 A 和 B 兩種情況下,從數(shù)據(jù)庫(kù)取數(shù)據(jù)都沒(méi)有問(wèn)題。 

II.    寫中文到數(shù)據(jù)庫(kù) 

處理方式與“取中文”相逆,先將 SQL 語(yǔ)句按系統(tǒng)缺省編碼方式轉(zhuǎn)化為字節(jié)數(shù)組,再按“ISO-8859-1”編碼方式轉(zhuǎn)化為 STRING ,最后送去執(zhí)行,則中文信息可正確寫入數(shù)據(jù)庫(kù)。 

程序段如下: 

sqlstmt = tf_input.getText(); 

//Before sending statement to DB server,converting it to sql statement. 

dbbyte1 = sqlstmt.getBytes(); 

sqlstmt = newString(dbbyte1,”iso-8859-1”); 

_stmt = _con.createStatement(); 

_stmt.executeUpdate(sqlstmt); 

…… 

問(wèn)題:如果客戶機(jī)上存在 CLASSPATH 指向 JDK 的 CLASSES.ZIP 時(shí)(稱為 A 情況),上述程序代碼可正確執(zhí)行。但是如果客戶機(jī)只有瀏覽器,而沒(méi)有 JDK 和 CLASSPATH 時(shí)(稱為 B 情況),則漢字無(wú)法正確轉(zhuǎn)換。 

我們的分析: 

1.經(jīng)過(guò)測(cè)試,在 A 情況下,程序運(yùn)行時(shí)系統(tǒng)的缺省編碼方式為 GBK 或者 GB2312 。在 B 情況下,程序啟動(dòng)時(shí)瀏覽器的 JAVA 控制臺(tái)中出現(xiàn)如下錯(cuò)誤信息: 

Can't find resource for sun.awt.windows.awtLocalization_zh_CN 

然后系統(tǒng)的缺省編碼方式為“8859-1”。 

2.如果在轉(zhuǎn)換字符串時(shí)不采用系統(tǒng)缺省編碼方式,而是直接采用 “GBK” 或“GB2312”,則在 A 情況下程序仍然可正常運(yùn)行,在 B 情況下,系統(tǒng)出現(xiàn)錯(cuò)誤: 

UnsupportedEncodingException。 

3.在客戶機(jī)上,把 JDK 的 CLASSES.ZIP 解壓后,放在另一個(gè)目錄中, CLASSPATH 只包含該目錄。然后一邊逐步刪除該目錄中的 .CLASS 文件,另一邊運(yùn)行測(cè)試程序,最后發(fā)現(xiàn)在一千多個(gè) CLASS 文件中,只有一個(gè)是必不可少的,該文件是: 

sun.io.CharToByteDoubleByte.class。 

將該文件拷到服務(wù)器端和其它的類放在一起,并在程序的開(kāi)頭 IMPORT 它,在 B 情況下程序仍然無(wú)法正常運(yùn)行。 

4.在 A 情況下,如果在 CLASSPTH 中去掉 sun.io.CharToByteDoubleByte.class ,則程序運(yùn)行時(shí)測(cè)得默認(rèn)編碼方式為“8859-1”,否則為 “GBK” 或 “GB2312” 。 

如果 JDK 的版本為1.2以上的話,在 B 情況下遇到的問(wèn)題得到了很好的解決,測(cè)試的步驟同上,有興趣的讀者可以嘗試一下。 

[/b]Java 中文問(wèn)題的根源分析及解決[/b]

在簡(jiǎn)體中文 MS Windows 98 + JDK 1.3 下,可以用 System.getProperties() 得到 Java 運(yùn)行環(huán)境的一些基本屬性,類 PoorChinese 可以幫助我們得到這些屬性。 

類 PoorChinese 的源代碼: 

public class PoorChinese { 

   public static void main(String[] args) { 

       System.getProperties().list(System.out); 

   } 

} 

執(zhí)行 java PoorChinese 后,我們會(huì)得到: 

系統(tǒng)變量 file.encoding 的值為 GBK ,user.language 的值為 zh , user.region 的值為 CN ,這些系統(tǒng)變量的值決定了系統(tǒng)默認(rèn)的編碼方式是 GBK 。 

在上述系統(tǒng)中,下面的代碼將 GB2312 文件轉(zhuǎn)換成 Big5 文件,它們能夠幫助我們理解 Java 中漢字編碼的轉(zhuǎn)化: 

  

import java.io.*; 

import java.util.*; 

  

public class gb2big5 { 

  

static int iCharNum=0; 

  

public static void main(String[] args) { 

System.out.println("Input GB2312 file, output Big5 file."); 

?? 快捷鍵說(shuō)明

復(fù)制代碼 Ctrl + C
搜索代碼 Ctrl + F
全屏模式 F11
切換主題 Ctrl + Shift + D
顯示快捷鍵 ?
增大字號(hào) Ctrl + =
減小字號(hào) Ctrl + -
亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
国产精品99久久久久久久vr| 国产露脸91国语对白| 91精品国产手机| 欧美日韩精品一区二区三区蜜桃| 亚洲一区在线观看免费观看电影高清 | 精品久久久久一区| 在线观看一区二区视频| 91成人在线精品| 高清视频一区二区| 中文字幕制服丝袜成人av| 亚洲国产精品国自产拍av| 99久久久国产精品免费蜜臀| 亚洲人成网站影音先锋播放| 欧美色倩网站大全免费| 麻豆国产一区二区| www激情久久| 99国产欧美久久久精品| 五月婷婷激情综合| 精品久久久久久无| 99精品1区2区| 青青国产91久久久久久| 国产日韩欧美综合一区| 色欲综合视频天天天| 秋霞电影一区二区| 国产欧美一区二区精品性色 | 99精品国产热久久91蜜凸| 亚洲成人动漫在线观看| 久久久久久一二三区| 色婷婷久久综合| 国内欧美视频一区二区| 一区二区三区在线视频播放| 精品国产伦一区二区三区观看体验| 成人精品高清在线| 蜜桃av噜噜一区| 最新高清无码专区| 精品成人佐山爱一区二区| 色婷婷精品久久二区二区蜜臂av | 欧洲人成人精品| 国产精品一区专区| 天堂一区二区在线| 日韩久久一区二区| 久久先锋影音av鲁色资源网| 日本精品视频一区二区三区| 国产一区二区三区最好精华液| 亚洲乱码国产乱码精品精的特点 | 亚洲狠狠爱一区二区三区| 日韩一级免费一区| 成人app软件下载大全免费| 亚洲综合丁香婷婷六月香| 久久综合五月天婷婷伊人| 91视频国产观看| 日韩精品电影在线观看| 日韩免费成人网| 在线观看视频一区| 国产精品亚洲一区二区三区妖精| 亚洲综合在线视频| 国产亚洲污的网站| 777亚洲妇女| 99精品视频一区| 狠狠色伊人亚洲综合成人| 亚洲一区二区三区精品在线| 国产三级精品视频| 日韩一区二区三区四区五区六区| 91小视频在线免费看| 国内精品国产三级国产a久久| 国产日产欧美一区| 91精品国产综合久久福利| 欧美午夜精品一区二区三区| 国产电影精品久久禁18| 免费观看久久久4p| 亚洲国产成人精品视频| 亚洲视频你懂的| 欧美成va人片在线观看| 欧美放荡的少妇| 色综合久久久久网| 成人午夜私人影院| 国产一级精品在线| 久久99精品国产.久久久久久| 亚洲国产毛片aaaaa无费看| 亚洲精品久久嫩草网站秘色| 国产校园另类小说区| 欧美一区二区三区视频| 欧美日韩极品在线观看一区| 色婷婷综合久久久中文字幕| 成人动漫一区二区三区| 国产福利一区在线| 激情五月婷婷综合| 久久精品久久99精品久久| 日韩综合小视频| 图片区日韩欧美亚洲| 午夜精品久久久久久久久久久 | 国产精品国产三级国产aⅴ入口 | 日韩伦理电影网| 国产精品成人网| 国产精品国产精品国产专区不片| 久久久精品蜜桃| 日韩小视频在线观看专区| 欧美麻豆精品久久久久久| 欧美日韩国产在线播放网站| 欧美日韩的一区二区| 欧美日本在线播放| 日本福利一区二区| 欧美性一二三区| 精品视频在线免费看| 欧美成人r级一区二区三区| 精品福利av导航| 久久精品男人的天堂| 日本一区免费视频| 亚洲人成精品久久久久久 | 成人av在线一区二区三区| 国产精品18久久久久久久久久久久 | 国产酒店精品激情| 成人avav在线| 在线视频你懂得一区二区三区| 欧美午夜电影一区| 欧美精品电影在线播放| 精品国产123| 亚洲欧洲三级电影| 午夜精品福利视频网站 | 日韩电影一二三区| 精品一二三四区| 成人激情动漫在线观看| 色婷婷精品久久二区二区蜜臀av | 日韩美一区二区三区| 国产精品进线69影院| 一区二区成人在线| 国产在线视频一区二区三区| 99久久免费精品| 91精品国产美女浴室洗澡无遮挡| 久久一二三国产| 亚洲精品免费在线播放| 麻豆精品一区二区av白丝在线| 成人黄色av电影| 欧美一级淫片007| 亚洲美女视频一区| 青青青伊人色综合久久| 国产剧情在线观看一区二区| 97久久超碰精品国产| 日韩一区二区免费电影| 国产精品美女一区二区| 蜜臀av一区二区在线免费观看| 成人激情电影免费在线观看| 欧美一级理论性理论a| 亚洲视频一区二区在线| 免费成人在线影院| 91网站在线观看视频| 精品久久久久99| 亚洲一区二区3| gogo大胆日本视频一区| 精品国精品自拍自在线| 亚洲mv在线观看| 欧美亚洲综合一区| 亚洲欧美日韩在线播放| 91网站在线观看视频| 中文字幕在线免费不卡| 成人午夜精品一区二区三区| 国产日韩精品一区二区三区在线| 精品一区免费av| 精品国产乱码久久久久久闺蜜| 久久精品久久精品| 欧美一区二区三区四区五区 | 天天综合日日夜夜精品| 99re6这里只有精品视频在线观看| 日韩你懂的在线播放| 亚洲国产人成综合网站| 一本在线高清不卡dvd| 国产精品女同互慰在线看| 国产一区二区在线视频| 91麻豆精品国产无毒不卡在线观看| 亚洲精选视频免费看| 成人激情午夜影院| 中文字幕乱码日本亚洲一区二区| 日韩电影在线观看电影| 色香蕉成人二区免费| 专区另类欧美日韩| 91欧美激情一区二区三区成人| 中文天堂在线一区| 国产美女精品人人做人人爽| 精品欧美久久久| 激情综合亚洲精品| 欧美一二三四在线| 久久精品国产亚洲高清剧情介绍| 在线观看一区二区精品视频| 夜夜精品浪潮av一区二区三区| 91丝袜国产在线播放| 亚洲三级在线观看| 日本黄色一区二区| 午夜激情久久久| 69堂精品视频| 久久99精品久久久久久国产越南 | 日本一区二区不卡视频| 成人免费观看av| 国产精品国产三级国产aⅴ中文 | 秋霞电影网一区二区| 欧美一区二区成人| 国产在线视频一区二区三区| 国产午夜久久久久| 成人免费视频caoporn| 亚洲欧洲av另类| 日本大香伊一区二区三区|