JavaScript截取中英文混雜的字符串
問題描述
比如獲取到微信的昵稱之后,如果不能超過8個長度的漢字,超過之后使用"..."表示,但是昵稱中可能也含有英文,但是單個英文字符占的長度并沒有單個漢字的長度長,也就是英文占用一個字符,漢字是占用兩個字符。但是JavaScript中的一些slice和subStr的方法,使用的都是字符串的長度,截取的并不標準,所以只能變通的使用其他方法
問題細化
如何區分中英文,
- 可使用Unicode編碼進行區分,可以獲得字符串的長度
//英文的Unicode編碼區間,其他的都可以表示為漢字的Unicode
charCode >= 0 && charCode <= 128
- encodeURI() 函數可把字符串作為 URI 進行編碼。返回值:URIstring 的副本,其中的某些字符將被十六進制的轉義序列進行替換。
說明:該方法不會對 ASCII 字母和數字進行編碼,也不會對這些 ASCII 標點符號進行編碼: - _ . ! ~ * ' ( ) 。
該方法的目的是對 URI 進行完整的編碼,因此對以下在 URI 中具有特殊含義的 ASCII 標點符號,encodeURI() 函數是不會進行轉義的:;/?:@&=+$,#
var a= '李'
undefined
var b=encodeURI(a)
undefined
b
"%E6%9D%8E"
b.length
9
var aa='f'
var bb = encodeURI(aa)
undefined
bb
"f"
bb.length
1
所以只有當中文字符的encodeURI的長度是大于4的。
代碼為上
function getLength(str){
var strLength=0; // 記錄str的總長度
var Len = str.length;
for(let i=0;i<Len;i++){
var charCode = str.charCodeAt(i);// 使用charCodeAt返回單個字符的Unicode編碼
if(charCode>=0 && charCode<=128){
strLength++; //英文字符加1
}else {
strLength= strLength+2;//中文字符加2
}
}
return strLength;
}
function subStrNum(str,len) {
var strLen = str.length;
var strCut = '';
var strLength =0;
for(let i=0;i<strLen;i++){
var charStr = str.charAt(i); //使用charAt獲取單個字符;
strLength++
if(encodeURI(charStr).length>4){ //使用encodeURI獲取編碼長度
strLength++;
}
strCut = strCut.concat(charStr);//單個字符進行合并
if(strLength >= len){
strCut = strCut.concat('...') //大于指定長度后合并'...'并返回此字符串
return strCut;
}
}
if(strLength<len){
return str
}
}
var a = "你dont 知道我的心"
getLength(a)
subStrNum(a,8)
console.log("getLength",getLength(a))
console.log("subStr",subStrNum(a,8))