JavaScript字符串常见基础方法精讲

本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于字符串的相关知识,其中主要介绍了常用的基础方法以及特殊字符、emoji内部表示方式等内容,下面一起来看一下,希望对大家有帮助。

JavaScript字符串常见基础方法精讲

【相关推荐:javascript视频教程、web前端】

不论在何种编程语言中,字符串都是重要的数据类型,跟随我了解更多JavaScript字符串知识吧!

前言

字符串就是由字符组成的串,如果学习过C、Java就应该知道,字符本身也可以独立成为一个类型。但是,JavaScript没有单个的字符类型,只有长度为1的字符串。

立即学习“Java免费学习笔记(深入)”;

JavaScript的字符串采用固定的UTF-16编码,不论我们编写程序时采用何种编码,都不会影响。

写法

字符串有三种写法:单引号、双引号、反引号。

let single = 'abcdefg';//单引号let double = "asdfghj";//双引号let backti = `zxcvbnm`;//反引号

登录后复制

单、双引号具有相同的地位,我们不做区分。

字符串格式化

反引号允许我们使用${…}优雅的格式化字符串,取代使用字符串加运算。

let str = `I'm ${Math.round(18.5)} years old.`;console.log(str);

登录后复制

代码执行结果:

JavaScript字符串格式化

多行字符串

反引号还可以允许字符串跨行,当我们编写多行字符串的时候非常有用。

let ques = `Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;`;console.log(ques);

登录后复制

代码执行结果:

Javascript多行字符串

是不是看起来觉得也没有什么?但是使用单双引号是不能实现的,如果想要得到同样的结果可以这么写:

let ques = 'Is the author handsome?A. Very handsome;B. So handsome;C. Super handsome;';console.log(ques);

登录后复制

以上代码包含了一个特殊字符,它是我们编程过程中最常见的特殊字符了。

特殊字符

字符又名”换行符”,支持单双引号输出多行字符串。当引擎输出字符串时,若遇到,就会另换一行继续输出,从而实现多行字符串。

虽然看起来是两个字符,但是只占用一个字符位置,这是因为在字符串中是转义符,被转义符修饰的字符就变成了特殊字符。

特殊字符列表

特殊字符 描述

换行符,用于新起一行输出文字。回车符,将光标移到行首,在Windows系统中使用表示一个换行,意思是光标需要先到行首,然后再到下一行才可以换一个新的行。其他系统直接使用就可以了。’ “单双引号,主要是因为单双引号是特殊字符,我们想在字符串中使用单双字符就要转义。\反斜杠,同样因为是特殊字符,如果我们就是想输出本身,就要对其转义。 退格、换页、垂直标签——已经不再使用。xXX编码为XX的十六进制Unicode字符,例如:z表示z(z的十六进制Unicode编码为7A)。uXXXX编码为XXXX的十六进制Unicode字符,例如:u00A9表示 © 。u{X…X}(1-6个十六进制字符)UTF-32编码为X…X的Unicode符号。

举个例子:

console.log('I'm a student.');// 'console.log(""I love U"");// "console.log("\n is new line character.");// console.log('u00A9')// ©console.log('u{1F60D}');//

登录后复制

代码执行结果:

image-20220521094739815

有了转义符的存在,理论上我们可以输出任何字符,只要找到它对应的编码就可以了。

避免使用’、”

对于字符串中的单双引号,我们可以通过在单引号中使用双引号、在双引号中使用单引号,或者直接在反引号中使用单双引号,就可以巧妙的避免使用转义符,例如:

console.log("I'm a student.");//双引号中使用单引号console.log('"" is used.');//单引号中使用双引号console.log(`' " is used.`);//反引号中使用单双引号

登录后复制

代码执行结果如下:

image-20220521095240675

.length

通过字符串的.length属性,我们可以获得字符串的长度:

console.log("HelloWorld".length);//11

登录后复制

这里只占用了一个字符。

《基础类型的方法》章节我们探究了JavaScript中的基础类型为什么会有属性和方法,你还记得吗?

访问字符、charAt()、for…of

字符串是字符组成的串,我们可以通过[字符下标]访问单个的字符,字符下标从0开始:

let str = "The author is handsome.";console.log(str[0]);//Tconsole.log(str[4]);//aconsole.log(str[str.length-1]);//.

登录后复制

代码执行结果:

image-20220521101101707

我们还可以使用charAt(post)函数获得字符:

let str = "The author is handsome.";console.log(str.charAt(0));//Tconsole.log(str.charAt(4));//aconsole.log(str.charAt(str.length-1));//.

登录后复制

二者执行效果完全相同,唯一的区别在于越界访问字符时:

let str = "01234";console.log(str[9]);//undefinedconsole.log(str.charAt(9));//""(空串)

登录后复制

我们还可以使用for ..of遍历字符串:

for(let c of '01234'){    console.log(c);}

登录后复制

字符串不可变

JavaScript中的字符串一经定义就不可更改,举个例子:

let str = "Const";str[0] = 'c' ;console.log(str);

登录后复制

代码执行结果:

JavaScript字符串不可变

如果想获得一个不一样的字符串,只能新建:

let str = "Const";str = str.replace('C','c');console.log(str);

登录后复制

看起来我们似乎改变了字符串,实际上原来的字符串并没有被改变,我们得到的是replace方法返回的新字符串。

.toLowerCase()、.toUpperCase()

转换字符串大小写,或者转换字符串中单个字符的大小写。

这两个字符串的方法比较简单,举例带过:

console.log('Good Boy'.toLowerCase());//good boyconsole.log('Good Boy'.toUpperCase());//GOOD BOYconsole.log('Good Boy'[5].toLowerCase());//b

登录后复制

代码执行结果:

JavaScript字符串大小写

.indexOf()、.lastIndexOf() 查找子串

.indexOf(substr,idx)函数从字符串的idx位置开始,查找子串substr的位置,成功返回子串首字符下标,失败返回-1。

let str = "google google";console.log(str.indexOf('google'));//0 idx默认为0console.log(str.indexOf('google',1));//7 从第二个字符开始查找console.log(str.indexOf('xxx'));//-1 没找到返回-1

登录后复制

代码执行结果:

image-20220521105839370

如果我们想查询字符串中所有子串位置,可以使用循环:

let str = "I love love love love u.";let sub = "love";let pos = -1;while((pos = str.indexOf(sub,pos+1)) != -1)    console.log(pos);

登录后复制

代码执行结果如下:

JavaScript查询所有子串

.lastIndexOf(substr,idx)倒着查询子串,首先查找最后一个符合的串:

let str = "google google";console.log(str.lastIndexOf('google'));//7 idx默认为0

登录后复制

按位取反技巧(不推荐,但要会)

由于indexOf()和lastIndexOf()方法在查询不成功的时候会返回-1,而~-1 === 0。也就是说只有在查询结果不为-1的情况下使用~才为真,所以我们可以:

let str = "google google";if(~indexOf('google',str)){    ...}

登录后复制

通常情况下,我们不推荐在不能明显体现语法特性的地方使用一个语法,这会在可读性上产生影响。好在以上代码只出现在旧版本的代码中,这里提到就是为了大家在阅读旧代码的时候不会产生困惑。

补充:

~是按位取反运算符,例如:十进制的数字2的二进制形式为0010,~2的二进制形式就是1101(补码),也就是-3。

简单的理解方式,~n等价于-(n+1),例如:~2 === -(2+1) === -3

.includes()、.startsWith()、.endsWith()

.includes(substr,idx)用于判断substr是否在字符串中,idx是查询开始的位置

console.log('Google Google'.includes('Google'));//trueconsole.log('Google Google'.includes('xxxxxx'));//falseconsole.log('9966'.includes('99',1));//false

登录后复制

代码执行结果:

image-20220521124801837

.startsWith(‘substr’)和.endsWith(‘substr’)分别判断字符串是否以substr开始或结束

console.log("google".startsWith('go'));//trueconsole.log('google'.endsWith('le'));//trueconsole.log('google'.endsWith('ie'));//false

登录后复制

代码执行结果:

image-20220521125113752

.substr()、.substring()、.slice()

.substr()、.substring()、.slice()均用于取字符串的子串,不过用法各有不同。

.substr(start,len)

返回字符串从start开始len个字符组成的字符串,如果省略len,就截取到原字符串的末尾。start可以为负数,表示从后往前第start个字符。

let str = "0123456789";console.log(str.substr(1))//123456789,从1开始到最后console.log(str.substr(3,2))//34,从3开始的2个字符console.log(str.substr(-3,2))//78,倒数第二个开始

登录后复制

代码执行结果:

substr()

.slice(start,end)

返回字符串从start开始到end结束(不包括)的字符串。start和end可以为负数,表示倒数第start/end个字符。

let str = '0123456789';console.log(str.slice(1,5));//1234,区间[1,5)之间的字符console.log(str.slice(1));//123456789,从1到结尾console.log(str.slice(-4,-1));//678,倒数第四个到倒数第1个

登录后复制

代码执行结果:

slice()

.substring(start,end)

作用几乎和.slice()相同,差别在两个地方:

允许end > start;不允许负数,负数视为0;

举例:

let str = '0123456789';console.log(str.substring(1,3));//12console.log(str.substring(3,1));//12console.log(str.substring(-1,3));//012,-1被当作0

登录后复制

代码执行结果:

substring()

对比三者的区别:

方法 描述 参数

.slice(start,end)[start,end)可负.substring(start,end)[start,end)负值为0.substr(start,len)从start开始长为len的子串可负

方法多了自然就选择困难了,这里建议记住.slice()就可以了,相比于其他两种更灵活。

.codePointAt()、String.fromCodePoint()

我们在前文中已经提及过字符串的比较,字符串按照字典序进行排序,每个字符背后都是一个编码,ASCII编码就是一个重要的参考。

例如:

console.log('a'>'Z');//true

登录后复制

字符之间的比较,本质上是代表字符的编码之间的比较。JavaScript使用UTF-16编码字符串,每个字符都是一个16为的代码,想要知道比较的本质,就需要使用.codePointAt(idx)获得字符的编码:

console.log('a'.codePointAt(0));//97console.log('Z'.codePointAt(0));//90

登录后复制

代码执行结果:

codePointAt()

使用String.fromCodePoint(code)可以把编码转为字符:

console.log(String.fromCodePoint(97));console.log(String.fromCodePoint(90));

登录后复制

代码执行结果如下:

String.fromCodePoint()

这个过程可以用转义符u实现,如下:

console.log('u005a');//Z,005a是90的16进制写法console.log('u0061');//a,0061是97的16进制写法

登录后复制

下面我们探索一下编码为[65,220]区间的字符:

let str = '';for(let i = 65; i<=220; i++){    str+=String.fromCodePoint(i);}console.log(str);

登录后复制

代码执行部分结果如下:

image-20220521152818896

上图并没有展示所有的结果,快去试试吧。

.localeCompare()

基于国际化标准ECMA-402,JavaScript已经实现了一个特殊的方法(.localeCompare())比较各种字符串,采用str1.localeCompare(str2)的方式:

如果str1 如果str1 > str2,返回正数;如果str1 == str2,返回0;

举个例子:

console.log("abc".localeCompare('def'));//-1

登录后复制

为什么不直接使用比较运算符呢?

这是因为英文字符有一些特殊的写法,例如,á是a的变体:

console.log('á' < 'z');//false

登录后复制

虽然也是a,但是比z还要大!!

此时就需要使用.localeCompare()方法:

console.log('á'.localeCompare('z'));//-1

登录后复制

常用方法

str.trim()去除字符串前后空白字符,str.trimStart()、str.trimEnd()删除开头、结尾的空格;

let str = "  999   ";console.log(str.trim());//999

登录后复制

str.repeat(n)重复n次字符串;

let str = '6';console.log(str.repeat(3));//666

登录后复制

str.replace(substr,newstr)替换第一个子串,str.replaceAll()用于替换所有子串;

let str = '9+9';console.log(str.replace('9','6'));//6+9console.log(str.replaceAll('9','6'));//6+6

登录后复制

还有很多其他方法,我们可以访问手册获取更多知识。

进阶内容

生僻字、emoji、特殊符号

JavaScript使用UTF-16编码字符串,也就是使用两个字节(16位)表示一个字符,但是16位数据只能表示65536个字符,对于常见字符自然不在话下,但是对于生僻字(中文的)、emoji、罕见数学符号等就力不从心了。

这种时候就需要扩展,使用更长的位数(32位)表示特殊字符,例如:

console.log(''.length);//2console.log('?'.length);//2

登录后复制

代码执行结果:

emoji

这么做的结果是,我们无法使用常规的方法处理它们,如果我们单个输出其中的每个字节,会发生什么呢?

console.log(''[0]);console.log(''[1]);

登录后复制

代码执行结果:

image-20220521162028007

可以看到,单个输出字节是不能识别的。

好在String.fromCodePoint()和.codePointAt()两个方法是可以处理这种情况的,这是因为二者是最近才加入的。在旧版本的JavaScript中,只能使用String.fromCharCode()和.charCodeAt()两个方法转换编码和字符,但是他们不适用于特殊字符的情况。

我们可以通过判断一个字符的编码范围,判断它是否是一个特殊字符,从而处理特殊字符。如果一个字符的代码在0xd800~0xdbff之间,那么他是32位字符的第一部分,它的第二部分应该在0xdc00~0xdfff。

举个例子:

console.log(''.charCodeAt(0).toString(16));//d83dconsole.log('?'.charCodeAt(1).toString(16));//de02

登录后复制

代码执行结果:

image-20220521163405771

规范化

在英文中,存在很多基于字母的变体,例如:字母 a 可以是 àáâäãåā 的基本字符。这些变体符号并没有全部存储在UTF-16编码中,因为变化组合太多了。

为了支持所有的变体组合,同样使用多个Unicode字符表示单个变体字符,在编程过程中,我们可以使用基本字符加上“装饰符号”的方式表达特殊字符:

console.log('au0307');//ȧconsole.log('au0308');//ȧconsole.log('au0309');//ȧconsole.log('Eu0307');//Ėconsole.log('Eu0308');//Ëconsole.log('Eu0309');//Ẻ

登录后复制

代码执行结果:

image-20220521165357109

一个基础字母还可以有多个装饰,例如:

console.log('Eu0307u0323');//Ẹ̇console.log('Eu0323u0307');//Ẹ̇

登录后复制

代码执行结果:

image-20220521165415395

这里存在一个问题,在多个装饰的情况下,装饰的排序不同,实际上展示的字符是一样的。

如果我们直接比较这两种表示形式,却会得到错误的结果:

let e1 = 'Eu0307u0323';let e2 = 'Eu0323u0307';console.log(`${e1}==${e2} is ${e1 == e2}`)

登录后复制

代码执行结果:

image-20220521165821857

为了解决这种情况,有一个**Unicode规范化算法,可以将字符串转为通用**格式,由str.normalize()实现:

let e1 = 'Eu0307u0323';
let e2 = 'Eu0323u0307';
console.log(`${e1}==${e2} is ${e1.normalize() == e2.normalize()}`)

登录后复制

代码执行结果:

image-20220521170132480

【相关推荐:javascript视频教程、web前端】

以上就是JavaScript字符串常见基础方法精讲的详细内容,更多请关注【创想鸟】其它相关文章!

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:PHP中文网,转转请注明出处:https://www.chuangxiangniao.com/p/2701122.html

(0)
上一篇 2025年3月7日 19:12:27
下一篇 2025年3月7日 19:12:42

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • JavaScript面向对象详细解析之属性描述符

    本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于面向对象的相关问题,包括了属性描述符、数据描述符、存取描述符等等内容,下面一起来看一下,希望对大家有帮助。 【相关推荐:javascript视频教程、web前端】 J…

    2025年3月7日
    200
  • 一文掌握JavaScript数字类型

    本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于数字类型的相关内容,javascript中存在两种表示数字的类型:number和bigint类型,下面一起来看一下,希望对大家有帮助。 【相关推荐:javascrip…

    2025年3月7日 编程技术
    200
  • 四种方法搞定JavaScript创建多个对象

    本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于创建多个对象的相关内容,包括了字面量方法、工厂模式方法、构造函数以及原型加构造函数方法的问题,下面一起来看一下,希望对大家有帮助。 【相关推荐:javascript视…

    2025年3月7日
    200
  • 整理总结JavaScript常见的BOM操作

    本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于bom操作的相关问题,包括了window对象的常见事件、javascript执行机制等等相关内容,下面一起来看一下,希望对大家有帮助。 【相关推荐:javascrip…

    2025年3月7日 编程技术
    200
  • JavaScript的Symbol类型、隐藏属性及全局注册表详解

    本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于symbol类型、隐藏属性及全局注册表的相关问题,包括了symbol类型的描述、symbol不会隐式转字符串等问题,下面一起来看一下,希望对大家有帮助。 【相关推荐:…

    2025年3月7日
    200
  • 解决JavaScript数据处理的5个常见问题

    本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于数据处理中常见的一些问题,包括了数据的增删改查、数据的排序、数据的去重、平级列表变成树形结构以及数组对象相同项合并处理,下面一起来看一下,希望对大家有帮助。 【相关推…

    2025年3月7日 编程技术
    200
  • JavaScript总结之18种常用数组方法

    本篇文章给大家带来了关于javascript的相关知识,其中主要总结介绍了一些常用的数组方法,整理分成了不会改变原数组的方法和会改变原数组的方法,下面一起来看一下,希望对大家有帮助。 【相关推荐:javascript视频教程、web前端】 …

    2025年3月7日 编程技术
    200
  • JavaScript隐藏机制之垃圾回收知识总结

    本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了垃圾回收的相关问题,垃圾回收是javascript的隐藏机制,下面一起来看一下,希望对大家有帮助。 【相关推荐:javascript视频教程、web前端】 一、前言 垃圾…

    2025年3月7日 编程技术
    200
  • JavaScript类数组和可迭代对象的实现原理详解

    本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于类数组和可迭代对象的实现原理,包括了把对象本身构造成迭代器、string的迭代器等等相关内容,下面一起来看一下吧,希望对大家有帮助。 【相关推荐:javascript…

    2025年3月7日 编程技术
    200
  • 一文搞定JavaScript的节点操作

    本篇文章给大家带来了关于javascript的相关知识,其中主要介绍了关于节点操作的相关问题,包括了父级节点、子节点、兄弟节点、增加删除复制节点等等内容,下面一起来看一下,希望对大家有帮助。 【相关推荐:javascript视频教程、web…

    2025年3月7日 编程技术
    200

发表回复

登录后才能评论