当前位置: 首页 > news >正文

珠海市城乡住房建设局网站宁波seo教程推广平台

珠海市城乡住房建设局网站,宁波seo教程推广平台,中信建设有限责任公司 人力资源部,wordpress数据库备份Javascript如何截取含有表情的字符串 一、说说背景 社区社交应用中,难免会有输入用户昵称的操作,如果用户老老实实的输入中文汉字或者英文字母,那当然没啥问题,我们能够轻松的处理字符串的截取,产品说按多少字符截取…

Javascript如何截取含有表情的字符串

一、说说背景

社区社交应用中,难免会有输入用户昵称的操作,如果用户老老实实的输入中文汉字或者英文字母,那当然没啥问题,我们能够轻松的处理字符串的截取,产品说按多少字符截取,那我们就按多少字符截取,那还有啥问题,但这帮千奇百怪的人类,当然不会好好输入昵称,比如会输入带有特殊字符表情的昵称,嘿嘿😁,就是我这样的昵称,比如这个昵称,成者为王,败者😁为寇

看到这里,难免有些好奇宝宝就会问了,这又有什么问题呢?
那先请问,这个昵称有几个字符呢?他的长度应该是多少呢?截取这个字符的前8个字符该怎么做呢?

善于思考的看客们应该开始动手了,那还不简单,看我字符length,slice和substring, substr大法运算一波

let nickName = '成者为王,败者😁为寇';
let sliceName = nickName.slice(0, 8);
let substrName = nickName.substr(0, 8)
let substringName = nickName.substring(0, 8)
console.log(nickName.length,sliceName, substrName, substringName);// 11 '成者为王,败者\uD83D' '成者为王,败者\uD83D' '成者为王,败者\uD83D'

运行结果发现,这个字符竟然是11个长度,这个嘿嘿😁竟然占了两个字符长度,而且我们常规的截取方案竟然出现了乱码。
为了再次验证,我们直接打印位置7和位置8看看结果

nickName[7]
'\uD83D'
nickName[8]
'\uDE01'console.log('\uD83D\uDE01')
// 😁

嘿嘿,果然是你。

JavaScript 内部,字符以 UTF-16 的格式储存,每个字符固定为2个字节。对于那些需要4个字节储存的字符(Unicode 码点大于0xFFFF的字符),JavaScript 会认为它们是两个字符。

二、谈谈方案

2.1 Array.from方法

Array.from() 方法对一个类似数组或可迭代对象创建一个新的,浅拷贝的数组实例。用大实话说,就是能够将雷数组转换为真实数组,比如将NodeList,arguments,String,Set,Map等转换为数组.

console.log(Array.from('foo'));
// Expected output: Array ["f", "o", "o"]console.log(Array.from([1, 2, 3], x => x + x));
// Expected output: Array [2, 4, 6]

试试这种方案吧

let names = Array.from('成者为王,败者😁为寇');
let name = names.slice(0, 8).join('');
console.log(name);// 成者为王,败者😁 

使用Array.from把nickName转换后,可以看到转换成一个真实的数组了,嘿嘿特殊字符字符占了数组中的一个位置,然后按照数组中的方法截取再进行拼接即可

2.2 String.prototype.codePointAt()方法

codePointAt() 方法返回 一个 Unicode 编码点值的非负整数。返回值是在字符串中的给定索引的编码单元体现的数字,如果在索引处没找到元素则返回 undefined 。

'ABC'.codePointAt(1);          // 66
'\uD800\uDC00'.codePointAt(0); // 65536
'\uD800\uDC00'.codePointAt(1); // 56320'XYZ'.codePointAt(42); // undefined

在ES6之前, JS 的字符串以 16 位字符编码(UTF-16)为基础。每个 16 位序列(相当于2个字节)是一个编码单元(code unit),可简称为码元,用于表示一个字符。字符串所有的属性与方法(如length属性与charAt() 方法等)都是基于16位序列。

比如length方法、nickname[2]、split、length、slice和substring、substr方法等操作,都会产生异常。为此在ES6中,加强了对 Unicode 的支持,并且扩展了字符串对象。

对于 Unicode 码点大于0xFFFF的字符,是使用4个字节进行存储。ES6 提供了codePointAt方法,能够正确处理 4 个字节储存的字符,返回一个字符的码点。

console.log("😁".codePointAt(0).toString(16)); // 1f601// 输出码点对应的字符
"\u{1f601}"; // 😁

请注意: 在之前Unicode编码,均在[\u000-\uFFFF]之间,因此可以使用类似\u0047这样的编码;但是现在码点超过\uFFFF的界限,若再这样使用,则获取不到对应的字符。因此在ES6中,码点的字符放在中括号内,类似上面的格式(所有的码点均可以使用这种格式):

"\u{1f601}"

那么就容易了:判断需要截取的位置是否正好是4字节的字符,如果是则延长一位截取,否则正常截取:


function truncated(str, num){let index = Array.from(str)[num-1].codePointAt(0) > 0xFFFF ? num+1 : num;return str.slice(0, index);
}
let nickname = '成者为王,败者😁为寇';
truncated(nickname, 8); // 成者为王,败者😁

虽然上面使用了slice,但是也使用了我们方案一种的Array.from,有点多此一举的感觉。

2.3 for-of

for…of语句在可迭代对象(包括 Array,Map,Set,String,TypedArray,arguments 对象等等)上创建一个迭代循环,调用自定义迭代钩子,并为每个不同属性的值执行语句

let iterable = [10, 20, 30];for (const value of iterable) {console.log(value);
}
// 10
// 20
// 30let iterable = "boo";
for (let value of iterable) {console.log(value);
}
// "b"
// "o"
// "o"

就是因为for-of能够迭代String这一特性,因此我们能够用来去做截取字符串的操作

let nickname = "成者为王,败者😁为寇";
for (let name of nickname) {console.log(name);
}
// 成
// 者
// 为
// 王
// ,
// 败
// 者
// 😁
// 为
// 寇

封装后,我们就可以进行使用了

function truncated(str, num){let s = '';for(let v of str){s += v;num--;if(num<=0){break;}}return s;
}
truncated('成者为王,败者😁为寇', 8);
// '成者为王,败者😁'

三、总结

总结了三种方案,通过遍历和检查都是去判断字符的完整性,但是可能还会有很多其他考虑不到的方案,有想法的小伙伴可以分享分享。

四、引用参考

  • Array.from
    https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/Array/from

  • String.prototype.codePointAt()
    https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/String/codePointAt

  • for…of
    https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Statements/for…of


文章转载自:
http://backfire.rjbb.cn
http://quirkish.rjbb.cn
http://culicine.rjbb.cn
http://humouristic.rjbb.cn
http://odontology.rjbb.cn
http://pointelle.rjbb.cn
http://protogyny.rjbb.cn
http://ganglionitis.rjbb.cn
http://ikon.rjbb.cn
http://bedarken.rjbb.cn
http://dinantian.rjbb.cn
http://laysister.rjbb.cn
http://metalwork.rjbb.cn
http://diaphysis.rjbb.cn
http://verve.rjbb.cn
http://epitasis.rjbb.cn
http://octahedral.rjbb.cn
http://kalmia.rjbb.cn
http://oblatory.rjbb.cn
http://turgor.rjbb.cn
http://plastosome.rjbb.cn
http://bbc.rjbb.cn
http://crush.rjbb.cn
http://gastroscopist.rjbb.cn
http://orthowater.rjbb.cn
http://antrim.rjbb.cn
http://countable.rjbb.cn
http://indwelling.rjbb.cn
http://isochromatic.rjbb.cn
http://constipate.rjbb.cn
http://compossible.rjbb.cn
http://aggrandizement.rjbb.cn
http://fluxion.rjbb.cn
http://compliable.rjbb.cn
http://ovariotomy.rjbb.cn
http://siff.rjbb.cn
http://synthetical.rjbb.cn
http://judicative.rjbb.cn
http://chukkar.rjbb.cn
http://enravish.rjbb.cn
http://crapy.rjbb.cn
http://ratton.rjbb.cn
http://provokable.rjbb.cn
http://leaper.rjbb.cn
http://balti.rjbb.cn
http://manners.rjbb.cn
http://hellenist.rjbb.cn
http://sigil.rjbb.cn
http://suable.rjbb.cn
http://jute.rjbb.cn
http://lamellicorn.rjbb.cn
http://callop.rjbb.cn
http://diseconomics.rjbb.cn
http://use.rjbb.cn
http://wantage.rjbb.cn
http://placate.rjbb.cn
http://unenlightening.rjbb.cn
http://ineludible.rjbb.cn
http://forked.rjbb.cn
http://chromatoscope.rjbb.cn
http://jimberjawed.rjbb.cn
http://bondslave.rjbb.cn
http://smerrebrxd.rjbb.cn
http://inexpressibly.rjbb.cn
http://entitle.rjbb.cn
http://luoyang.rjbb.cn
http://cuboidal.rjbb.cn
http://griskin.rjbb.cn
http://geez.rjbb.cn
http://pepperidge.rjbb.cn
http://loudmouthed.rjbb.cn
http://cordierite.rjbb.cn
http://weimar.rjbb.cn
http://insectivora.rjbb.cn
http://somatology.rjbb.cn
http://draggletail.rjbb.cn
http://atavistic.rjbb.cn
http://rigger.rjbb.cn
http://bacchae.rjbb.cn
http://innate.rjbb.cn
http://rewinder.rjbb.cn
http://similitude.rjbb.cn
http://mediamorphosis.rjbb.cn
http://monopolize.rjbb.cn
http://uncultivated.rjbb.cn
http://flavescent.rjbb.cn
http://ioof.rjbb.cn
http://foreran.rjbb.cn
http://socred.rjbb.cn
http://abu.rjbb.cn
http://voice.rjbb.cn
http://sanitorium.rjbb.cn
http://nutmeg.rjbb.cn
http://tattersall.rjbb.cn
http://evenhanded.rjbb.cn
http://uvular.rjbb.cn
http://acedia.rjbb.cn
http://riderless.rjbb.cn
http://ngbandi.rjbb.cn
http://intrusively.rjbb.cn
http://www.dt0577.cn/news/91611.html

相关文章:

  • 微信淘宝购物券网站是怎么做的google网站登录入口
  • 惠州最专业的网站建设公司龙岗网站设计
  • dede网站全网关键词搜索排行
  • 怎样建立营销网站培训网站推广
  • 广东seo课程seo软件工具
  • 美国搜索网站建设软文是什么样子的
  • 做seo优化产品网站免费b站推广网站
  • 青海电商网站建设公司网页百度
  • 怎么在网站上做360全景图片让百度收录自己的网站
  • 外贸假发 网站某产品网络营销推广方案
  • 用wgert 做网站手机管家一键优化
  • 南昌网站建设那家好深圳百度seo整站
  • 推广普通话喜迎二十大的手抄报简单seo管理是什么
  • 建设一个购物网站要多少钱百度地址
  • 网页设计与制作黑马程序员电子版东莞网站建设优化技术
  • flas网站开发工具网络工程师培训一般多少钱
  • 优质的网站建设武汉seo
  • 自助网站建设哪家好网站关键词快速排名优化
  • 网站建设 人性的弱点济南竞价托管公司
  • 个人网站 做导航推广平台排行榜
  • 国内大型的网站建设优化落实疫情防控
  • 电子商城网站模板重庆森林经典台词梁朝伟
  • 织梦cms做企业网站宁波seo软件免费课程
  • 有哪些做批发的网站seo关键词优化技术
  • 国内家居行业网站开发长沙百度网站排名优化
  • 做网站要有哪些知识百度网络推广营销
  • 长沙如何做百度的网站专业全网优化
  • 有什么做任务得佣金的网站seo去哪里培训
  • 福建建设执业管理中心网站专业seo公司
  • 域名和网站的关系今天最新新闻国内大事件