js中字符串分割 (科技知识|经验|四大版块中国Web前端高端培训)
点击关注▲一灯科技
知识|经验|资讯|资料四大版块
中国专业的Web前端高端培训机构
事情是这样的
今天小编看到了一篇文章
讲的是
“圣诞节,把网站所有的js代码都压缩成圣诞树”
于是
小编就尝试了一下
编程功底差的小编
折腾了一天
终于将公司的代码做成了圣诞树
大致类似于下图这样:
于是小编兴高采烈的
跑去给CTO看了一眼
本以为会夸奖我
(压缩后的js代码格式虽然被破坏,
但是仍然可以运行。这个是关键点!)
万万没想到
CTO看了一眼
直接把“员工辞退书”摔在了我的脸上
小编当时的内心是崩溃的
但是
小编本着敬业的精神
也要带着大家看看这篇文章
(不能我一个人被辞退,哈哈哈)
其实也不神奇
作者使用了自己写的一个nodejs库
如果你想要和小编一样被开除
你只需要学会使用js2image这个库即可
下面是js2image的使用
js2image主要有两个比较特殊的特性
1、将任意js源码 压缩成 用代码堆砌成图形的最终代码
例如:圣诞树,圣诞老人,代码和图片都可以自定义
2、压缩后的js代码格式虽然被破坏,但是仍然可以运行(这个是关键点!)
压缩后大概是这个样子的
使用方式很简单:
npm install js2image -g;
然后在存在js的文件夹中执行:
js2image -s ./resource/jquery.js
或者针对某个目录下所有的js执行(慎用)
会深度遍历此目录里所有的js文件
然后压缩出.xmas.js后缀的结果文件
js2image -s ./resource/
即可生成一个对应的
**.xmas.js 的文件
如果要将js2image集成到
gulp或者其他nodes项目中
可以使用用模块的形式
下面讲解这个库的原理
有些地方可能比较绕
js2image实现原理
js2image的实现从宏观来说
大体只有3个要点
1、从图片生成字符画js中字符串分割,这个有现成的库
2、把js代码分割成一小块,尽量小。然后用逐行填充的方式,分别替换到上一步生成的字符画里去
3、js代码中有诸多不能分开的语法。分块的时候要把这些语法保留在一个块内
这个是这个库的难点所在,也是代码最多最绕的地方
稍有想法的同学,估计看到这里基本已经明白是怎么回事了
下面一一讲解这3个要点
① 从图片生成2值得字符画
这里用到了一个现成的npm包:
image-to-ascii
这个库的作用是,用指定的字符来还原一个图像,而我们用这个库来生成一个用 ☃字符和空格 分别表示黑和白的字符画,然后将字符画的每一行分解成数组的一个元素,供第二步使用,这就是我们中间生成的一个struct
② 分割js源码成尽量小的小块
这是非常重要的一步,js代码具体可以分解成多细的小块呢?
看下面一段代码:
这是jQuery开始的一段代码
可以看到
大部分操作符
都允许中间插入
任意多的空格或者换行
我们正是利用这一特性
将js代码解肢
然后拼接成任意形状的图片
核心代码
其实就是一个正则
我们用这个正则
把js源码解构成一个数组
然后后续根据每行需要的字符数
从这个数组里不断取片段出来拼接
③ 保留不可分割的语法
注意:到了这一步js中字符串分割,还很早.
你分解出来的代码是无法运行的,很多不能换行和加空格的代码都被你分开了,自然会报错,那如何处理这些情况呢?
这一步,我们做的工作就是:
在执行代码分拆之前,提取出代码里所有不可分割的语法,将他们保留在一个对象中,并且在源代码中用占位符替代这些语法,然后让占位符参与上个步骤的分离,因为占位符是一个完整的连字符变量,所以不会被分割。
在分割完成之后,我们再把这些占位符替换回来即可
不过,在js中哪些语法必须是,连接在一起才能正常运行的呢?
这里总结下:
1、字符串不可分割 包括双引号单引号内的内容。
2、正则表达式绝对不可分割 正则里的转义很难处理,这是这个算法里的难点。
3、运算操作符 包括2字符的3字符的 例如:以下两种
一些固定语法,可以用正则表达,如下:
小数点语法,例如 0.01 因为之前我们用点号来分割代码的,但是这里的点号不能作为分割符使用,需要保留前后数字跟点号在一行
小数点语法,例如 0.01 因为之前我们用点号来分割代码的,但是这里的点号不能作为分割符使用,需要保留前后数字跟点号在一行
其他语法,例如 value++ 之类的语法,变量和操作符之间不可分割。
那我们如何从源代码中解析出这些语法,然后做处理呢?
核心算法,事实上是通过一个对字符串的遍历来完成的,然后在遍历每个字符的时候都会判断是否进入某个逻辑来跳跃处理。
例如,判断出当前在双引号内,则进入字符串提取逻辑,一直到字符串结束的时候再继续正常的遍历。
其他操作符和正则表达式的算法也是类似,不过里面很多细节需要处理,例如转义字符之类的。
有些比较特殊的,例如小数点语法的提取,在判断到当前字符是点号之后,需要往前和向后循环查找数字,然后把整个语法找出来。
这里不细讲,在keep-line.js 这个文件中又一大坨代码做这个事情的。
④ 字符串解构
做到这一步的时候,其实效果已经很不错了,也可以保证代码的可运行,但是代码里有些字符串很长,他们总是会被被保留在一行里,这样就造成他会影响一些图案的边缘的准确性(代码分离原则是越细越好,就是为这个考虑)
我们如何处理呢,那就是将字符串解构,以5个为单位将字符串分离成小块
这里有两个比较重要的问题需要处理;
1、字符串内的转义字符如何处理,还有一些特殊字符,例如0x01这样的字符,这些字符不能被分离到不同的字符串里,所以分离的时候要保留这些字符串的完整性。
2、字符串分离成小字符串,然后用+号拼接起来,不过要注意操作符优先级的问题,所以所有分离后的字符串,都要用括号包起来,让这个+号的优先级永远最高。
具体算法见 keep-line.js 中的 splitDoubleQuot (分离双引号字符串)。
至此,整个应用就完成了,可以顺利完成从任意js和图像生成图形代码了。
发表评论
热门文章
Spimes主题专为博客、自媒体、资讯类的网站设计....
一款个人简历主题,可以简单搭建一下,具体也比较简单....
仿制主题,Typecho博客主题,昼夜双版设计,可....
用于作品展示、资源下载,行业垂直性网站、个人博客,....
尘集杂货铺和官网1t5-cn
11月11日
[已回复]
希望主题和播放器能支持SQLite数据库,AI能多个讯飞星火