软硬皆施

从setTimeout/setInterval看JS线程

最近项目中遇到了一个场景,其实很常见,就是定时获取接口刷新数据。那么问题来了,假设我设置的定时时间为1s,而数据接口返回大于1s,应该用同步阻塞还是异步?我们先整理下js中定时器的相关知识,再来看这个问题。

初识setTimeout 与 setInterval

先来简单认识,后面我们试试用setTimeout 实现 setInterval 的功能

  • setTimeout 延迟一段时间执行一次 (Only one)
1
2
3
4
5
setTimeout(function, milliseconds, param1, param2, ...)
clearTimeout() // 阻止定时器运行

e.g.
setTimeout(function(){ alert("Hello"); }, 3000); // 3s后弹出
  • setInterval 每隔一段时间执行一次 (Many times)
1
2
3
4
setInterval(function, milliseconds, param1, param2, ...)

e.g.
setInterval(function(){ alert("Hello"); }, 3000); // 每隔3s弹出

setTimeout和setInterval的延时最小间隔是4ms(W3C在HTML标准中规定);在JavaScript中没有任何代码是立刻执行的,但一旦进程空闲就尽快执行。这意味着无论是setTimeout还是setInterval,所设置的时间都只是n毫秒被添加到队列中,而不是过n毫秒后立即执行。

进程与线程,傻傻分不清楚

为了讲清楚这两个抽象的概念,我们借用阮大大借用的比喻,先来模拟一个场景:

  • 这里有一个大型工厂
  • 工厂里有若干车间,每次只能有一个车间在作业
  • 每个车间里有若干房间,有若干工人在流水线作业

那么:

  • 一个工厂对应的就是计算机的一个CPU,平时讲的多核就代表多个工厂
  • 每个工厂里的车间,就是进程,意味着同一时刻一个CPU只运行一个进程,其余进程在怠工
  • 这个运行的车间(进程)里的工人,就是线程,可以有多个工人(线程)协同完成一个任务
  • 车间(进程)里的房间,代表内存。

再深入点:

  • 车间(进程)里工人可以随意在多个房间(内存)之间走动,意味着一个进程里,多个线程可以共享内存
  • 部分房间(内存)有限,只允许一个工人(线程)使用,此时其他工人(线程)要等待
  • 房间里有工人进去后上锁,其他工人需要等房间(内存)里的工人(线程)开锁出来后,才能才进去,这就是互斥锁(Mutual exclusion,缩写 Mutex)
  • 有些房间只能容纳部分的人,意味着部分内存只能给有限的线程

再再深入:

  • 如果同时有多个车间作业,就是多进程
  • 如果一个车间里有多个工人协同作业,就是多线程
  • 当然不同车间之间的工人也可以有相互协作,就需要协调机制

JavaScript 单线程

总所周知,JavaScript 这门语言的核心特征,就是单线程(是指在JS引擎中负责解释和执行JavaScript代码的线程只有一个)。这和 JavaScript 最初设计是作为一门 GUI 编程语言有关,最初用于浏览器端,单一线程控制 GUI 是很普遍的做法。但这里特别要划个重点,虽然JavaScript是单线程,但浏览器是多线程的!!!例如Webkit或是Gecko引擎,可能有javascript引擎线程、界面渲染线程、浏览器事件触发线程、Http请求线程,读写文件的线程(例如在Node.js中)。ps:可能要总结一篇浏览器渲染的文章了。

HTML5提出Web Worker标准,允许JavaScript脚本创建多个线程,但是子线程完全受主线程控制,且不得操作DOM。所以,这个新标准并没有改变JavaScript单线程的本质。

同步与异步,傻傻分不清楚

之前阮大大写了一篇《JavaScript 运行机制详解:再谈Event Loop》,然后被朴灵评注了,特别是同步异步的理解上,两位大牛有很大的歧义。

  • 同步(synchronous):假如一个函数返回时,调用者就能够得到预期结果(即拿到了预期的返回值或者看到了预期的效果),这就是同步函数。
1
2
3
e.g.
alert('马上能看到我拉');
console.log('也能马上看到我哦');
  • 异步(asynchronous):假如一个函数返回时,调用者不能得到预期结果,需要通过一定手段才能获得,这就是异步函数。
1
2
3
4
e.g.
setTimeout(function() {
// 过一段时间才能执行我哦
}, 1000);

异步构成要素

一个异步过程通常是这样的:主线程发起一个异步请求,相应的工作线程(比如浏览器的其他线程)接收请求并告知主线程已收到(异步函数返回);主线程可以继续执行后面的代码,同时工作线程执行异步任务;工作线程完成工作后,通知主线程;主线程收到通知后,执行一定的动作(调用回调函数)。

  • 发起(注册)函数 – 发起异步过程
  • 回调函数 – 处理结果
1
2
3
e.g.
setTimeout(fn, 1000);
// setTimeout就是异步过程的发起函数,fn是回调函数

通信机制

异步过程的通信机制:工作线程将消息放到消息队列,主线程通过事件循环过程去取消息。

消息队列 Message Queue

一个先进先出的队列,存放各类消息。

事件循环 Event Loop

主线程(js线程)只会做一件事,就是从消息队列里面取消息、执行消息,再取消息、再执行。消息队列为空时,就会等待直到消息队列变成非空。只有当前的消息执行结束,才会去取下一个消息。这种机制就叫做事件循环机制Event Loop,取一个消息并执行的过程叫做一次循环。

工作线程是生产者,主线程是消费者。工作线程执行异步任务,执行完成后把对应的回调函数封装成一条消息放到消息队列中;主线程不断地从消息队列中取消息并执行,当消息队列空时主线程阻塞,直到消息队列再次非空。

setTimeout(function, 0) 发生了什么

其实到这儿,应该能很好解释setTimeout(function, 0) 这个常用的“奇技淫巧”了。很简单,就是为了将function里的任务异步执行,0不代表立即执行,而是将任务推到消息队列的最后,再由主线程的事件循环去调用它执行。

HTML5 中规定setTimeout 的最小时间不是0ms,而是4ms。

setInterval 缺点

再次强调,定时器指定的时间间隔,表示的是何时将定时器的代码添加到消息队列,而不是何时执行代码。所以真正何时执行代码的时间是不能保证的,取决于何时被主线程的事件循环取到,并执行。

1
setInterval(function, N)

那么显而易见,上面这段代码意味着,每隔N秒把function事件推到消息队列中,什么时候执行?母鸡啊!

上图可见,setInterval每隔100ms往队列中添加一个事件;100ms后,添加T1定时器代码至队列中,主线程中还有任务在执行,所以等待,some event执行结束后执行T1定时器代码;又过了100ms,T2定时器被添加到队列中,主线程还在执行T1代码,所以等待;又过了100ms,理论上又要往队列里推一个定时器代码,但由于此时T2还在队列中,所以T3不会被添加,结果就是此时被跳过;这里我们可以看到,T1定时器执行结束后马上执行了T2代码,所以并没有达到定时器的效果。

综上所述,setInterval有两个缺点:

  • 使用setInterval时,某些间隔会被跳过;
  • 可能多个定时器会连续执行;

链式setTimeout

1
2
3
4
setTimeout(function () {
// 任务
setTimeout(arguments.callee, interval);
}, interval)

警告:在严格模式下,第5版 ECMAScript (ES5) 禁止使用 arguments.callee()。当一个函数必须调用自身的时候, 避免使用 arguments.callee(), 通过要么给函数表达式一个名字,要么使用一个函数声明.

上述函数每次执行的时候都会创建一个新的定时器,第二个setTimeout使用了arguments.callee()获取当前函数的引用,并且为其设置另一个定时器。好处:

  • 在前一个定时器执行完前,不会向队列插入新的定时器(解决缺点一)
  • 保证定时器间隔(解决缺点二)

So…

回顾最开始的业务场景的问题,用同步阻塞还是异步,答案已经出来了…

PS:其实还有macrotask与microtask等知识点没有提到,总结了那么多,其实JavaScript深入下去还有很多,任重而道远呀。


参考:

进程与线程的一个简单解释 – 阮大大

【译】JavaScript 如何工作的: 事件循环和异步编程的崛起 + 5 个关于如何使用 async/await 编写更好的技巧

PalmerYe wechat
世界很大,圈子很小,欢迎关注,相互进步。
Fork me on GitHub