百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

Astro 2.x助力:Sharp终于宣布支持 WebAssembly!

wptr33 2025-06-09 00:40 18 浏览

家好,很高兴又见面了,我是"高级前端进阶",由我带着大家一起关注前端前沿、深入前端底层技术,大家一起进步,也欢迎大家关注、点赞、收藏、转发,您的支持是我不断创作的动力。

本文大部分内容来自于 Ingvar Stepanyan 在 2023 年 8 月 3 日发布的一篇文章《Bringing Sharp to WebAssembly and WebContainers》,但是经过了部分修改。因为我本身对于 WebAssembly 的最新动态比较关注,所以特地将它翻译过来,希望对大家有帮助。

为什么 Sharp 开始支持 WebAssembly

WebContainers 是一个允许开发者直接在浏览器中运行 Node.js 的环境。 它可以轻松处理任何 JavaScript,包括 npm 模块。 然而,在图像处理和优化方面,Gatsby、Astro、Next.js 等工具链的用户都面临着诸多困难。

用于图片任务的最流行的库是源自 Squoosh.app 的 @squoosh/lib(遗憾的是,不再作为库进行维护)和 Sharp。

  • libSquoosh 是一种实验性方法,可直接在 JavaScript 程序中运行 Squoosh Web 应用程序中的所有编解码器。libSquoosh 使用工作池(worker pool)来并行处理图像, 从而可以同时将相同的编解码器应用于许多图像。libSquoosh 的速度足够快,可以一次压缩许多图像。目前在 Github 上有 19.4k 的 star、妥妥的前端优质开源项目,但是目前已经放弃维护
  • Sharp:高速 Node.js 模块的典型用例是将常见格式的大图像转换为较小的、网络友好的不同尺寸的 JPEG、PNG、WebP、GIF 和 AVIF 图像。由于使用了 libvips,调整图像大小通常比使用最快的 ImageMagick 和 GraphicsMagick 设置快 4 倍到 5 倍。色彩空间、嵌入式 ICC 配置文件和 Alpha 透明度通道均已正确处理。 Lanczos 重采样确保不会为了速度而牺牲质量。除了图像大小调整之外,还可以进行旋转、提取、合成和伽玛校正等操作。

Sharp 支持运行在大多数 Node.js >= 14.15.0 的现代 macOS、Windows 和 Linux 系统上,不需要任何额外的安装或运行时依赖项。本文将重点探讨将 Sharp 移植到 WebAssembly 时遇到的诸多问题。

将 Node-API 移植到 WebAssembly

libvips 支持 WebAssembly

什么是 libvips

libvips 是一个需求驱动的水平线程图像处理库。 与类似的库相比,libvips 运行速度快并且占用内存很少, libvips 根据 LGPL 2.1+ 获得许可。

libvips 有大约 300 个运算,涵盖:算术、直方图、卷积、形态运算、频率过滤、颜色、重采样、统计等。 它支持多种数值类型,从 8 位 int 到 128 位复数。 图像可以有任意数量的波段。 它支持多种图像格式,包括 JPEG、JPEG2000、JPEG-XL、TIFF、PNG、WebP、HEIC、AVIF、FITS、Matlab、OpenEXR、PDF、SVG、HDR、PPM / PGM / PFM、CSV、GIF、 分析、NIfTI、DeepZoom 和 OpenSlide。 它还可以通过 ImageMagick 或 GraphicsMagick 加载图像,使其能够使用 DICOM 等格式。

目前 libvips 在 Github 上开源,有超过 8.3k 的 star、妥妥的前端优质开源项目。

Sharp 使用 libvips

在图像处理上,Sharp 在底层使用了 libvips 。 本质上,Sharp 是 libvips 的高级包装器,具有 Node.js 友好的 API。

反过来,libvips 使用 GLib、libjpeg、cgif、libimagequant 和许多其他库来支持不同的格式和处理操作。 确保所有这些依赖项都编译为 WebAssembly、选择兼容标志并在必要时 patch 源代码是一项艰巨的工作,在将 Sharp / libvips 移植到 Wasm 时引入了更大的复杂性。

幸运的是, Kleis Auke Wolthuizen 创建了 wasm-vips(用于浏览器和 Node.js 的 libvips,使用 Emscripten 编译为 WebAssembly,目前在 Github 通过 MIT 协议开源,有接近 0.5k 的 star),这是一个能够在浏览器中运行的 libvips 的 JavaScript / WebAssembly 包装器,其 patched 了所有依赖项并编写了一个构建脚本,该脚本在构建 wasm-vips 本身之前下载并应用 patch 并使用正确的标志构建 libvips。

在将 Sharp 迁移到 WebAssembly 的过程中充分利用了该脚本,添加仅构建 libvips 本身的功能,并包含 Sharp 所需的 C++ 绑定。 然后,成功地将绑定与 Sharp 自己的 C++ 代码一起编译成单个 WebAssembly 模块。 在整个工作过程中还添加了对以前缺失的格式(如 AVIF 和 SVG)的支持以及一些构建优化。

SVG 和文本支持

在将 Sharp 迁移到 WebAssembly 的过程中, libvips 通常使用的 librsvg(一个用于渲染可扩展矢量图形 SVG 的小型库,与 GNOME 项目相关) 被替换为 resvg(可以用作 Rust 库、C 库以及 CLI 应用程序来渲染静态 SVG 文件)。

主要原因是 librsvg 有很多依赖项,尚未移植到 WebAssembly。 同时,resvg 是一个 Rust 库,Rust 有更好的交叉编译能力,包括编译到 WebAssembly。 除了更容易的 WebAssembly 支持之外,resvg 也值得一试,因为它具有更好的 SVG 兼容性和速度。

在本地,resvg 从系统字体目录中读取所有字体,收集解析的元数据,然后可以使用它按请求的名称、粗细和其他参数查找字体。 在 WebAssembly 中,事情就没那么容易了。

在 Node.js 或 WASI 中,开发者可以将系统字体目录暴露给模块,但是在浏览器中又该如何做?

开发者可以通过 DOM 或 Canvas 渲染文本,但这无法访问库所需的原始字体文件。 有像 Google Fonts 这样的 CDN,但是在渲染 SVG 时下载字体文件非常昂贵,尤其是当想提前阅读大量字体时。 WICG 本地字体访问 API 可能是该领域最有前途的解决方案,因为它提供对原始系统字体文件的访问,但目前仅适用于 Chrome。

为了解决问题,resvg 维护者添加了对在渲染之前枚举给定 SVG 文件所需的字体的支持, 从而解决必须提前下载所有现有字体才能读取其元数据的问题,而在使用 CDN 时,由于要下载的数据量巨大,这不是一个最好的选择。

Sharp 支持 WebAssembly 后会更仔细地考虑支持文本和 SVG,但就目前而言,有太多未解决的问题,完全禁用这些功能似乎比渲染可能损坏的内容(文本等元素在结果图像中丢失)要好。

同步启动

该项目的一个有趣的限制是,对于 StackBlitz 来说,兼容性至关重要,这样用户就不必更改已经使用 Sharp 的 Node.js 代码来使其在 WebContainers 中工作。 这意味着,当 Sharp 通过简单的 require 同步加载和实例化本机模块时,WebAssembly 也需要同步初始化。

事实上,Chrome 完全拒绝在主线程上编译大于 4KB 的模块,尽管这个尺寸目前已经相应改变。 幸运的是,WebContainers 在 Workers 中运行用户代码,以允许长时间阻塞操作而不阻塞 UI。 因此,需要做的就是通过 -s WASM_ASYNC_COMPILATION=0 标志用同步行为覆盖 Emscripten 的默认行为。

接下来,Sharp 本身(或 libvips)使用 GLib 线程池来分割和管理图像处理任务。 WebAssembly 支持在底层使用 Web Workers + 共享内存 + 原子操作的线程

Web Worker 不会同步生成,而是安排一个任务在下一个事件循环标记上生成一个新的 Worker。 这种行为对于大多数 JavaScript 用户来说是不可见的,但使得 Workers 很难从 WebAssembly 中使用。

pthread_create(&thread_id, NULL, thread_callback, &arg);
pthread_join(thread_id, NULL);

下面将 C 代码翻译成 JS 伪代码:

let isReady = false;
let worker = new Worker(...);

// worker sends a message once it’s initialised
worker.onmessage = msg => {
  if (msg.type  === 'ready') {
    isReady = true;
  }
};

while (!isReady) {}

new Worker(...) 只会为 Worker 创建绑定,但会等到当前浏览器循环周期结束才实际生成它,那时 worker 才能发布“ready”消息。 但是,上面代码使用 while (!isReady) {} 循环阻止了浏览器事件循环,该循环等待工作线程的响应,是一个典型的死锁例子。

为了解决这个限制,Emscripten 有一个设置来预初始化自己的线程池 (-s PTHREAD_POOL_SIZE=...)。 使用时,Emscripten 将在启动时创建并异步等待所有 Worker,并且所有后续的 pthread_create 操作都不必等待事件循环。 相反,可以通过 WebAssembly 共享内存共享数据。

在上面的例子中,启动是完全同步的,所以也不能使用这个选项,必须找到一种方法来完全避免使用线程池。

事实证明,浏览器中的 Web Worker API 和 Node.js 中的 worker_threads Worker API 之间鲜为人知但显著的区别之一是后者完全按照要求行事: new worker_threads.Worker(...) 立即生成一个工作线程 ,这允许阻止当前线程的事件循环。 WebContainer 也以 Node.js 兼容的方式实现了如此模糊的差异!

Emscripten 无法利用它的原因是流程如下:

  • 主线程通过 new Worker 创建一个 Worker 并订阅其消息。
  • 主线程向 Worker 发送包含 Wasm 模块和其他一些其他消息“load”。
  • Worker 通过 Wasm 模块接收“load”消息,加载相关 JS 文件,并异步初始化运行时。
  • Worker 初始化完成, 然后它向主线程发送一条“loaded”消息。
  • 主线程收到“loaded”消息。
  • 主线程向 Worker 发送一条消息“run”,其中包含指向 pthread 回调的指针和其他相关信息。
  • 工作线程收到“run”消息并执行 pthread

Node.js 可以同步执行步骤 1-4,但在步骤 5 上接收消息需要异步等待事件循环,因为消息是作为常规事件接收的。 而且,正如之前提到的,我们无法承受任何异步操作,因为启动必须完全同步。

但是如果根本没有等待工作进程初始化怎么办? worker.postMessage 不会立即发送消息,而是将它们添加到内部队列中。 它的设计方式是为了确保不会丢失消息,并且如果用户在 Worker 准备好接受消息之前发送消息,也不会收到错误消息。

在 Node.js 中,这意味着我们可以生成一个新的 Worker,发送“load”和“run”命令,并阻止(例如通过 pthread_join)等待 WebAssembly 共享内存中的条件,所有这些都在同一个事件循环 tick 中 ,不会死锁或等待任何异步事件。

新流程如下所示:

  • 主线程通过 new Worker 创建一个 Worker 并订阅其消息。
  • 主线程向 Worker 发送包含 Wasm 模块和其他一些消息“load”。
  • 主线程向 Worker 发送一条消息“run”,其中包含指向 pthread 回调的指针和其他相关信息。
  • Worker 通过 Wasm 模块接收“load”消息,加载相关 JS 文件,并异步初始化运行时。
  • Worker 将所有其他传入消息存储到队列中(在本例中,它只是一条消息“run”)。
  • Worker 初始化完成。 它向主线程发送一条“loaded”消息。
  • Worker 执行所有排队的消息(在本例中,消息“run”,因此它执行 pthread)。

作者在上面的 Emscripten PR 中实现了这一点,因此从版本 3.1.29 开始,开发者可以在 Node.js 中使用 PThreads,而无需完全使用 Worker 池,或者生成比池中可用线程更多的线程,而不会出现死锁。 与 -s WASM_ASYNC_COMPILATION=0 结合使用,启动支持完全同步。

I/O

Node.js 有各种 I/O 句柄对象 ,包括 Workers。 所有此类句柄都有用于显式引用控制的方法:.ref() 将其标记为强引用,.unref() 将其标记为弱引用。 仅当所有强引用句柄都未被引用或被垃圾回收时,Node.js 才会退出。 这就是 Node.js 服务器如何无限期地保持活动状态,或者 CLI 在等待用户输入或 fetch 调用响应时不会意外退出的原因。

由于 Worker 只是另一个强引用句柄,因此 Node.js 过于谨慎,在 Worker 仍在执行时需要保持主进程处于活动状态。 例如,创建一个具有无限 while(true)的 worker; 即使阻塞代码在后台线程中运行,循环也会使主进程永远保持活动状态。 阻止它的唯一方法是强制 .terminate() Worker 或至少 .unref() 将其标记为弱引用。

两者之间,.unref() 是更优雅的解决方案。 但是,开发者需要知道何时调用它:如果太晚取消引用 Worker,应用程序会出现阻塞并且不会退出,如果太早取消引用,将不会从 Worker 获得重要的 onmessage 事件,因为应用程序已经退出并且异步流程将被破坏:

const { Worker } = require('worker_threads');

let worker = new Worker('postMessage("ready");', { eval: true });

worker.onmessage = (event) => {
  // never reached
  console.log("Worker initialised, now let's do some actual work");
};

worker.unref();

多线程 Emscripten 应用程序通常通过使用 -s EXIT_RUNTIME 设置来解决此问题,该设置会在主 C 函数完成执行时强制退出应用程序。 也就是说,它调用 process.exit(0) 来终止 Node.js 应用程序以及任何生成的工作线程。 这适用于可执行文件,但不适用于库,因为它们没有主入口点,而是一个单独导出的列表,即使有,也不想在任意库之后杀死整个应用程序。

Dominic Elm 提出了一个解决方案,即 ref / .unref “dance”,以便每次发送一些实际工作(PThread 函数) )到 Worker 时,它会被强引用,一旦知道它完成执行并作为空闲 Worker 位于 Emscripten 池中,就会再次将其标记为弱引用。 代码最终比查找相关测试并编写随附的 PR 解释简单得多,并且它非常适合常见场景!

加上这些调整,启动现在完全同步,并且测试在图像处理完成后退出,而不是更早,这使得该模块与本机插件 API 完全兼容。

Sharp 顺利支持 WebAssembly

WebAssembly 版本的 Sharp 基准测试结果看起来非常有希望(所有执行都将并发设置为 2,因为这是在 WebContainers 环境中设置的,并且使用 Turbofan 减少启动开销):

最显著的区别在于依赖 SIMD 的编解码器和操作。 虽然 WebAssembly 具有 SIMD 支持,但必须使用内在函数来利用 Emscripten 的可移植层,或者在单独的汇编文件中手动编写 WebAssembly 指令,就像其他架构一样。 虽然正在为使用 SIMD 内在函数的库交叉编译 SIMD 支持,但不幸的是,其他一些库依赖于原始汇编,目前必须使用较慢的实现进行编译。

总而言之,这是一个非常令人兴奋的项目。 虽然仍然缺少一些功能,但它将解锁新的用例,对 StackBlitz.com 上的许多用户以及其他依赖于图像处理或优化的用户非常有利。

参考资料

https://github.com/GoogleChromeLabs/squoosh

https://www.npmjs.com/package/@squoosh/lib

https://github.com/lovell/sharp

https://blog.stackblitz.com/posts/bringing-sharp-to-wasm-and-webcontainers/

https://github.com/libvips/libvips

https://github.com/kleisauke/wasm-vips

https://github.com/GNOME/librsvg

https://github.com/RazrFalcon/resvg

https://platform.uno/blog/using-webassembly-modules-in-c/

https://www.libvips.org/2019/11/29/True-streaming-for-libvips.html

相关推荐

MySQL进阶五之自动读写分离mysql-proxy

自动读写分离目前,大量现网用户的业务场景中存在读多写少、业务负载无法预测等情况,在有大量读请求的应用场景下,单个实例可能无法承受读取压力,甚至会对业务产生影响。为了实现读取能力的弹性扩展,分担数据库压...

Postgres vs MySQL_vs2022连接mysql数据库

...

3分钟短文 | Laravel SQL筛选两个日期之间的记录,怎么写?

引言今天说一个细分的需求,在模型中,或者使用laravel提供的EloquentORM功能,构造查询语句时,返回位于两个指定的日期之间的条目。应该怎么写?本文通过几个例子,为大家梳理一下。学习时...

一文由浅入深带你完全掌握MySQL的锁机制原理与应用

本文将跟大家聊聊InnoDB的锁。本文比较长,包括一条SQL是如何加锁的,一些加锁规则、如何分析和解决死锁问题等内容,建议耐心读完,肯定对大家有帮助的。为什么需要加锁呢?...

验证Mysql中联合索引的最左匹配原则

后端面试中一定是必问mysql的,在以往的面试中好几个面试官都反馈我Mysql基础不行,今天来着重复习一下自己的弱点知识。在Mysql调优中索引优化又是非常重要的方法,不管公司的大小只要后端项目中用到...

MySQL索引解析(联合索引/最左前缀/覆盖索引/索引下推)

目录1.索引基础...

你会看 MySQL 的执行计划(EXPLAIN)吗?

SQL执行太慢怎么办?我们通常会使用EXPLAIN命令来查看SQL的执行计划,然后根据执行计划找出问题所在并进行优化。用法简介...

MySQL 从入门到精通(四)之索引结构

索引概述索引(index),是帮助MySQL高效获取数据的数据结构(有序),在数据之外,数据库系统还维护者满足特定查询算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构...

mysql总结——面试中最常问到的知识点

mysql作为开源数据库中的榜一大哥,一直是面试官们考察的重中之重。今天,我们来总结一下mysql的知识点,供大家复习参照,看完这些知识点,再加上一些边角细节,基本上能够应付大多mysql相关面试了(...

mysql总结——面试中最常问到的知识点(2)

首先我们回顾一下上篇内容,主要复习了索引,事务,锁,以及SQL优化的工具。本篇文章接着写后面的内容。性能优化索引优化,SQL中索引的相关优化主要有以下几个方面:最好是全匹配。如果是联合索引的话,遵循最...

MySQL基础全知全解!超详细无废话!轻松上手~

本期内容提醒:全篇2300+字,篇幅较长,可搭配饭菜一同“食”用,全篇无废话(除了这句),干货满满,可收藏供后期反复观看。注:MySQL中语法不区分大小写,本篇中...

深入剖析 MySQL 中的锁机制原理_mysql 锁详解

在互联网软件开发领域,MySQL作为一款广泛应用的关系型数据库管理系统,其锁机制在保障数据一致性和实现并发控制方面扮演着举足轻重的角色。对于互联网软件开发人员而言,深入理解MySQL的锁机制原理...

Java 与 MySQL 性能优化:MySQL分区表设计与性能优化全解析

引言在数据库管理领域,随着数据量的不断增长,如何高效地管理和操作数据成为了一个关键问题。MySQL分区表作为一种有效的数据管理技术,能够将大型表划分为多个更小、更易管理的分区,从而提升数据库的性能和可...

MySQL基础篇:DQL数据查询操作_mysql 查

一、基础查询DQL基础查询语法SELECT字段列表FROM表名列表WHERE条件列表GROUPBY分组字段列表HAVING分组后条件列表ORDERBY排序字段列表LIMIT...

MySql:索引的基本使用_mysql索引的使用和原理

一、索引基础概念1.什么是索引?索引是数据库表的特殊数据结构(通常是B+树),用于...