百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

我不允许自己还不了解AI流式数据的传输原理

wptr33 2025-01-03 19:20 17 浏览

前言

在日常工作中,相信大家对AI大模型的运用已经掌握得非常熟练,无论是通过大模型平台使用还是通过服务商提供的SDK来使用。

但亲手去实现从后端发送流式数据到前端接收流式数据这个过程,可能就涉及得不多。

今天我们就来简单实现一下这过程。

AI流式数据接口请求模式包括三种:

RESTful API:需要客户端频繁轮询服务器以获取更新,增加了延迟和网络负载,不适合实时数据流。

WebSocket:最适合双向流式数据,提供低延迟、全双工通信,非常适合实时双向数据流,如聊天应用和在线游戏。

Server-Sent Events (SSE):适合单向流式数据,实现简单,自动重连,适合服务器向客户端推送实时更新,但不支持客户端向服务器发送数据。

这里我们采用 Server-Sent Events 的请求模式。



PHP发送流式数据

后端代码使用PHP来实现流式数据的返回,用的是Laravel框架的路由:

Route::post('testStream', function () {
    set_time_limit(0);

    $str = '《唐诗三百首》共八卷(或作六卷),选诗三百一十首,不同刻本有三百二十一首、三百一十七首、三百零二首等多种,常用底本光绪年间的四藤吟社本为三百一十三首。称“三百首”可能是沿袭“诗三百”的说法,只是取其整数而已。此书分体编排,有五言古诗、七言古诗、五言律诗、七言律诗、五言绝句、七言绝句及乐府诸体,其中古体诗占三分之一,近体诗占三分之二。虽然全部作品只占全唐诗的一百六十分之一,但不少是唐诗传世佳作。此书收录作者七十七人,包括帝王、士大夫、僧人、歌女、无名氏等,大多数为唐诗代表作家。其中杜甫三十九首,王维二十九首,李白二十九首,李商隐二十四首,孟浩然、韦应物、杜牧各有十多首。从体裁来看,李白多收五、七言古诗和乐府,韦应物多收五言古诗,王昌龄多收七言绝句,李颀多收七言歌行;而且古体诗以盛唐为主,近体诗则多选中、晚唐。入选诗作有不少是唐诗中的名篇,大都通俗易解,艺术性较高,便于吟诵;其中不乏描写生活琐事、抒发个人情怀的诗作,间有内容空洞、形式呆板的应制、酬答之作。编者对入选的诗作还有选择地加以批语,简明扼要,对读者多有启发。有的批语虽只点一下,但颇耐回味。';

    return response()->stream(function () use ($str) {
        $chunks = mb_str_split($str, 10);
        foreach ($chunks as $chunk) {
            // 发送数据事件
            echo "data: " . htmlspecialchars($chunk) . "\n\n";

            // 强制输出缓冲区的内容
            ob_flush();
            flush();

            // 延迟一秒
            sleep(1);
        }

        // 关闭连接
        echo "data: Stream has ended.\n\n";

        // 确保所有数据都被发送
        ob_end_flush();
        flush();
    }, 200, [
        'Content-Type' => 'text/event-stream;charset=utf-8',
        'Cache-Control' => 'no-cache',
        'X-Accel-Buffering' => 'no',
        'Connection' => 'keep-alive'
    ]);
});

返回内容是一个固定的字符串,将其分片后依次返回。

注意Server-Sent Events的方式需要保证每行数据以 \n\n 两个换行符结尾。

header头参数:

  • Content-Type: text/event-stream;charset=utf-8 指定响应为SSE事件流,并使用UTF-8编码以支持多语言字符。
  • Cache-Control: no-cache 禁止浏览器缓存响应,确保客户端总是接收最新的实时数据。
  • X-Accel-Buffering: no 禁用Nginx的自动缓冲,使服务器生成的数据能够立即发送到客户端,减少延迟。
  • Connection: keep-alive 保持HTTP连接开放,允许服务器持续向客户端推送数据,提高性能并减少TCP握手的开销。

这里补充下SSE的消息格式

SSE消息由一系列字段组成,每个字段以冒号(: )开头,后面跟着字段值。常见的字段包括:

data::包含实际的数据内容。

event:指定事件类型,默认为message

id:为事件分配一个唯一的ID,用于自动重连时恢复最后收到的消息。

retry:指定客户端在连接断开后重新连接的等待时间(毫秒)。

每个字段必须以换行符(\n)结尾。一条完整的消息必须以两个换行符(\n\n)结尾,表示消息的结束。

如果消息包含多行数据,每行也应以换行符结尾。

JS接收流式数据

<html>

<body>
  <div id="message"></div>
</body>

<script>
  const text = document.getElementById('text');

  async function request() {
    const response = await fetch('http://127.0.0.1:8000/api/testStream', {
      method: 'POST',
    });

    if (!response.ok) {
      throw new Error(`HTTP error! status: ${response.status}`);
    }

    const reader = response.body.getReader();
    const decoder = new TextDecoder('utf-8');

    try {
      while (true) {
        const { done, value } = await reader.read();
        if (done) {
          break;
        }

        let text = decoder.decode(value, { stream: true });
        // 将文本按行分割,逐行处理
        const lines = text.split('\n');
        for (const line of lines) {
          // 忽略空行和非 data: 开头的行
          if (!line.trim() || !line.startsWith('data:')) continue;
          // 去掉 'data:' 前缀并处理剩余内容
          const content = line.substring(5).trim();
          message.innerHTML += content;
        }
      }
    } catch (error) {
      console.error('Stream reading error:', error);
    }
  }

  request();
</script>

</html>

我们通过fetch来请求后端数据

while (true) 来阻塞JS代码执行,持续从后端获取数据流

然后将得到数据用\n进行分割,去掉前缀 data:,拿到具体的内容

最后将得到的结果展示在浏览器上:

– 欢迎点赞、关注、转发、收藏【我码玄黄】,各大平台同名。

相关推荐

针对 MySQL 数据库的 HikariCP 数据库连接池 配置详解

HikariCP是当前性能最优异的数据库连接池之一,尤其适用于高并发场景。以下是针对MySQL数据库的HikariCP配置详解,包含常用参数及其优化建议。HikariCP是当前性能最优异的...

MySQL 数据同步神器 - Canal 入门篇

前言想必做过商品服务都是将商品相关的信息和价格保存在数据库中,例如...

MySQL之慢查询日志分析

一、慢查询设置与测试1、慢查询介绍MySQL的慢查询,全名是慢查询日志,是MySQL提供的一种日志记录,用来记录在MySQL中响应时间超过阈值的语句。...

「MySQL学习」MySQL的变量

MySQL的变量分为四种:局部变量、用户变量、会话变量和全局变量,其中局部变量只存在于函数和存储过程,这里不多了解。其中会话变量和全局变量在MySQL中统称为系统变量用户...

MySQL日志篇

今天我们介绍一下MySQL中特别重要的一项内容——日志!MySQL中日志有很多,我们前文提到的redolog、undolog、以及今天要提到的binlog。...

MySQL--视图

介绍视图是指计算机数据库中的视图,是一个虚拟表,其内容由查询定义。同真实的表一样,视图包含一系列带有名称的列和行数据。但是,视图并不在数据库中以存储的数据值集形式存在。行和列数据来自由定义视图的查询所...

MySQL中like会不会走索引?

先说结论:like"%关键字":不会;like"%关键字%":不会like"关键字%":会说明:...

MySQL正则 rlike(regexp)

在MySQL中,like、rlike和regexp都不区分大小写,如果需要区分,可以在WHERE后添加关键字段binary1.LIKE可以使用以下两个通配符:%...

开源文档预览项目 kkFileView (9.9k star) ,快速入门

kkFileView是一款文件文档在线预览解决方案,采用流行的SpringBoot框架构建,易于上手和部署。该项目基本支持主流办公文档的在线预览,包括但不限于doc、docx、xls、xls...

帮你打造一个私有化的在线个人文档系统

前言最近开发的过程中总是需要找寻一些资料,但是某些资料或者是某段可用的代码,已经忘记放在了哪个文档中了,看着电脑上搜索出来的几百个txt文件,我陷入了一阵无力感中,于是我想能不能搞个在线文档,就像“语...

Container 命令ctr、crictl 命令使用说明

一、ctr命令使用Container命令ctr,crictl的用法版本:ctrcontainerd.io1.4.3containerd相比于docker,多了...

Docker常用命令(2)

目录Docker重启策略配置容器环境变量...

快速搭建自己的镜像仓库

搭建docker镜像仓库1.准备找一台机器为镜像仓库的主机.创建好存放镜像数据文件的目录.例如...

整合 kkfile 实现文件预览

一、简介...

隐私计算FATE-核心概念与单机部署

一、说明Fate是一个工业级联邦学习框架,所谓联邦学习指的就是可以联合多方的数据,共同构建一个模型;...