百度360必应搜狗淘宝本站头条
当前位置:网站首页 > IT技术 > 正文

PHP对接百度语音识别技术

wptr33 2025-01-03 19:19 12 浏览

引言

在目前的各种应用场景中,语音识别技术已经越来越常用,并且其应用场景正在不断扩大。

百度提供的语音识别服务允许用户通过简单的接口调用,将语音内容转换为文本。

本文将通过PHP语言集成百度的语音识别服务,并分享一些实施过程中的技巧和需要注意的问题。

准备工作

1.注册百度开放平台账号

在百度官网https://open.baidu.com/ 注册一个账号

2.创建应用并获取API Key和Secret Key

注册完毕后,登录百度开放平台;

点击左侧菜单栏中的"AI开放平台";

然后选择"语音技术",再选择"语音识别"。

在语音识别页面中,点击"创建应用",填写相关信息并提交。

创建成功后,我们可以在应用管理页面中获得API Key和Secret Key;

这两个密钥将在后续中使用。

3.运行命令安装Laravel框架百度平台扩展包

composer require zhangyu-cq/laravel-baidu-aip

发布配置

php artisan vendor:publish --provider="ZhangyuCq\LaravelBaiduAip\BaiduAipServiceProvider"

配置对应的密钥

    return [
        'app_id' => env('BAIDU_APP_ID',''),
        'app_key' => env('BAIDU_APP_KEY',''),
        'app_secret' => env('BAIDU_APP_SECRET','')
    ];

封装百度语音识别接口

百度语音转文字

public function asrChar(Request $request)
    {
        $this->validate($request, [
            'file' => 'required',
        ]);
        $file = $request->file('file');
        $name = $file->getClientOriginalName();
        $file_info = pathinfo($name);
        $file = file_get_contents($file);
        $data = AipSpeech::asr($file, $file_info['extension'], 16000, ['dev_pid' => 1537]);
        if ($data['err_no'] == 0) {
            $text = $data['result'][0];
            echo $text;
        } else {
            echo '转译失败:'.$data['err_msg'];
        }
    }

百度文字转语音

    public function synthesis(Request $request)
    {
        $this->validate($request, [
            'content' => 'required',
        ]);
        $content = $request->get('content');
        $data = AipSpeech::synthesis($content, 'zh', 1, array(
            'vol' => 5,
        ));
        $time = date('YmdHis') . rand(111111, 999999);
        //设置上传到哪个目录下
        $path = '/uploads/synthesis';
        $file_name = "/$time.mp3";
        //没有则创建
        if (!file_exists(public_path() . $path)) {
            mkdir(public_path() . $path, 0755, true);
        }
        file_put_contents(public_path() . $path . $file_name, $data);
        echo '文件路径如下:'.$path . $file_name;
    }

踩坑日记

百度语音识别接口对音频文件有特定的要求:它仅接受16KHz采样率的wav格式文件。

如果需要识别的音频文件不符合这些要求,必须先转换成合适的格式和采样率。

此外,接口对音频的长度也有限制,单次识别不能超过60秒,因此长音频需要被分割成多个短片段。

在使用接口时,还需要注意错误处理:

通过检查返回结果中的err_no来判断识别是否成功,并根据err_msg字段来处理识别失败的情况。

结论

我们已经能够成功地集成PHP与百度语音识别接口,并根据接口返回的数据执行相应的操作。

在实际的开发过程中,我们还可以进一步扩展功能,例如实现实时的语音识别服务或语音合成技术,以满足更广泛的业务需求。


– 欢迎点赞、关注、转发、收藏【我码玄黄】,gonghao同名

相关推荐

针对 MySQL 数据库的 HikariCP 数据库连接池 配置详解

HikariCP是当前性能最优异的数据库连接池之一,尤其适用于高并发场景。以下是针对MySQL数据库的HikariCP配置详解,包含常用参数及其优化建议。HikariCP是当前性能最优异的...

MySQL 数据同步神器 - Canal 入门篇

前言想必做过商品服务都是将商品相关的信息和价格保存在数据库中,例如...

MySQL之慢查询日志分析

一、慢查询设置与测试1、慢查询介绍MySQL的慢查询,全名是慢查询日志,是MySQL提供的一种日志记录,用来记录在MySQL中响应时间超过阈值的语句。...

「MySQL学习」MySQL的变量

MySQL的变量分为四种:局部变量、用户变量、会话变量和全局变量,其中局部变量只存在于函数和存储过程,这里不多了解。其中会话变量和全局变量在MySQL中统称为系统变量用户...

MySQL日志篇

今天我们介绍一下MySQL中特别重要的一项内容——日志!MySQL中日志有很多,我们前文提到的redolog、undolog、以及今天要提到的binlog。...

MySQL--视图

介绍视图是指计算机数据库中的视图,是一个虚拟表,其内容由查询定义。同真实的表一样,视图包含一系列带有名称的列和行数据。但是,视图并不在数据库中以存储的数据值集形式存在。行和列数据来自由定义视图的查询所...

MySQL中like会不会走索引?

先说结论:like"%关键字":不会;like"%关键字%":不会like"关键字%":会说明:...

MySQL正则 rlike(regexp)

在MySQL中,like、rlike和regexp都不区分大小写,如果需要区分,可以在WHERE后添加关键字段binary1.LIKE可以使用以下两个通配符:%...

开源文档预览项目 kkFileView (9.9k star) ,快速入门

kkFileView是一款文件文档在线预览解决方案,采用流行的SpringBoot框架构建,易于上手和部署。该项目基本支持主流办公文档的在线预览,包括但不限于doc、docx、xls、xls...

帮你打造一个私有化的在线个人文档系统

前言最近开发的过程中总是需要找寻一些资料,但是某些资料或者是某段可用的代码,已经忘记放在了哪个文档中了,看着电脑上搜索出来的几百个txt文件,我陷入了一阵无力感中,于是我想能不能搞个在线文档,就像“语...

Container 命令ctr、crictl 命令使用说明

一、ctr命令使用Container命令ctr,crictl的用法版本:ctrcontainerd.io1.4.3containerd相比于docker,多了...

Docker常用命令(2)

目录Docker重启策略配置容器环境变量...

快速搭建自己的镜像仓库

搭建docker镜像仓库1.准备找一台机器为镜像仓库的主机.创建好存放镜像数据文件的目录.例如...

整合 kkfile 实现文件预览

一、简介...

隐私计算FATE-核心概念与单机部署

一、说明Fate是一个工业级联邦学习框架,所谓联邦学习指的就是可以联合多方的数据,共同构建一个模型;...