一种基于websocket的网页实时语音通信方法
技术领域
1.本发明涉及智能视频监控领域领域,具体涉及了一种基于websocket的网页实时语音通信方法。
背景技术:2.随着wifi和互联网的发展,其覆盖率越来越广,互联网的共享特性给人们带来了极大的便利。智能视频监控系统已经深入应用于各个行业领域,如公安,园区楼宇、文教卫、交通等等各个行业。在各种应用中,都会有配套的后端管理系统,可以实时查看每个监控画面,及与设备的实时语音通信等。目前配套监控系统的实时语音功能大多数都需要下载pc客户端或插件,手机端下载app,利用客户端原生采集语音及tcp连接进行实时语音采集与通信。
3.随着目前各个浏览器厂商的发展与升级,浏览器的功能及权限也越来越大,每个电脑及移动设备都会安装浏览器。要是能够通过web界面进行实时语音通信的话,就可以做到随时随地无需下载客户端或插件就可通信。在专利cn201710602668.7 《一种基于扫描二维码实现的网页实时语音通信方法》中,有实现网页实时通信方法,该发明主要是通过生成特地地址的二维码,手机扫描进入特定的页面地址,基于webrct进行实时语音采集跟通信。由于webrtc协议在浏览器的兼容性上并不是很好,目前只有高版本chrome浏览器支持,这也是改发明最大的局限性。webrtc主要应用在原生app或pc客户端,进行实时视频互动等功能,其开放了底层api功能,可以进行二次开发。而在浏览器端,只有提供上层的接口调用。
技术实现要素:4.针对现有技术的不足,本发明提供一种基于浏览器采集语音,通过浏览器建立websocket与服务器进行实时连接推送语音通信,无需下载客户端或插件,且支持各种主流浏览器,可以随时随地地与视频监控设备进行实时语音通信,很大程度上便捷了管理人员或是使用者的管理和维护的基于websocket的网页实时语音通信方法。
5.本发明的一种基于websocket的网页实时语音通信方法,采用以下技术方案:应用于智能视频监控系统,所述智能视频监控系统包括网页端、服务器端、流媒体端以及视频设备,所述网页端和服务器端通过websocket通信连接,网页端实时采集语音,将获取到的语音流实时推送给服务器,服务器获取到语音流转码生成标准pcma音频流推送给流媒体端,流媒体端推送到视频设备实时语音播放。
6.进一步,其包括以下步骤:s1、用户在网页端的视频监控页面上,发起语音通信请求;s2、服务器端根据设视频设备的编码获取当前视频设备的信息,建立网页端与服务器端的websocket实时连接、服务器与流媒体端建立tcp连接以及流媒体端与视频设备的连接;s3、网页端开启获取语音权限,配置采集参数,采集用户语音生成语音流,通过
websocket实时推送到服务器端;s4、服务器端接收到语音流后,将语音流转成标准pcma音频流,通过tcp连接发送rtp包与标准pcma音频流到流媒体端;s5、流媒体端收到标准pcma音频流后,推送到视频设备上播放;s6、用户语音完毕,在网页端请求关闭语音通信,网页端终止语音采集,并断开与服务器端的websocket连接,服务器断开与流媒体端的tcp连接,流媒体断开与视频设备的连接。
7.与现有技术相比,本发明的有益效果:采用浏览器采集语音,通过浏览器建立websocket与服务器进行实时连接推送语音通信,无需下载客户端或插件,且支持各种主流浏览器,可以随时随地地与视频监控设备进行实时语音通信,很大程度上便捷了管理人员或是使用者的管理和维护,可以应用在安防、交通、文卫等各个智能视频监控领域场景下,进行便捷式的进行实时语音通信,用户无需在特定的带有客户端或插件的电脑或手机上,进行与监控设备的实时语音通信,只需要在web页面上访问,即可进行语音喊话通信功能;移动端可以在浏览器、公众号等访问h5界面就能进行实时语音通信。
附图说明
8.此处所说明的附图用来提供对本申请的进一步理解,在附图中:图1为本发明实施例的流程图。
具体实施方式
9.参见图1所示,实施例的一种基于websocket的网页实时语音通信方法,其应用于智能视频监控系统,所述智能视频监控系统包括网页端、服务器端、流媒体端以及视频设备,所述网页端和服务器端通过websocket通信连接,网页端实时采集语音,将获取到的语音流实时推送给服务器,服务器获取到语音流转码生成标准pcma音频流推送给流媒体端,流媒体端推送到视频设备实时语音播放。
10.其包括以下步骤:s1、用户在网页端的视频监控页面上,发起语音通信请求;s2、服务器端根据设视频设备的编码获取当前视频设备的信息,建立网页端与服务器端的websocket实时连、服务器与流媒体端建立tcp连接以及流媒体端与视频设备的连接;s3、网页端开启获取语音权限,配置采集参数,采集用户语音生成语音流,通过websocket实时推送到服务器端;s4、服务器端接收到语音流后,将语音流转成标准pcma音频流,通过tcp连接发送rtp包与标准pcma音频流到流媒体端;s5、流媒体端收到标准pcma音频流后,推送到视频设备上播放;s6、用户语音完毕,在网页端请求关闭语音通信,网页端终止语音采集,并断开与服务器端的websocket连接,服务器断开与流媒体端的tcp连接,流媒体断开与视频设备的连接。
11.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以
理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
技术特征:1.一种基于websocket的网页实时语音通信方法,应用于智能视频监控系统,所述智能视频监控系统包括网页端、服务器端、流媒体端以及视频设备,其特征在于:所述网页端和服务器端通过websocket通信连接,网页端实时采集语音,将获取到的语音流实时推送给服务器,服务器获取到语音流转码生成标准pcma音频流推送给流媒体端,流媒体端推送到视频设备实时语音播放。2.根据权利要求1所述的一种基于websocket的网页实时语音通信方法,其特征在于:其包括以下步骤:s1、用户在网页端的视频监控页面上,发起语音通信请求;s2、服务器端根据设视频设备的编码获取当前视频设备的信息,建立网页端与服务器端的websocket实时连接、服务器与流媒体端建立tcp连接以及流媒体端与视频设备的连接;s3、网页端开启获取语音权限,配置采集参数,采集用户语音生成语音流,通过websocket实时推送到服务器端;s4、服务器端接收到语音流后,将语音流转成标准pcma音频流,通过tcp连接发送rtp包与标准pcma音频流到流媒体端;s5、流媒体端收到标准pcma音频流后,推送到视频设备上播放;s6、用户语音完毕,在网页端请求关闭语音通信,网页端终止语音采集,并断开与服务器端的websocket连接,服务器断开与流媒体端的tcp连接,流媒体断开与视频设备的连接。
技术总结本发明涉及一种基于WebSocket的网页实时语音通信方法,其应用于智能视频监控系统,所述智能视频监控系统包括网页端、服务器端、流媒体端以及视频设备,其特征在于:所述网页端和服务器端通过WebSocket通信连接,网页端实时采集语音,将获取到的语音流实时不断地推送给服务器,服务器获取到语音流转码生成标准pcma音频流推送给流媒体端,流媒体端推送到视频设备进行实时语音播放,采用以上技术方案基于浏览器采集语音,通过浏览器建立WebSocket与服务器进行实时连接推送语音通信,无需下载客户端或插件,且支持各种主流浏览器,可以随时随地地与视频监控设备进行实时语音通信。时随地地与视频监控设备进行实时语音通信。时随地地与视频监控设备进行实时语音通信。
技术研发人员:郭海涛 黄志新 黄晶 王涵
受保护的技术使用者:中电福富信息科技有限公司
技术研发日:2021.12.22
技术公布日:2022/4/1