WO2014161402A2 - 分布式视频会议实现方法、系统、终端、音视频一体化设备 - Google Patents
分布式视频会议实现方法、系统、终端、音视频一体化设备 Download PDFInfo
- Publication number
- WO2014161402A2 WO2014161402A2 PCT/CN2014/072520 CN2014072520W WO2014161402A2 WO 2014161402 A2 WO2014161402 A2 WO 2014161402A2 CN 2014072520 W CN2014072520 W CN 2014072520W WO 2014161402 A2 WO2014161402 A2 WO 2014161402A2
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- video
- audio
- integrated device
- information
- conference terminal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
Definitions
- the present invention relates to video conferencing, and in particular, to a distributed video conferencing implementation method and system, a terminal, and an audio and video integrated device.
- the video conferencing system generally consists of a video conferencing terminal, a video conferencing external device, and a cable for connecting the terminal to the external device, as shown in FIG.
- the video conference terminal is responsible for coordinating the operation of each unit of the entire conference system, including codec output of audio and video signals, packaging and unpacking of audio and video code streams, and interaction with other video conference terminals for multimedia information.
- Video conferencing peripherals typically include multimedia signal collection, generation, and display devices such as audio, video, and data, such as cameras, microphones, speakers, computers, televisions, projectors, and more.
- Each type of external device can be generally multiple, and the wiring is varied depending on the information exchange between different external devices and the conference terminal. This easily leads to the following problems:
- the embodiment of the invention provides a distributed video conference implementation method and system, a terminal, an audio and video integration device, and reduces the complexity of the video conference system wiring and the terminal.
- the embodiment of the invention discloses an audio and video integration device, which comprises:
- a video collection unit configured to collect video information of a conference site, where the video information of the sound source location at the conference site is included;
- An audio collection unit configured to collect audio information of a video conference
- a network communication unit configured to transmit the collected audio and video information to the video conference terminal.
- the foregoing apparatus further includes:
- a video encoding unit configured to encode and compress the video information of the set; and an audio encoding unit configured to encode and compress the collected audio information.
- the network communication unit transmits the collected audio and video information to the video conference terminal by:
- the network communication unit packages the encoded audio and video code streams into a media stream real-time transmission protocol format and transmits the format to the video conference terminal.
- the foregoing apparatus further includes:
- a device control unit configured to analyze audio information collected by the audio collection unit, locate a sound source location, and control the video collection unit to collect video information of the sound source location.
- the video collection unit uses one or a group of cameras.
- the device control unit controls the image of the optimal position of the camera to collect the image of the sound source position according to the sound source position, and the remaining cameras Collect images of different areas of the conference site separately.
- the network communication unit is configured to transmit the collected audio and video signals to the video conference terminal by using a wired connection or a wireless connection.
- the embodiment of the invention further discloses a video conference terminal, including:
- a network communication unit configured to receive audio and video stream packets sent by the audio and video integrated device; and an audio decoding output unit configured to decode the audio stream sent by the audio and video integrated device, and decode the decoded code Stream output to the output device;
- the video decoding output unit is configured to decode the video code stream sent by the audio and video integrated device, and output the decoded code stream to the output device.
- the video conference terminal further includes: An audio encoding unit configured to encode an audio code stream sent by the audio and video integrated device, and then send the encoded audio code stream to the audio decoding output unit;
- the video encoding unit is configured to encode the video code stream sent by the audio and video integrated device, and then send the encoded video code stream to the video decoding output unit.
- the video conference terminal further includes:
- a device access unit configured to send a video collection control instruction to the audio and video integrated device according to a user operation, to control the audio and video integrated device to collect a site image required by the user.
- the embodiment of the invention further discloses a distributed video conference system, comprising the above audio and video integration device, and the video conference terminal.
- the embodiment of the invention also discloses a distributed video conference implementation method, including:
- the audio and video integrated device collects the audio and video information of the conference site, and transmits the collected audio and video information to the video conference terminal, where the video information collected by the audio and video integrated device includes the sound source of the conference site. Location video information.
- the audio and video integrated device transmits the collected audio and video information to the video conference terminal, including:
- the audio and video integrated device directly transmits the collected audio and video information to the video conference terminal or
- the audio and video integrated device separately encodes and compresses the collected audio and video information, and packs the encoded compressed audio and video code streams into a media stream real-time transmission protocol format and transmits the format to the video conference terminal.
- the video information collected by the audio-video integrated device includes video information of a sound source location of the conference site, and includes:
- the audio and video integrated device collects audio information, it also analyzes the collected audio information, locates the sound source location of the conference site, and performs video collection on the located sound source location.
- the audio and video integrated device uses one or a group of cameras to collect video information.
- the audio and video integrated device uses a set of cameras
- the camera at the optimal position is controlled according to the sound source position, and the images of the sound source positions are collected, and the remaining cameras respectively collect the conferences. Images of different areas of the scene.
- the audio and video integrated device transmits the collected audio and video signals to the video conference terminal by using a wired connection or a wireless connection.
- the foregoing method further includes:
- the audio and video code streams in the audio and video stream packets are separately decoded and output to an output device.
- the foregoing method further includes:
- the video conference terminal separately encodes the audio and video code streams in the audio and video stream packets, and then separately decodes the encoded audio and video code streams.
- the foregoing method further includes:
- the video conference terminal sends a video collection control instruction to the audio and video integrated device according to a user operation
- the audio-video integrated device collects a site image requested by the user according to the video collection control command.
- the camera and microphone array integrated device used in the embodiment of the invention can reduce the number of wires, reduce the wiring complexity, and facilitate the layout of the conference room.
- the code is distributed to different integrated devices, and the video conference terminal is used as a decoding and conference control device, which improves the coding and decoding efficiency. At the same time, it can make the collection of audio and video closer to the user, quickly switch the picture according to the sound source, provide a variety of venue scene effects, and improve the overall effect of the video conference.
- FIG. 1 is a schematic structural diagram of a basic composition of an existing video conference system
- FIG. 2 is a schematic structural diagram of a distributed video conference system according to an embodiment of the present invention.
- FIG. 3 is a flowchart of a network connection between an audio-video integrated device and a video conference terminal according to an embodiment of the present invention
- FIG. 4 is a schematic diagram of an audio and video integrated device according to an embodiment of the present invention
- FIG. 5 is a flowchart of processing an audio and video signal of an audio-video integrated device according to an embodiment of the present invention
- FIG. 6 is a schematic diagram of a video conference terminal according to an embodiment of the present invention
- FIG. 7 is a flowchart of processing audio and video data of a video conference terminal according to an embodiment of the present invention
- FIG. 8 is a structural diagram of a conference system according to an embodiment of the present invention
- FIG. 9 is a structural diagram of a conference system according to another embodiment of the present invention.
- the present invention provides a distributed video conferencing system.
- the present invention includes at least an audio and video integrated device, a video conferencing terminal, and a computer and an output device.
- the audio and video integrated device is used for collecting audio and video signals and interacting with the video conference terminal.
- Video conferencing terminal used for audio and video data decoding, audio and video data output and interaction with other video conferencing terminals.
- Computer used to control video conferencing external devices, control video conferencing terminals, transmit other audio and video data, etc.
- Output device for outputting audio and video data.
- the process of connecting the audio and video integrated device and the video conference terminal network in the distributed video conference system is as shown in FIG. 3, and includes the following steps:
- Step 301 The user requests the audio and video integrated device to connect to the video conference terminal.
- Step 302 The audio and video integrated device sends a connection request to the video conference terminal.
- Step 303 The video conference terminal accepts a connection request.
- Step 304 The audio and video integrated device requests a control instruction from the video conference terminal.
- Step 305 The video conference terminal sends a control instruction to the audio and video integrated device.
- Step 306 the user requests the audio-video integrated device to disconnect from the video conference terminal.
- Step 307 The audio-video integrated device sends a disconnection request to the video conference terminal.
- Step 308 The video conference terminal processes the disconnection and releases the resource.
- Step 309 The audio and video integrated device processes the disconnection and releases the resources.
- the audio and video integrated device 40 in the above system is specifically described below. As shown in FIG. 4, the device includes the following units:
- the video collection unit 41 collects video information of the conference site, where the video information of the sound source location of the conference site is collected;
- the audio collection unit 42 collects audio information of the video conference
- the network communication unit 43 transmits the collected audio and video information to the video conference terminal.
- the foregoing audio and video integrated device may further have an encoding function, and further includes a video encoding unit 44 that encodes and compresses the collected video information, and an audio encoding that encodes and compresses the collected audio information.
- a video encoding unit 44 that encodes and compresses the collected video information
- an audio encoding that encodes and compresses the collected audio information.
- the network communication unit performs a wired or wireless connection with the network communication unit of the video conference terminal, and is used for connecting the audio coding unit to the audio decoding output unit of the video conference terminal, and the video decoding output unit for the video coding unit and the video conference terminal. connection.
- the network communication unit is configured to package the encoded compressed audio and video code streams into a media stream real-time transmission protocol format for transmission to the video conference terminal.
- the audio and video integrated device may further include:
- the device control unit 46 is configured to connect the video collection unit 41 and the audio collection unit 42 to analyze the collected audio signal, locate the sound source, and then transmit the control information to the video collection unit 41 to control the camera. , collecting sound source position image information.
- the video collection unit 41 can use one or a group of cameras.
- the device control unit 46 controls the camera at the optimal position according to the position of the sound source to collect the image of the sound source position, that is, the speaker who controls the best position to rotate the tracking sound.
- the remaining cameras collect images of different areas of the conference site.
- the audio and video integrated device may further include a conference control unit 47, which is mainly used for Conference connection and hang up, video conferencing device control, conference display mode control, communication protocol selection, network status monitoring, and system version upgrade.
- a conference control unit 47 which is mainly used for Conference connection and hang up, video conferencing device control, conference display mode control, communication protocol selection, network status monitoring, and system version upgrade.
- the process of processing the audio and video signals by the above audio and video integrated device is as shown in FIG. 5, and includes the following steps:
- Step 501 Acquire an audio signal by using an audio collection unit by using a video collection unit video signal
- Step 502 Locating a sound source according to an audio signal, controlling a video collection unit, and collecting an image signal of the sound source;
- Step 503 Encode the processed audio and video signals into audio and video coding formats required for the current video conference.
- Step 503 Packet the encoded audio and video code streams into a media stream real-time transmission protocol format.
- Step 505 Send the packaged audio and video code streams to the video conference terminal through the network communication unit.
- the video conference terminal 60 in the above system is further described below.
- the system includes the following units: a network communication unit 61, which receives audio and video stream packets sent by the audio and video integrated device; an audio decoding output unit 62, The audio code stream sent by the video integrated device is decoded, and the decoded code stream is output to the output device;
- the video decoding output unit 63 decodes the video code stream sent by the audio and video integrated device, and outputs the decoded code stream to the output device.
- the video conference terminal may also need to have an encoding function.
- an audio encoding unit 64 is further included, and the audio code stream sent by the audio and video integrated device is encoded, and then the encoded audio code stream is sent to The audio decoding output unit 62.
- a video encoding unit 65 which encodes the video code stream sent by the audio and video integrated device, and then sends the encoded video code stream to the video decoding output unit 63.
- the device access unit 66 is added.
- the unit sends a video collection control command to the audio and video integrated device according to the user operation.
- a site image that collects user needs by controlling audio and video integrated devices.
- the camera of the audio and video integrated device can be controlled to rotate to track the image of the speaker who has the loudest venue sound.
- the process of processing the audio and video data by the video conference terminal is as shown in FIG. 7, and includes the following steps:
- Step 701 Accept, by the network communication unit of the video conference terminal, the audio and video code stream packets sent by the audio and video integrated device.
- Step 702 If a video conference is performed online, the received audio and video code stream packets are sent to other video conference terminals via the network communication unit of the video conference terminal.
- Step 703 Perform unpacking processing on the received audio and video code stream packets to obtain a tone and video coding format code stream required by the current video conference.
- Step 704 The unpacked audio and video coding format code is outputted through the audio and video decoding output unit for decoding output.
- Step 705 Send the decoded audio and video code streams to the output device for output display.
- This embodiment provides a distributed video system, as shown in FIG. 8, including an audio-video integrated device and a video conference terminal.
- the audio and video integrated device includes a video collection unit, an audio collection unit, a control unit unit, an audio coding unit, a video coding unit, and a network communication unit.
- the video conference terminal includes a device access unit, a conference control unit, an audio decoding output unit, a video decoding output unit, and a network communication unit.
- the embodiment is based on an audio-video integrated device, and integrates a coding unit of a video and a coding unit of an audio into an integrated device, performs encoding according to a video signal collected by the camera, and encodes the audio signal according to the microphone array. Then through the network or related cables, the coded The data is transmitted to the video conference terminal, and the video conference terminal decodes the output or forwards the other terminal.
- This implementation can greatly reduce the complexity of the video conference terminal and improve the coding efficiency.
- This embodiment provides a distributed video system. As shown in FIG. 9, the audio and video integration device and the video conference terminal are also included.
- Audio and video integration equipment including video collection unit, audio collection unit, device control unit, network communication unit, and the like.
- the video conference terminal includes a device access unit, a conference control unit, an audio coding unit, a video coding unit, an audio decoding output unit, a video decoding output unit, and a network communication unit.
- the audio and video integrated device of the embodiment of the present invention is no longer responsible for video encoding processing and audio encoding processing, and is only responsible for audio and video data.
- the collection based on the sound source to the speaker image collection and the transmission of audio and video data over the wireless network.
- This embodiment can greatly reduce the number of wirings, reduce the wiring complexity, and facilitate the transformation of the original system layout.
- This embodiment provides a method for implementing a distributed video conference, including:
- the audio and video integrated device collects the audio and video information of the conference site, and transmits the collected audio and video information to the video conference terminal, wherein the video information collected by the audio and video integrated device includes the sound source location of the conference site. Video information.
- the audio and video integrated device can transmit the collected audio and video information to the video conference terminal directly, and can also directly transmit the collected audio and video information to the video conference terminal. After the information is separately compressed and compressed, it is packaged into a media stream real-time transmission protocol format and transmitted to the video conference terminal. In addition, when the audio and video integrated device collects audio information, it can also analyze the collected audio information, locate the sound source location of the conference site, and then perform video collection on the located sound source location.
- audio and video integrated devices can use one or a group of cameras to collect video information.
- the camera at the optimal position is controlled according to the position of the sound source to collect the image of the sound source position, and the remaining cameras respectively collect images of different areas of the conference site.
- the processing operation of the video conference terminal is further included as follows:
- the video conference terminal receives the audio and video code stream packets sent by the audio and video integrated device;
- the audio and video streams in the audio and video stream packets are separately decoded and output to the output device. It should be noted that when the audio and video integrated device directly transmits the collected audio and video information to the video conference terminal, the video conference terminal needs to separately perform the audio and video code streams in the audio and video stream packets. Encoding, and then decoding the encoded audio and video streams separately.
- the video conferencing terminal can also send video collection control commands to the audio and video integrated device according to the user operation, so that the audio and video integrated device can collect the user's required site image according to the video collection control command. To improve the reliability of image collection and meet user needs.
- the camera and microphone array integrated device used in the technical solution of the present application can reduce the number of wires Quantity, reduce wiring complexity, and facilitate layout of conference rooms.
- the code is distributed to different integrated devices, and the video conferencing terminal is used as a decoding and conference control device, which improves the coding and decoding efficiency. At the same time, it can make the collection of audio and video closer to the user, quickly switch the picture according to the sound source, provide a variety of venue scene effects, and improve the overall effect of the video conference.
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
Abstract
一种分布式视频会议实现方法及系统、终端、音视频一体化设备,涉及视频会议技术。所述音视频一体化设备,包括:视频采集单元,采集会议现场的视频信息,其中,包括采集会议现场的声源位置的视频信息;音频采集单元,采集视频会议的音频信息;网络通信单元,将采集的音、视频信息传输给视频会议终端。一种视频会议终端和分布式视频会议的实现方法。
Description
分布式视频会议实现方法、 系统、 终端、 音视频一体化设备
技术领域
本发明涉及视频会议, 尤其涉及分布式视频会议实现方法及系统、 终端、 音视频一体化设备。
背景技术
随着视频摄像技术、 网络宽带技术以及视频压缩技术的飞速发展, 视频 会议被广泛地使用于多种场合下的本地或远程的会议中。 目前市场上, 所见 视频会议系统一般由视频会议终端, 视频会议外部设备以及用于连接终端和 外部设备的线缆组成, 如图 1所示。 其中, 视频会议终端负责协调整个会议 系统各个单元的运行, 包括音视频信号的编解码输出, 音视频码流的打包解 包以及与其他视频会议终端进行多媒体信息的交互等功能。 视频会议外部设 备一般包括音频、 视频以及数据等多媒体信号釆集、 生成和显示设备, 比如 摄像头、 麦克风、 扬声器、 电脑、 电视、 投影仪等。 每种类型的外部设备一 般可以是多个, 而根据不同外部设备和会议终端之间的信息交互的关系, 其 布线方式多种多样。 这样容易引起如下问题:
系统各个部分受到线缆长度的限制, 无法移动相关外部设备, 限制了设 备的使用范围, 从而约束了用户的活动范围。
设备布线的复杂, 系统安装的调试易出错。
需要临时增加更多的外部设备, 会增加布线的复杂程度。
由于将大部分的功能都集中在终端上, 会增加终端的复杂度。
另外, 对于原先的会议过程中, 需要不断地根据不同场景和人群手动调 整摄像头角度, 造成一定的停滞, 从而会影响会议的整体效果。
发明内容
本发明实施例提供一种分布式视频会议实现方法及系统、 终端、 音视频 一体化设备, 减少视频会议系统布线及终端的复杂度。
本发明实施例公开了一种音视频一体化设备, 包括:
视频釆集单元, 其设置成釆集会议现场的视频信息, 其中, 包括釆集会 议现场的声源位置的视频信息;
音频釆集单元, 其设置成釆集视频会议的音频信息; 以及
网络通信单元, 其设置成将釆集的音、 视频信息传输给视频会议终端。 可选地, 上述设备还包括:
视频编码单元, 其设置成对釆集的视频信息进行编码压缩; 以及 音频编码单元, 其设置成对釆集的音频信息进行编码压缩。
可选地, 上述设备中, 所述网络通信单元, 通过如下方式将釆集的音、 视频信息传输给视频会议终端:
所述网络通信单元, 将编码压缩后的音、 视频码流打包成媒体流实时传 输协议格式并传输给视频会议终端。
可选地, 上述设备还包括:
设备控制单元,其设置成对所述音频釆集单元釆集的音频信息进行分析, 定位声源位置, 控制所述视频釆集单元釆集所述声源位置的视频信息。
可选地, 上述设备中, 所述视频釆集单元釆用一个或一组摄像头。
可选地, 上述设备中, 所述视频釆集单元釆用一组摄像头时, 所述设备 控制单元根据所述声源位置来控制最佳位置的摄像头釆集声源位置的图像, 其余的摄像头分别釆集会议现场不同区域的图像。
可选地, 上述设备中, 所述网络通信单元是设置成通过有线连接或者无 线连接将所釆集的音、 视频信号传输给视频会议终端。
本发明实施例还公开了一种视频会议终端, 包括:
网络通信单元, 其设置成接收音视频一体化设备发送的音、视频码流包; 音频解码输出单元, 其设置成对音视频一体化设备发送的音频码流进行 解码, 并将解码后的码流输出到输出设备; 以及
视频解码输出单元, 其设置成对音视频一体化设备发送的视频码流进行 解码, 并将解码后的码流输出到输出设备。
可选地, 上述视频会议终端还包括:
音频编码单元,其设置成对音视频一体化设备发送的音频码流进行编码, 再将编码后的音频码流发送给所述音频解码输出单元; 以及
视频编码单元 ,其设置成对音视频一体化设备发送的视频码流进行编码 , 再将编码后的视频码流发送给所述视频解码输出单元。
可选地, 上述视频会议终端还包括:
设备接入单元, 其设置成根据用户操作, 向所述音视频一体化设备发送 视频釆集控制指令,以控制所述音视频一体化设备釆集用户需求的会场图像。
本发明实施例还公开了一种分布式视频会议系统, 包括上述音视频一体 化设备, 以及上述视频会议终端。
本发明实施例还公开了一种分布式视频会议实现方法, 包括:
音视频一体化设备釆集会议现场的音、 视频信息, 将所釆集的音、 视频 信息传输给视频会议终端, 其中, 所述音视频一体化设备釆集的视频信息包 括会议现场的声源位置的视频信息。
可选地, 上述方法中, 所述音视频一体化设备将所釆集的音、 视频信息 传输给视频会议终端, 包括:
所述音视频一体化设备将所釆集的音、 视频信息直接传输给视频会议终 端 或者
所述音视频一体化设备对所釆集的音、 视频信息分别进行编码压缩, 将 编码压缩后的音、 视频码流打包成媒体流实时传输协议格式并传输给视频会 议终端。
可选地, 上述方法中, 所述音视频一体化设备釆集的视频信息包括会议 现场的声源位置的视频信息, 包括:
所述音视频一体化设备釆集音频信息时, 还对所釆集的音频信息进行分 析, 定位会议现场的声源位置, 对所定位的声源位置进行视频釆集。
可选地, 上述方法中, 所述音视频一体化设备釆用一个或一组摄像头釆 集视频信息。
可选地, 上述方法中, 所述音视频一体化设备釆用一组摄像头时, 根据 所述声源位置来控制最佳位置的摄像头釆集声源位置的图像, 其余的摄像头 分别釆集会议现场不同区域的图像。
可选地, 上述方法中, 所述音视频一体化设备通过有线连接或者无线连 接, 将所釆集的音、 视频信号传输给视频会议终端。
可选地, 上述方法还包括:
所述视频会议终端接收所述音视频一体化设备发送的音、 视频码流包; 以及
对所述音、 视频码流包中的音、 视频码流分别进行解码后输出到输出设 备。
可选地, 上述方法还包括:
所述视频会议终端对所述音、 视频码流包中的音、 视频码流先分别进行 编码, 再对编码后的音、 视频码流分别进行解码。
可选地, 上述方法还包括:
所述视频会议终端, 根据用户操作, 向所述音视频一体化设备发送视频 釆集控制指令; 以及
所述音视频一体化设备根据所述视频釆集控制指令釆集用户需求的会场 图像。
本发明实施例使用的摄像头与麦克风阵列一体化设备能够减少布线数 量, 降低布线复杂度, 便于对会议室的布局。 将编码分布到不同的一体化设 备上, 视频会议终端作为解码和会议控制设备, 提高了编解码效率。 同时, 能够使音视频的釆集更接近用户, 根据声源快速切换画面, 提供多种会场场 景效果, 提高视频会议整体效果。 附图概述
图 1为现有视频会议系统基本组成的结构示意图;
图 2为本发明实施例提供的分布式视频会议系统结构示意图;
图 3为本发明实施例提供的音视频一体化设备与视频会议终端网络连接 流程图;
图 4为本发明实施例提供的音视频一体化设备的示意图;
图 5为本发明实施例提供的音视频一体化设备音视频信号处理流程图; 图 6为本发明实施例提供的视频会议终端的示意图;
图 7为本发明实施例提供的视频会议终端音视频数据处理流程图; 图 8为本发明实施例提供的一个实施例的会议系统结构图;
图 9为本发明实施例提供的另一个实施例的会议系统结构图。
本发明的较佳实施方式
下文将结合附图对本发明实施例的技术方案作详细说明。需要说明的是, 在不冲突的情况下, 本申请的实施例和实施例中的特征可以任意相互组合。
实施例 1
本实施例提供一种分布式视频会议系统, 如图 2所示, 至少包括音、 视 频一体化设备, 视频会议终端, 还可以包括电脑和输出设备。
其中, 音、 视频一体化设备, 用于音视频信号釆集和与所述的视频会议 终端交互等。
视频会议终端, 用于音视频数据解码, 音视频数据输出和与其他视频会 议终端进行交互等。
电脑, 用于控制视频会议外部设备, 控制视频会议终端, 传输其他音视 频数据等。
输出设备, 用于输出音视频数据。
上述分布式视频会议系统中的音视频一体化设备与视频会议终端网络连 接过程如图 3所示, 包括以下步骤:
步骤 301 , 用户请求音视频一体化设备连接视频会议终端;
步骤 302, 音视频一体化设备向视频会议终端发送连接请求;
步骤 303 , 视频会议终端接受连接请求;
步骤 304, 音视频一体化设备向视频会议终端请求控制指令;
步骤 305 , 视频会议终端向音视频一体化设备发送控制指令;
步骤 306, 用户请求音视频一体化设备断开与视频会议终端连接; 步骤 307 , 音视频一体化设备向视频会议终端发送断开连接请求; 步骤 308, 视频会议终端处理断开连接, 释放资源;
步骤 309, 音视频一体化设备处理断开连接, 释放资源。
下面具体介绍上述系统中的音视频一体化设备 40, 如图 4所示, 该设备 包括如下各单元:
视频釆集单元 41 , 釆集会议现场的视频信息, 其中, 包括釆集会议现场 的声源位置的视频信息;
音频釆集单元 42, 釆集视频会议的音频信息;
网络通信单元 43 , 将釆集的音、 视频信息传输给视频会议终端。
需要说明的是, 上述音视频一体化设备还可以具有编码功能, 此时, 还 包括对釆集的视频信息进行编码压缩的视频编码单元 44, 以及对釆集的音频 信息进行编码压缩的音频编码单元 45。
而网络通信单元与视频会议终端的网络通信单元进行有线或无线连接, 用于音频编码单元与视频会议终端的音频解码输出单元的连接, 以及用于视 频编码单元与视频会议终端的视频解码输出单元连接。 实际应用中, 在数据 传输过程中, 是由上述网络通信单元, 将编码压缩后的音、 视频码流打包成 媒体流实时传输协议格式传输给视频会议终端即可。 另外, 音视频一体化设备还可以包括:
设备控制单元 46, 用于连接视频釆集单元 41与音频釆集单元 42, 可以 对釆集到的音频信号进行分析, 定位声源位置, 再将控制信息传递至视频釆 集单元 41 , 控制摄像头, 釆集声源位置图像信息。
视频釆集单元 41则可以釆用一个或一组摄像头。 当视频釆集单元 41釆 用一组摄像头时,设备控制单元 46根据声源位置控制最佳位置的摄像头釆集 声源位置的图像, 即控制最佳位置的摄像头转动跟踪声音最大的发言人, 其 余的摄像头分别釆集会议现场不同区域的图像。
当然, 音视频一体化设备还可以包括会议控制单元 47 , 该单元主要用于
会议的连接与挂断、 视频会议设备的控制、 会议的显示模式控制、 通信协议 选择、 网络状况监控和系统版本升级等。
较佳地, 上述音视频一体化设备处理音视频信号的过程如图 5所示, 包 括以下步骤:
步骤 501 , 利用视频釆集单元视频信号, 利用音频釆集单元釆集音频信 号;
步骤 502 , 根据音频信号, 定位声源, 控制视频釆集单元, 釆集声源的 图像信号;
步骤 503 , 将处理后的音、 视频信号分别编码为当前视频会议所需的音、 视频编码格式;
上述步骤 503的操作是可选, 即可以不编码而直接发送音、 视频信号。 步骤 504 , 将编码后的音、 视频码流打包成媒体流实时传输协议格式; 步骤 505 , 将打包好的音、 视频码流通过网络通信单元发送至视频会议 终端。
下面再介绍上述系统中的视频会议终端 60 ,如图 6所示, 包括如下单元: 网络通信单元 61 , 接收音视频一体化设备发送的音、 视频码流包; 音频解码输出单元 62 , 对音视频一体化设备发送的音频码流进行解码, 并将解码后的码流输出到输出设备;
视频解码输出单元 63 , 对音视频一体化设备发送的视频码流进行解码, 并将解码后的码流输出到输出设备。
需要说明的是, 上述视频会议终端还可能需要具备编码功能, 此时还包 括一音频编码单元 64 , 对音视频一体化设备发送的音频码流进行编码, 再将 编码后的音频码流发送给所述音频解码输出单元 62。 以及一视频编码单元 65 , 对音视频一体化设备发送的视频码流进行编码, 再将编码后的视频码流 发送给所述视频解码输出单元 63。
还有一些优选方案, 在上述视频会议终端的架构基础上, 增加设备接入 单元 66 ,该单元根据用户操作,向音视频一体化设备发送视频釆集控制指令,
以控制音视频一体化设备釆集用户需求的会场图像。 较佳地, 可控制音视频 一体化设备的摄像头转动以跟踪釆集会场声音最大的发言人的图像。
较佳地, 上述视频会议终端处理音视频数据的过程如图 7所示, 包括以 下步骤:
步骤 701 , 接受经过视频会议终端的网络通信单元接收由音视频一体化 设备发送来的音、 视频码流包;
步骤 702 , 如果在线进行视频会议, 将接收到的音、 视频码流包经所述 的视频会议终端的网络通信单元发送给其他视频会议终端;
步骤 703 , 将接收到的音、 视频码流包进行解包处理, 得到当前视频会 议所需的音、 视频编码格式码流;
步骤 704 , 将解包后的音、 视频编码格式码流经音、 视频解码输出单元 进行解码输出;
步骤 705 , 将解码后的音、 视频码流发送给输出设备进行输出显示。
实施例 2
本实施例提供一种分布式视频系统, 如图 8所示, 包括音视频一体化设 备和视频会议终端。
音视频一体化设备, 包括视频釆集单元、 音频釆集单元、 控制单元单元、 音频编码单元、 视频编码单元和网络通信单元等。
其中, 音视频一体化设备中各个单元的具体介绍可参见实施例 1的相应 内容, 在此不再赘述。
视频会议终端, 包括设备接入单元、 会议控制单元、 音频解码输出单元、 视频解码输出单元和网络通信单元等。
其中,视频会议终端中各个单元的具体介绍可参见实施例 1的相应内容, 在此不再赘述。
本实施例是基于音视频一体化的设备, 将视频的编码单元、 音频的编码 单元集成到一体化设备中, 根据摄像头釆集的视频信号进行编码和根据麦克 风阵列釆集的音频信号进行编码, 再通过网络或者相关的线缆, 把编码后的
数据传输到视频会议终端, 由视频会议终端解码输出或转发其他终端。 本实 施能够较大程度地减少视频会议终端的复杂度, 提高编码效率。
实施例 3
本实施例提供一种分布式视频系统, 如图 9所示, 同样包括音视频一体 化设备和视频会议终端。
音视频一体化设备, 包括视频釆集单元、 音频釆集单元、 设备控制单元、 网络通信单元等。
其中, 音视频一体化设备中各个单元的具体介绍可参见实施例 1的相应 内容, 在此不再赘述。
视频会议终端, 包括设备接入单元、 会议控制单元、 音频编码单元, 视 频编码单元, 音频解码输出单元、 视频解码输出单元和网络通信单元等。
其中,视频会议终端中各个单元的具体介绍可参见实施例 1的相应内容, 在此不再赘述。
本实施例是保留传统视频会议终端的视频的编码单元和音频编码单元, 对于本发明实施例提出的音视频一体化设备不再负责视频的编码处理和音频 编码处理, 只负责对音视频数据的釆集, 基于声源对发言人图像釆集和通过 无线网络发送音视频数据的功能。 本实施例能够较大减少布线数量, 降低布 线复杂度和便于对原先系统布局的改造。
实施例 4
本实施例提供一种分布式视频会议的实现方法, 包括:
音视频一体化设备釆集会议现场的音、 视频信息, 将所釆集的音、 视频 信息传输给视频会议终端, 其中, 音视频一体化设备釆集的视频信息包括会 议现场的声源位置的视频信息。
其中, 音视频一体化设备将所釆集的音、 视频信息传输给视频会议终端 时, 可以将所釆集的音、 视频信息直接传输给视频会议终端, 也可以对所釆 集的音、 视频信息分别进行编码压缩压缩后, 打包成媒体流实时传输协议格 式传输给视频会议终端。
另外, 音视频一体化设备釆集音频信息时, 还可以对所釆集的音频信息 进行分析, 定位会议现场的声源位置, 再对所定位的声源位置进行视频釆集。
实际应用中, 音视频一体化设备可以釆用一个或一组摄像头来釆集视频 信息。 当釆用一组摄像头时, 根据声源位置控制最佳位置的摄像头釆集声源 位置的图像, 其余的摄像头分别釆集会议现场不同区域的图像。
在上述方法的基础上, 还包括视频会议终端的处理操作, 具体如下: 视频会议终端接收音视频一体化设备发送的音、 视频码流包;
对音、 视频码流包中的音、 视频码流分别进行解码后输出到输出设备。 需要说明的是, 当音视频一体化设备将所釆集的音、 视频信息直接传输 给视频会议终端时, 视频会议终端还需要对音、 视频码流包中的音、 视频码 流先分别进行编码, 再对编码后的音、 视频码流分别进行解码。
还有一些方案提出, 视频会议终端还可以根据用户操作, 向音视频一体 化设备发送视频釆集控制指令, 这样, 音视频一体化设备就可以根据视频釆 集控制指令釆集用户需求的会场图像, 以提高图像釆集的可靠性, 满足用户 需求。
本领域普通技术人员可以理解上述方法中的全部或部分步骤可通过程序 来指令相关硬件完成, 所述程序可以存储于计算机可读存储介质中, 如只读 存储器、 磁盘或光盘等。 可选地, 上述实施例的全部或部分步骤也可以使用 一个或多个集成电路来实现。 相应地, 上述实施例中的各模块 /单元可以釆用 硬件的形式实现, 也可以釆用软件功能模块的形式实现。 本申请不限制于任 何特定形式的硬件和软件的结合。
以上所述, 仅为本发明的较佳实例而已, 并非用于限定本发明的保护范 围。 凡在本发明的精神和原则之内, 所做的任何修改、 等同替换、 改进等, 均应包含在本发明的保护范围之内。
工业实用性
本申请技术方案使用的摄像头与麦克风阵列一体化设备能够减少布线数
量, 降低布线复杂度, 便于对会议室的布局。 将编码分布到不同的一体化设 备上, 视频会议终端作为解码和会议控制设备, 提高了编解码效率。 同时, 能够使音视频的釆集更接近用户, 根据声源快速切换画面, 提供多种会场场 景效果, 提高视频会议整体效果。
Claims
1、 一种音视频一体化设备, 包括:
视频釆集单元, 其设置成釆集会议现场的视频信息, 其中, 包括釆集会 议现场的声源位置的视频信息;
音频釆集单元, 其设置成釆集视频会议的音频信息; 以及
网络通信单元, 其设置成将釆集的音、 视频信息传输给视频会议终端。
2、 如权利要求 1所述的设备, 还包括:
视频编码单元, 其设置成对釆集的视频信息进行编码压缩; 以及 音频编码单元, 其设置成对釆集的音频信息进行编码压缩。
3、 如权利要求 2所述的设备, 其中, 所述网络通信单元通过如下方式将 釆集的音、 视频信息传输给视频会议终端:
所述网络通信单元, 将编码压缩后的音、 视频码流打包成媒体流实时传 输协议格式并传输给视频会议终端。
4、 如权利要求 1至 3任一项所述的设备, 还包括:
设备控制单元,其设置成对所述音频釆集单元釆集的音频信息进行分析, 定位声源位置, 控制所述视频釆集单元釆集所述声源位置的视频信息。
5、 如权利要求 4所述的设备, 其中, 所述视频釆集单元釆用一个或一组 摄像头。
6、 如权利要求 5所述的设备, 其中, 所述视频釆集单元釆用一组摄像头 时, 所述设备控制单元根据所述声源位置来控制最佳位置的摄像头釆集声源 位置的图像, 其余的摄像头分别釆集会议现场不同区域的图像。
7、 如权利要求 5所述的设备, 其中, 所述网络通信单元是设置成通过有 线连接或者无线连接将所釆集的音、 视频信号传输给视频会议终端。
8、 一种视频会议终端, 包括:
网络通信单元, 其设置成接收音视频一体化设备发送的音、视频码流包;
音频解码输出单元, 其设置成对音视频一体化设备发送的音频码流进行 解码, 并将解码后的码流输出到输出设备; 以及
视频解码输出单元, 其设置成对音视频一体化设备发送的视频码流进行 解码, 并将解码后的码流输出到输出设备。
9、 如权利要求 8所述的视频会议终端, 还包括:
音频编码单元 ,其设置成对音视频一体化设备发送的音频码流进行编码 , 再将编码后的音频码流发送给所述音频解码输出单元; 以及
视频编码单元 ,其设置成对音视频一体化设备发送的视频码流进行编码 , 再将编码后的视频码流发送给所述视频解码输出单元。
10、 如权利要求 8或 9所述的视频会议终端, 还包括:
设备接入单元, 其设置成根据用户操作, 向所述音视频一体化设备发送 视频釆集控制指令,以控制所述音视频一体化设备釆集用户需求的会场图像。
11、 一种分布式视频会议系统, 其中, 包括如权利要求 1至 7所述的音 视频一体化设备, 以及如权利要求 8至 10所述的视频会议终端。
12、 一种分布式视频会议实现方法, 包括:
音视频一体化设备釆集会议现场的音、 视频信息, 将所釆集的音、 视频 信息传输给视频会议终端, 其中, 所述音视频一体化设备釆集的视频信息包 括会议现场的声源位置的视频信息。
13、 如权利要求 12所述的方法, 其中, 所述音视频一体化设备将所釆集 的音、 视频信息传输给视频会议终端, 包括:
所述音视频一体化设备将所釆集的音、 视频信息直接传输给视频会议终 端 或者
所述音视频一体化设备对所釆集的音、 视频信息分别进行编码压缩, 将 编码压缩后的音、 视频码流打包成媒体流实时传输协议格式并传输给视频会 议终端。
14、 如权利要求 13所述的方法, 其中, 所述音视频一体化设备釆集的视
频信息包括会议现场的声源位置的视频信息, 包括:
所述音视频一体化设备釆集音频信息时, 还对所釆集的音频信息进行分 析, 定位会议现场的声源位置, 对所定位的声源位置进行视频釆集。
15、 如权利要求 14所述的方法, 其中,
所述音视频一体化设备釆用一个或一组摄像头釆集视频信息。
16、 如权利要求 15所述的方法, 其中, 所述音视频一体化设备釆用一组 摄像头时,根据所述声源位置来控制最佳位置的摄像头釆集声源位置的图像, 其余的摄像头分别釆集会议现场不同区域的图像。
17、 如权利要求 13至 16任一项所述的方法, 其中,
所述音视频一体化设备通过有线连接或者无线连接, 将所釆集的音、 视 频信号传输给视频会议终端。
18、 如权利要求 13至 16任一项所述的方法, 还包括:
所述视频会议终端接收所述音视频一体化设备发送的音、 视频码流包; 以及
对所述音、 视频码流包中的音、 视频码流分别进行解码后输出到输出设 备。
19、 如权利要求 18所述的方法, 还包括:
所述视频会议终端对所述音、 视频码流包中的音、 视频码流先分别进行 编码, 再对编码后的音、 视频码流分别进行解码。
20、 如权利要求 18所述的方法, 还包括:
所述视频会议终端, 根据用户操作, 向所述音视频一体化设备发送视频 釆集控制指令; 以及
所述音视频一体化设备根据所述视频釆集控制指令釆集用户需求的会场 图像。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201310673952.5A CN103841360A (zh) | 2013-12-11 | 2013-12-11 | 分布式视频会议的实现方法及系统、终端、音视频一体化设备 |
| CN201310673952.5 | 2013-12-11 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| WO2014161402A2 true WO2014161402A2 (zh) | 2014-10-09 |
| WO2014161402A3 WO2014161402A3 (zh) | 2014-11-20 |
Family
ID=50804450
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/CN2014/072520 Ceased WO2014161402A2 (zh) | 2013-12-11 | 2014-02-25 | 分布式视频会议实现方法、系统、终端、音视频一体化设备 |
Country Status (2)
| Country | Link |
|---|---|
| CN (1) | CN103841360A (zh) |
| WO (1) | WO2014161402A2 (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2638763C2 (ru) * | 2015-07-31 | 2017-12-15 | Сяоми Инк. | Способ и устройство для улавливания звуков, соответствующих изображениям наблюдения |
Families Citing this family (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN105306868B (zh) * | 2014-06-17 | 2019-07-26 | 三亚中兴软件有限责任公司 | 视频会议系统及方法 |
| CN105323533A (zh) * | 2014-07-04 | 2016-02-10 | 和硕联合科技股份有限公司 | 视频会议方法及系统 |
| CN105657327A (zh) * | 2014-11-28 | 2016-06-08 | 中兴通讯股份有限公司 | 一种音视频处理方法、装置及系统 |
| CN104580992B (zh) * | 2014-12-31 | 2018-01-23 | 广东欧珀移动通信有限公司 | 一种控制方法及移动终端 |
| CN104934037B (zh) * | 2015-06-02 | 2019-06-25 | 阔地教育科技有限公司 | 一种直录播互动系统中的音频处理方法及装置 |
| CN107547824A (zh) * | 2016-06-29 | 2018-01-05 | 中兴通讯股份有限公司 | 音视频处理方法、装置及麦克 |
| CN106028227B (zh) * | 2016-07-08 | 2019-05-24 | 乐鑫信息科技(上海)股份有限公司 | 分布式麦克风阵列及其适用的声源定位系统 |
| CN108322709A (zh) * | 2018-02-12 | 2018-07-24 | 天津天地伟业信息系统集成有限公司 | 一种通过音频音量值自动切换音频采集源的方法 |
| CN109640030A (zh) * | 2019-01-07 | 2019-04-16 | 厦门亿联网络技术股份有限公司 | 一种视频会议系统的音视频外设扩展装置及方法 |
| CN110351629B (zh) * | 2019-07-16 | 2021-01-19 | 广州国音智能科技有限公司 | 一种收音方法、收音装置及终端 |
| CN110808960A (zh) * | 2019-10-14 | 2020-02-18 | 西安万像电子科技有限公司 | 数据连接的建立方法、设备及系统 |
| CN112104832A (zh) * | 2019-10-17 | 2020-12-18 | 越朗信息科技(上海)有限公司 | 一种音视频系统集成会议系统 |
| CN111083427B (zh) * | 2019-12-27 | 2021-05-18 | 随锐科技集团股份有限公司 | 嵌入式终端、4k视频会议系统的数据处理方法 |
| CN110896457A (zh) * | 2019-12-30 | 2020-03-20 | 厦门亿联网络技术股份有限公司 | 视频会议终端及视频会议系统 |
| CN111641801A (zh) * | 2020-05-28 | 2020-09-08 | 中山大学附属第一医院 | 一种便携式视频会议应急装置 |
| CN112087591A (zh) * | 2020-09-18 | 2020-12-15 | 深圳随锐云网科技有限公司 | 一种视频会议的交互系统及方法 |
| CN112272281B (zh) * | 2020-10-09 | 2024-05-31 | 上海晨驭信息科技有限公司 | 一种区域分布式视频会议系统 |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20030103135A1 (en) * | 2001-12-04 | 2003-06-05 | Meng-Hsien Liu | Videoconference system |
| US6922206B2 (en) * | 2002-04-15 | 2005-07-26 | Polycom, Inc. | Videoconferencing system with horizontal and vertical microphone arrays |
| CN100505837C (zh) * | 2007-05-10 | 2009-06-24 | 华为技术有限公司 | 一种控制图像采集装置进行目标定位的系统及方法 |
| CN101534413B (zh) * | 2009-04-14 | 2012-07-04 | 华为终端有限公司 | 一种远程呈现的系统、装置和方法 |
| CN201426153Y (zh) * | 2009-05-27 | 2010-03-17 | 中山佳时光电科技有限公司 | 用于视频会议智能摄像头控制系统 |
| CN101646057B (zh) * | 2009-09-07 | 2012-08-08 | 华为终端有限公司 | 一种远程呈现会议的控制装置、方法及远程呈现会议系统 |
| US8395653B2 (en) * | 2010-05-18 | 2013-03-12 | Polycom, Inc. | Videoconferencing endpoint having multiple voice-tracking cameras |
| US8675038B2 (en) * | 2010-09-28 | 2014-03-18 | Microsoft Corporation | Two-way video conferencing system |
| US8754925B2 (en) * | 2010-09-30 | 2014-06-17 | Alcatel Lucent | Audio source locator and tracker, a method of directing a camera to view an audio source and a video conferencing terminal |
| US8451315B2 (en) * | 2010-11-30 | 2013-05-28 | Hewlett-Packard Development Company, L.P. | System and method for distributed meeting capture |
| CN103237191B (zh) * | 2013-04-16 | 2016-04-06 | 成都飞视美视频技术有限公司 | 在视频会议中同步推送音视频的方法 |
-
2013
- 2013-12-11 CN CN201310673952.5A patent/CN103841360A/zh active Pending
-
2014
- 2014-02-25 WO PCT/CN2014/072520 patent/WO2014161402A2/zh not_active Ceased
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| RU2638763C2 (ru) * | 2015-07-31 | 2017-12-15 | Сяоми Инк. | Способ и устройство для улавливания звуков, соответствующих изображениям наблюдения |
| US10354678B2 (en) | 2015-07-31 | 2019-07-16 | Xiaomi Inc. | Method and device for collecting sounds corresponding to surveillance images |
Also Published As
| Publication number | Publication date |
|---|---|
| CN103841360A (zh) | 2014-06-04 |
| WO2014161402A3 (zh) | 2014-11-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| WO2014161402A2 (zh) | 分布式视频会议实现方法、系统、终端、音视频一体化设备 | |
| WO2012041117A1 (zh) | 一种对视频会议终端集中监控的方法和系统及相关装置 | |
| CN102209232A (zh) | 一种远程音视频监控系统及其方法 | |
| TWI435568B (zh) | 多媒體影音之轉換及傳輸的方法以及系統 | |
| WO2021197008A1 (zh) | 音视频通信方法、终端、服务器、计算机设备和存储介质 | |
| CN108055497B (zh) | 一种会议信号播放方法和装置、视频会议终端、移动设备 | |
| CN103888699A (zh) | 具有视频功能的投影装置及利用其进行视频会谈的方法 | |
| JP2014512716A (ja) | 遠隔制御スタジオ・カメラ・システム | |
| TW550948B (en) | Audio/video IP camcorder | |
| WO2022127232A1 (zh) | Ip 摄像头的控制方法、装置、存储介质及智能电视 | |
| WO2012068940A1 (zh) | 通过ip网络监控终端的方法及mcu | |
| CN110248131B (zh) | 一种模拟成usb摄像头的投屏器及会议系统 | |
| CN201805504U (zh) | 一种远程音视频监控系统 | |
| CN101800894B (zh) | 多媒体影音的转换方法以及系统 | |
| CN104581036B (zh) | 进行视音频多屏显示的多屏控制方法及装置 | |
| CN110719435B (zh) | 一种进行终端会议的方法和系统 | |
| CN106331590A (zh) | 一种流媒体适配器及适配方法 | |
| TWI526080B (zh) | 視訊會議系統 | |
| CN106454276A (zh) | 一种音视频集成装置及集成视频监控系统 | |
| CN109640030A (zh) | 一种视频会议系统的音视频外设扩展装置及方法 | |
| CN117938922A (zh) | 远程控制的装置、方法计算机设备及存储介质 | |
| CN113709528B (zh) | 播放控制、配置方法、装置、电子设备及存储介质 | |
| JP2002290940A (ja) | テレビ会議システム | |
| CN115412702A (zh) | 一种会议终端与电视墙一体化设备及系统 | |
| CN110475089B (zh) | 一种多媒体数据的处理方法和视联网终端 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| 122 | Ep: pct application non-entry in european phase |
Ref document number: 14778654 Country of ref document: EP Kind code of ref document: A2 |