ES2336216T3 - Compositor de medios distribuidos a tiempo real. - Google Patents
Compositor de medios distribuidos a tiempo real. Download PDFInfo
- Publication number
- ES2336216T3 ES2336216T3 ES04800192T ES04800192T ES2336216T3 ES 2336216 T3 ES2336216 T3 ES 2336216T3 ES 04800192 T ES04800192 T ES 04800192T ES 04800192 T ES04800192 T ES 04800192T ES 2336216 T3 ES2336216 T3 ES 2336216T3
- Authority
- ES
- Spain
- Prior art keywords
- endpoints
- baselineskip
- fact
- conference
- mcu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims abstract description 21
- 238000004891 communication Methods 0.000 claims abstract description 6
- 230000036961 partial effect Effects 0.000 claims description 53
- 238000012545 processing Methods 0.000 claims description 15
- 230000006835 compression Effects 0.000 claims description 8
- 238000007906 compression Methods 0.000 claims description 8
- 238000012800 visualization Methods 0.000 claims description 6
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 230000005540 biological transmission Effects 0.000 claims description 3
- 239000000203 mixture Substances 0.000 claims description 3
- 238000013461 design Methods 0.000 description 32
- 239000002131 composite material Substances 0.000 description 9
- 230000008901 benefit Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 230000006837 decompression Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000000007 visual effect Effects 0.000 description 2
- 206010011224 Cough Diseases 0.000 description 1
- 108010000020 Platelet Factor 3 Proteins 0.000 description 1
- 108010001267 Protein Subunits Proteins 0.000 description 1
- 230000009194 climbing Effects 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000013481 data capture Methods 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
- H04N7/152—Multipoint control units therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L65/00—Network arrangements, protocols or services for supporting real-time applications in data packet communication
- H04L65/40—Support for services or applications
- H04L65/403—Arrangements for multi-party communication, e.g. for conferences
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/562—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities where the conference facilities are distributed
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
- H04M3/56—Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
- H04M3/567—Multimedia conference systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N7/00—Television systems
- H04N7/14—Systems for two-way working
- H04N7/15—Conference systems
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Telephonic Communication Services (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
- Seasonings (AREA)
- Pyrane Compounds (AREA)
- Plural Heterocyclic Compounds (AREA)
- Computer And Data Communications (AREA)
Abstract
Sistema que permite el intercambio simultáneo de informaciones de audio, video y/o datos entre una pluralidad de puntos extremos en una red de comunicaciones y soportado por una unidad central, la pluralidad de puntos extremos comprendiendo puntos extremos transmisores y puntos extremos receptores, en el que el sistema está adaptado para el intercambio bidireccional de flujos multimedia entre la unidad central y la pluralidad de puntos extremos, el sistema está adaptado para componer flujos multimedia comprendiendo tramas parciales, y la unidad central está, basándose en la información de capacidad recibida desde uno o más de los puntos extremos, adaptada para dar instrucciones a dicho uno o más puntos extremos transmisores para generar flujos multimedia que comprenden tramas parciales ajustadas para corresponderse con las capacidades de los puntos extremos receptores que participan en una sesión.
Description
Compositor de medios distribuidos a tiempo
real.
La presente invención se refiere a sistemas que
permiten el intercambio simultáneo de información de audio, video y
datos mediante el uso de telecomunicaciones, en particular se
refiere a sistemas de videoconferencia y conferencia en línea.
En particular, la invención describe un sistema
y un procedimiento que permiten el intercambio simultáneo de
información de audio, video y datos entre una pluralidad de
unidades, utilizando una red de telecomunicaciones existente.
Existen un número de sistemas tecnológicos
disponibles para organizar encuentros entre participantes ubicados
en zonas diferentes. Estos sistemas pueden incluir conferencias o
videoconferencias audiovisuales multipunto, conferencias en línea y
audioconferencias.
El substituto más realista de los encuentros
reales son los sistemas de videoconferencia de gama alta. Los
sistemas de videoconferencia convencionales incluyen un número de
puntos extremos que comunican flujos de video, audio y/o datos a
tiempo real por y entre varias redes como WAN, LAN y redes con
conmutación de circuitos. Los puntos extremos incluyen una o más
pantalla(s), cámara(s), micrófono(s) y/o
dispositivo(s) de captura de datos y un códec. Dichos códecs
codifican y decodifican los flujos de salida y entrante,
respectivamente.
Las conferencias multimedia pueden estar
divididas en tres categorías principales: conferencias
centralizadas, descentralizadas e híbridas, en las que cada
categoría tiene una pluralidad de variaciones para ejecutar una
conferencia.
Las conferencias multipunto audiovisuales
tradicionales tienen una Unidad de Control Multipunto (MCU) con
tres o más puntos extremos conectados. Estas MCUs realizan funciones
de conmutación para permitir que los terminales audiovisuales se
intercomuniquen en una conferencia. La función central de una MCU es
enlazar múltiples sitios de video teleconferencia (EP- puntos
extremos) y también recibir tramas de señales digitales procedentes
de terminales audiovisuales (EP), procesar las señales recibidas, y
retransmitir las señales procesadas a las terminales audiovisuales
apropiadas (EP) como tramas de señales digitales. Las señales
digitales pueden incluir informaciones de audio, video, datos y
control. Las señales de video procedentes de dos o más terminales
audiovisuales (EP) pueden mezclarse espacialmente para formar una
señal de video compuesta para ver los participantes de la
teleconferencia. La MCU actúa como un encaminador selectivo de
flujos de medios en este escenario. Una parte de la MCU llamada el
Controlador Multipunto (MC) controla la conferencia. Cada punto
extremo tiene un canal de control para enviar y recibir señales de
control a y desde el MC. El Mc actúa y envía comandos a los puntos
extremos.
En una conferencia centralizada, la MCU recibirá
flujos de video entrantes desde todos los participantes. Puede
retransmitir un flujo de video desde un punto extremo a todos los
otros puntos extremos. El flujo de punto extremo se selecciona
típicamente por la solución de un solo flujo de voz conmutado,
basado en el participante habla más alto, es decir, el hablante. El
flujo se llama Vista Actual. Mientras que la Vista Anterior es el
flujo de video procedente del participante en el punto extremo que
era el hablante antes del hablante actual. En una conferencia por
conmutación de voz, se envía un flujo de vídeo de Vista Actual a
todos excepto al hablante actual, y la Vista Anterior se envía al
hablante actual. Un problema para la MCU es asegurar que todos los
puntos extremos de la conferencia puedan recibir la Vista Actual y
la Vista Anterior.
La Vista Actual también puede controlarse
enviando comandos entre la MCU y los puntos extremos. Un mecanismo
así se llama control del turno de palabra. Un punto extremo puede
enviar un comando de solicitud de turno de palabra a la MCU para
que se envíe su vídeo a todos los otros participantes. La Vista
Anterior será típicamente una vista de conmutación de voz entre el
resto de participantes en la conferencia. La Vista Actual puede
emitirse enviando un comando de emisión de turno de palabra. Existen
otros procedimientos conocidos para controlar la Vista Actual, así
como, entre otros, el control del turno de palabra y el control de
coordinación. Ambos tratan con flujos únicos de conmutación, sin
embargo, proporcionar una descripción completa de cada solución
conocida sobre este asunto está fuera del ámbito de este documento.
Sin embargo, el principio con una vista actual y la conmutación de
un flujo único es el mismo.
En una conferencia, a menudo se verá más de un
participante. Esto se logra de varias formas. La MCU puede combinar
los flujos de video entrante para hacer que uno o más flujos de
vídeo de salida lo logren. La combinación de varios flujos de video
de baja resolución entrante desde los puntos extremos a un flujo de
resolución alta puede hacerlo. El flujo de resolución alta se envía
a continuación desde la MCU a todos o algunos de los puntos
extremos en la conferencia. El flujo se llama Vista Combinada. La
característica de los flujos de resolución baja limita el formato
del flujo de resolución alta procedente de la MCU. Se necesitan
limitaciones estrictas en los flujos de resolución baja entrante
para asegurar que todos los puntos extremos que lo reciben pueden
recibir el flujo de resolución alta combinado. La MCU debe, siempre
que cada receptor reciba el mismo flujo multimedia, encontrar el
"modo menos común" para asegurar una característica de visión
y audio aceptable en el receptor con la peor capacidad. Debido a las
diversas variaciones de pantallas, la MCU también debe compensar
las diferentes pantallas como la vista 4:3 16:9; esto no es posible
con un modo común. Esta solución de modo menos común no funciona
particularmente bien y proporciona importantes limitaciones a los
receptores que tienen una capacidad que sobrepasa aquella con la
peor capacidad.
Una solución más flexible es dejar que la MCU
redimensione todos los flujos de video entrantes y hacer así una
vista que pueda recibirse en todos los puntos extremos que la
reciben. Para realizar el redimensionamiento, la MCU necesita
decodificar todos los flujos de video entrantes. Los datos
decodificados -datos brutos- se redimensionan y se transforman a
continuación. Los diferentes flujos de datos brutos se combinan en
un diseño compuesto y se juntan en un diseño establecido dado, se
hacen a la medida de los requisitos del receptor para la velocidad
de bits y el estándar de codificación. El flujo combinado de datos
brutos se codifica a continuación y se tendrá un nuevo flujo de
video que contiene uno o más flujos entrantes. La solución se llama
Vista Redimensionada. Para hacer una vista redimensionada, la MCU
debe comprender y tener la capacidad de codificar y decodificar
flujos de video. Cuantos más puntos extremos haya en la conferencia,
más capacidad necesitará la MCU para decodificar todos los flujos
entrantes. La manipulación de datos pesados realizada por la MCU
añadirá un retraso adicional a los flujos multimedia y reducirá por
tanto la calidad de la conferencia multimedia. Cuanto mayor sea el
número de puntos extremos, más durará será la manipulación de
datos. La escalabilidad es un asunto en una solución como esta. El
diseño puede ser diferente en todos los decodificadores para evitar
que el usuario final se vea en el video con retraso en la pantalla.
Según el número de diseños diferentes, deben codificarse diferentes
flujos de salida. Una MCU puede diferenciar entre los propios puntos
extremos o mediante grupos de puntos extremos, ejemplificados en
dos grupos, uno para una velocidad de bits baja que proporciona una
primera vista y uno para velocidades de bits altas que da una
segunda vista.
En un escenario multipunto descentralizado, se
necesita un MC centralizado. Cada punto extremo enviará sus datos
de medio al resto de puntos extremos - típicamente mediante
multidifusión. Cada punto extremo mezclará el audio procedente del
resto de puntos extremos, y combinará o seleccionará los flujos de
video para mostrarlos localmente. El MC todavía actúa como
controlador para la conferencia, y cada punto extremo tendrá una
conexión de control con el MC. En una conferencia descentralizada,
cada punto extremo debe tener la funcionalidad de la MCU mostrando
funcionalmente una Vista Actual/Anterior, una Vista Combinada o una
Vista Redimensionada. La complejidad de un punto extremo que
soporta conferencias descentralizadas es mayor que la de los puntos
extremos que soportan conferencias centralizadas.
Una conferencia híbrida utiliza una combinación
de conferencia centralizada y descentralizada. Algunos puntos
extremos estarán en una conferencia centralizada, y otros estarán en
una descentralizada. Una conferencia híbrida puede tener un
tratamiento centralizado de un flujo de medios, y una distribución
descentralizada de otro. Antes del inicio de la conferencia
multimedia, la MCU centralizada enviará comandos a cada punto
extremo que participa en la conferencia, estos comandos, entre
otros, pedirán al punto extremo que informe a la MCU de sus
capacidades de velocidad de bits y su capacidad de procesamiento de
códecs. La información recibida será utilizada por la MCU
centralizada para establecer una conferencia híbrida multimedia, en
la que se tiene en cuenta la característica de cada punto
extremo.
El término híbrido también se utiliza cuando el
audio se mezcla en la MCU y cada punto extremo selecciona y
decodifica uno o más flujos de video entrantes para la vista
local.
Los algoritmos de compresión de señal escalables
son un requisito principal de la red global que evoluciona
rápidamente, que implican una variedad de canales con capacidades
que difieren ampliamente entre sí. Muchas aplicaciones requieren
que los datos puedan decidirse simultáneamente en una variedad de
velocidades. Algunos ejemplos incluyen aplicaciones como la
multidifusión en una red heterogénea, donde los canales dictan las
velocidades de bits factibles para cada usuario. De forma similar,
está motivado por la coexistencia de puntos extremos de complejidad
y costes diferentes. Una técnica de compresión es escalable si
ofrece una variedad de velocidades de decodificación y/o
procesamiento utilizando el mismo algoritmo básico, y en la que los
flujos de información de menor velocidad están incorporados dentro
de los flujos de mayor velocidad de bits en un modo que minimiza la
redundancia.
Se han propuesto diversos algoritmos que
permiten la escalabilidad de la comunicación por video, incluyendo
la frecuencia de trama (codificación escalable temporalmente),
calidad visual (SNR) y escalabilidad espacial. Algo frecuente en
estos procedimientos es que el vídeo se codifica en capas y la
escalabilidad proviene de la decodificación de una o más capas.
El video se codifica en tramas y un algoritmo de
codificación de video escalable temporalmente permite la extracción
de video de múltiples frecuencias de trama procedentes de un flujo
único codificado. El video está dividido en múltiples conjuntos de
tramas intercaladas. Al decodificar más de un conjunto de tramas,
la frecuencia de trama aumenta.
El algoritmo de compresión escalable espacial es
un algoritmo en el que la primera capa tiene una resolución en
curso, y la resolución de video puede mejorarse decodificando más
capas.
La compresión escalable SNR se refiere a la
codificación de una secuencia de tal modo que videos de calidades
diferentes se pueden reconstruir mediante la decodificación del
flujo de bits codificado. La compresión escalable es útil en los
entornos de redes heterogéneas actuales en los que diferentes
usuarios tienen diferentes velocidades, resoluciones,
visualizaciones y capacidades computacionales.
La patentes WO9918728 A1 describe un servidor
multimedia que incluye un número de códecs diferentes, Los flujos
de datos de diferentes estándares entran en el servidor y se
encaminan en el códec apropiado, en el que se descomprimen los
flujos de datos. Tras la descompresión, las señales se mezclan y se
encaminan de vuelta a los códecs apropiados. Las señales se
recomprimen en el estándar apropiado para cada unidad receptora
antes de salir del servidor.
Un objeto de la presente invención es
proporcionar un sistema y un procedimiento que elimina los
inconvenientes descritos anteriormente. Las características
definidas en las reivindicaciones adjuntas caracterizan este
sistema y procedimiento.
En un sistema centralizado tradicional, los
puntos extremos enviarán una imagen a escala completa a una MCU,
por ejemplo una imagen CIF codificada (352 x 288 píxeles) se enviará
a la MCU. Para mejorar la calidad de la conferencia, sería útil
presentar una imagen compuesta en cada punto extremo. Esta imagen
completa puede mostrar un participante como una fracción principal
de una pantalla completa, mientras que el resto de participantes se
muestran como sub-imágenes más pequeñas. El
participante, el tamaño del participante y el número de
participantes que se muestran en cada sitio puede depender de las
capacidades de procesamiento y visualización y la situación de
conferencia. Si se supone que cada punto extremo debe recibir
imágenes compuestas, la MCU tiene que realizar la manipulación de
datos pesados como se describe en presencia continua y vista
redimensionada. Tras la descodificación de los flujos de datos CIF
codificados a imágenes de video, la MCU compondrá imágenes
compuestas que se recodificarán y se enviarán al punto extremo
apropiado.
Esta solución aumenta la demanda de la capacidad
de la MCU central; la solución, en casos en los que un uso pesado
de la codificación y decodificación es necesario, incorporará un
retraso molesto entre los participantes de una conferencia
multimedia.
En particular, la presente invención describe un
procedimiento y sistema mejorado para el intercambio de información
entre un número de unidades donde una unidad central, basada en el
conocimiento relacionado con una pluralidad de
sub-unidades, ordenará a las
sub-unidades que generen flujos de datos multimedia
ajustados a otras sub-unidades que participan en la
misma sesión de tal modo que la unidad central puede encaminar
flujos de datos sin utilizar sus códecs incorporados o un uso
mínimo de dichos códecs.
Para hacer que la invención se entienda más
fácilmente, la descripción que sigue se referirá a los dibujos
adjun-
tos.
tos.
La figura 1 muestra un ejemplo de una
conferencia centralizada, con cuatro puntos extremos participando en
una videoconferencia según la invención.
La figura 2 muestra una ejemplificación de la
invención con cuatro puntos extremos participantes y EP D como el
hablante actual y EPD como el hablante anterior.
Como se indica anteriormente, todas las
soluciones tienen sus inconvenientes. Una característica de una
videoconferencia de calidad será que incluye las posibilidades de
mostrar ventanas compuestas, o diseños de vistas combinadas y
correctas (es decir, 4:3, 16:9) sin molestos retrasos temporales.
Todos estos requisitos deben alcanzarse con equipos existentes, es
decir, con MCUs que están disponibles actualmente. Las soluciones
conocidas no se escalan muy bien, ya que no tiene en cuenta la
diferente capacidad de los diferentes puntos extremos en una
conferencia. Idealmente, cada punto extremo debe recibir flujos de
datos a medida para su capacidad y diseño. El procesamiento de
datos adicionales realizado en la MCU central debe minimizarse. La
debilidad indicada se aplica a soluciones centralizadas,
descentralizadas, así como híbridas.
Para superar la debilidad arriba mencionada,
esta invención toma las ventajas de la utilización de capacidad de
procesamiento descentralizada en los puntos extremos participantes,
y también se aprovecha de la utilización de un lenguaje de comandos
para dar instrucciones a cada punto extremo participante sobre cómo
tomar parte en la conferencia.
La idea es simplemente utilizar la capacidad
disponible tan descentralizada como sea posible, por tanto, las
peticiones en la MCU se reducirán, y también es importante para la
optimización que la solución se escale bien. La MCU, mediante el
uso de un lenguaje de comandos, obtendrá información sobre cada
capacidad de los puntos extremos como un receptor y un transmisor
en cuanto a la velocidad de bits disponibles, la capacidad de
decodificación, etc., por tanto, la MCU adaptará los flujos de datos
a cada punto extremo según sus especificaciones, como resultado se
obtendrán sistemas bien escalados.
Así, la MCU recogerá información relacionada con
la capacidad de codificación de cada punto extremo en relación al
número de tramas múltiples que puede hacer y a qué resolución, las
velocidades de bits y las frecuencias de tramas. Además, la MCU
tendrá conocimientos relacionados con los diseños de puntos
extremos, etc., como se indica anteriormente. Con esto, la MCU será
capaz de analizar esta información y personalizar una conferencia.
Por tanto, el pensamiento está basado en el conocimiento de las
capacidades de codificación a los puntos extremos, que los puntos
extremos utilizarán sus capacidades para enviar flujos multimedia
optimizados. Así, la necesidad de procesamiento en la MCU se
reducirá drásticamente en comparación con lo que es normal en una
conferencia de calidad
similar.
similar.
Se pueden dar instrucciones a los codificadores
para que envíen un flujo mayor pero aún así reducido a la MCU. Las
instrucciones se enviarán en un lenguaje de comandos desde el MC en
la MCU central a cada codificador del participante en la
conferencia multimedia. También se puede dar instrucciones a los
puntos extremos para que envíen dicho flujo y un flujo más pequeño.
La MCU puede entonces combinar flujos a una vista actual con por
ejemplo el hablante en una ventana "grande" junto con el resto
de participantes en ventanas más pequeñas. Este hablante puede
recibir el hablante anterior en una ventana "grande" con el
resto de participantes en ventanas "pequeñas". Un ejemplo de
diseño es 5+1.
La capacidad MCU necesaria puede reducirse
significativamente mediante el control del tamaño de cada flujo y
la velocidad de bits utilizada. El MC utilizará las capacidades de
codificación y decodificación intercambiadas en un comando
establecido para seleccionar los diseños apropiados. Las capacidades
del codificador restringirán el tamaño y el número de tramas
parciales desde un punto extremo, y las capacidades del
decodificador restringirán el número y el tamaño de tramas
parciales que puede recibir un punto extremo. Esto forma la base
sobre la que la MCU puede decidir sus diseños.
La MCU dar instrucciones a los puntos extremos
para enviar una o más tramas parciales de la sesión. El tamaño de
estas tramas parciales dependerá del número de participantes de la
conferencia y el diseño escogido; la MCU dará instrucciones a los
puntos extremos al inicio de la sesión relacionadas con el tamaño de
las tramas parciales. Así, cada punto extremo enviará una fracción
de una imagen compuesta en el formato solicitado. La MCU también
puede dar comandos adicionales durante la sesión para cambiar el
diseño. La cantidad de datos que tienen que codificarse en el punto
extremo será por consiguiente substancialmente menor, al menos para
los participantes que no hablan. La MCU recibirá imágenes
codificadas que ya tienen el formato correcto, por tanto, la MCU no
tiene que decodificar los flujos de video entrante. La MCU solo
juntará las imágenes compuestas procedentes de las tramas parciales
entrantes sin ninguna decodificación o codificación. Esto puede
conseguirse mediante la manipulación de sintaxis de alto nivel en
el flujo de video para producir una trama combinada, o mediante
identificando, etiquetando y reenviando una selección de los flujos
de video a todos los puntos extremos, donde pueden decodificarse
separadamente y unirse para una vista compuesta.
Así, la necesidad de la capacidad de
procesamiento se reduce drásticamente y, al evitar el procesamiento
de los flujos de video, el retraso se reducirá
correspondientemente.
En una conferencia centralizada, la MCU dará
instrucciones a los puntos extremos en la conferencia para hacer
una o más tramas parciales. Los puntos extremos codificarán sus
flujos de video para cumplir con el formato de estas tramas
parciales. Las tramas parciales se envían a continuación desde punto
extremo a la MCU. La MCU combinará las tramas parciales en una o
más tramas combinadas. Las estructuras de estas tramas combinadas
se denominan diseños. Los diseños contienen el formato de las tramas
parciales recibidas para un conjunto dado de tramas combinadas, y
las instrucciones enviadas a cada punto extremo se derivan desde los
diseños de estas tramas combinadas. Típicamente, un diseño está
definido para la Vista Actual con una trama de escala 4:3, y otro
para una trama de escala 16:9. La trama combinada para la Vista
Anterior se escalará típicamente para concordar con el punto
extremo que la recibe siguiendo el mismo principio que para la vista
actual. Las tramas combinadas se envían a cada punto extremo en la
conferencia con el mejor diseño concordante para ese punto extremo
específico.
En una conferencia descentralizada, la MCU dará
instrucciones a los puntos extremos en la conferencia para hacer
una o más tramas parciales. Los puntos extremos codificarán sus
flujos de video para cumplir con el formato de estas tramas
parciales. Estas tramas parciales se distribuyen a todos los puntos
extremos de la conferencia. Cada punto extremo combinará las tramas
parciales en tramas combinadas con un conjunto de diseños. El MC
decide y señaliza los diseños a cada punto extremo separadamente.
Diferentes puntos extremos en la conferencia pueden tener
diferentes diseños asignados a los mismos. Típicamente, algunos
puntos extremos combinan tramas parciales en una vista actual,
mientras que otros se combinan en una vista anterior.
La MCU central, con la utilización de un
lenguaje de comandos comunicados con los canales de control,
solicitará al punto extremo que proporcione información sobre su
capacidad en cuanto a velocidades de bits, diseños y algoritmos de
descompresión. La MCU central, en base a las respuestas de las MCU
descentralizadas, establecerá una sesión hecha a medida de cada
especificación de punto extremo en cuanto a velocidades de bits y a
los otros parámetros descritos anteriormente. La invención puede
utilizar la escalabilidad como se describe anteriormente para
codificar los flujos de video múltiples en varias velocidades de
bits y resoluciones para asegurar la mejor utilización del ancho de
banda disponible.
Describe el conjunto de comandos entre la MCU
central y cada punto extremo. El conjunto de comandos se utiliza
para dar instrucciones a la codificación de tramas parciales en los
puntos extremos y el diseño de los flujos de video, y el conjunto
de capacidades describe el rango de formatos que se puede recibir en
cada punto extremo. Los comandos para alinear o cambiar capacidades
también pueden formar parte del lenguaje.
El ejemplo de una conferencia centralizada se
muestra en la figura 4.1 El ejemplo contiene una MCU central. La
MCU tiene una conferencia con 4 puntos extremos. Se han nombrado
Punto Extremo A, B, C y D. Cada punto extremo tiene un canal de
control bidireccional, un flujo de video que va desde el punto
extremo hasta la MCU y un flujo de video que va desde la MCU al
punto extremo. El hablante actual en la conferencia está en el
Punto Extremo A, y el Punto Extremo A está, por tanto, recibiendo
una trama combinada de la vista anterior. El resto de puntos
extremos en la conferencia están recibiendo diferentes tramas
combinadas de la vista actual. El punto extremo D es el hablante
anterior.
La MCU señaliza mediante el conjunto de comandos
descritos anteriormente al punto extremo A que produzca dos tramas
parciales. Estas son la Trama Parcial 1 y la Trama Parcial 5. El
tamaño, el formato y la escala de ambas tramas parciales se
señalizan específicamente. La Trama Parcial 1 es parte del diseño
para la vista actual 16:9 seleccionada por la MCU. La Trama Parcial
5 es parte del diseño para la vista actual 4:3 seleccionada también
por la MCU. La MCU recibe continuamente un flujo de video desde el
punto extremo A que contiene el formato de tanto la Trama Parcial 1
como la Trama Parcial 5 hasta que un nuevo comando es señalizado
desde la MCU hasta el punto extremo A.
De forma similar que el Punto extremo A, la MCU
está señalizando al punto extremo B que codifique la trama parcial
2 y la trama parcial 6. El punto extremo C debe codificar la trama
parcial 3 y la trama parcial 7. El punto extremo D debe codificar
la trama parcial 4, la trama parcial 6 y la trama parcial 9.
La MCU recibe todas las tramas parciales 1 a 9.
Con el diseño para la "Trama Combinada Vista Actual 16:9" el
MCU combina la Trama Parcial 1, la Trama Parcial 2, la Trama Parcial
3 y la Trama parcial 4. Esta trama combinada se envía al Punto
Extremo C y al Punto Extremo B. Ambos han señalizado que pueden
recibir una trama escalada 16:9. Con el diseño para la "Trama
Combinada Vista Actual 4:3" el MCU combina la Trama Parcial 5,
la Trama Parcial 6, la Trama Parcial 7 y la Trama Parcial 8. Esta
trama combinada se envía al Punto Extremo D que solo puede recibir
una trama de escala 4:3.
La combinación de la Trama Parcial 9, la trama
Parcial 3 y la Trama Parcial 5 hace el diseño para la "Trama
Combinada vista Anterior 16:9".
Este ejemplo es un intercambio reducido de
información entre las unidades participantes para ilustrar cómo
debe implementarse la comunicación. En una situación real, las
distintas capacidades de los puntos extremos, como los estándares
de codificación y el ancho de banda, y las capacidades de la MCU
pueden causar varias series de intercambios para alinear las
capacidades, La adición de nuevos puntos extremos improvisadamente
también puede causar la realineación de capacidades durante la
sesión.
Por motivos de simplicidad, este intercambio
asume que las capacidades de la MCU lo abarcan todo y que las
capacidades de los puntos extremos coinciden de tal modo que la
alineación no es necesaria. También es un caso real que todas las
unidades en la sesión sean del mismo tipo.
En este ejemplo, diversos puntos extremos
obtienen el mismo diseño. En un caso real, cada punto extremo puede
tener diferentes diseños e incluso diferentes relaciones de aspecto
según su visualización.
\vskip1.000000\baselineskip
El intercambio entre las unidades participantes
da información relacionada con las capacidades de procesamiento
como estándares, tamaño de imagen, frecuencia de trama y ancho de
banda.
\vskip1.000000\baselineskip
DECCAP-{ProcessingRate, NumberOfStreams,
TotalImageSize, Bandwidth}
ENCCAP-{ProcessingRate, NumberOfStreams,
TotalImageSize, Bandwidth} ProcessingRate (Velocidad de
procesamiento) - La habilidad para procesar elementos de video.
Estos elementos pueden medirse en MacroBlocks (MBs), que es un
grupo de 16x16 píxeles.
NumberOfStreams (Número de flujos) - El
número de flujos separados que puede manejarse.
TotalImageSize (Tamaño Total de la
Imagen) - El tamaño combinado máximo de todos los flujos, también
medido en MBs. La descripción de la imagen también puede contener
la relación de aspecto de la imagen.
Bandwidth (ancho de banda) - La velocidad
de datos total máxima que puede enviarse o recibirse.
\vskip1.000000\baselineskip
Un pequeño grupo de comandos que permitirá el
intercambio de datos. CODE-SEQn- {Resolution,
FrameRate, Bandwidth}.
Un comando para un codificador que fuerza la
codificación de un flujo de video con un conjunto de
limitaciones.
Resolution (Resolución) - El tamaño de la
imagen de video medido en MBs.
FrameRate (Frecuencia de trama) - El
número de imágenes de video que se puede enviar por segundo
(F/s).
Bandwidth (Ancho de banda) - El número de
bits por segundo que se pueden utilizar para este flujo de video
(Bits/s). STOP-Seqn. Un comando para parar la
codificación de un flujo de video particular.
LAYOUT (DISEÑO) {Mode, SEQ1, SEQ2, ..,
SEQm}
Un comando para un decodificador que le dice
cómo colocar un número de flujos en la visualización.
Mode (Modo)- El diseño particular
escogido, p. ej., 5+1, en el que está definido el número de flujos y
su posición en la pantalla.
Seq1.m - La ID de las secuencias que
pueden colocarse en el diseño definido. El orden de las secuencias
da la posición. Si una posición particular no tiene ningún flujo,
puede utilizarse SEQ0.
\vskip1.000000\baselineskip
GET-FLOOR La entrega del
hablante actual a un punto extremo particular.
\vskip1.000000\baselineskip
VIDEO-FRAME-SEQn
Los datos de video codificado para una trama de
una secuencia de video particular. Por simplicidad, las unidades de
datos para una secuencia de video están definidas como una
trama.
El ejemplo utilizado es el mostrado en la figura
2, donde EP A es el hablante actual y EP D es el hablante anterior;
el intercambio de capacidad adicional, los comandos para el inicio
de sesión, los comandos para capturar la palabra y el intercambio
de datos se muestran en los siguientes esquemas.
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
B pasa a ser el hablante actual y A el hablante
anterior
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
Utilizando la misma situación descrita
anteriormente, en una conferencia descentralizada, la MC dará
instrucciones a EP A para codificar y transmitir PF1 a EP B y C y
para enviar PF5 a EP D. EP B transmitirá PF 2 a EP A, B y C y
enviará PF 6 a EP D. EP C transmitirá PF 3 a EP A, B y C y enviará
PF 7 a EP D. Finalmente, EP D transmitirá PF 4 a EP A, B y C,
enviará PF 8 a EP D y enviará PF 9 a EP A.
\newpage
Algunas de las ventajas según la presente
invención se resumen a continuación:
- \bullet
- Reducción del requisito de procesamiento en la unidad central. Conduce a una solución más escalable.
- \bullet
- Reducción del retraso en la transmisión en comparación con la transcodificación.
- \bullet
- Reducción de la capacidad de procesamiento en puntos extremos debido a un tamaño de imagen total menor. Mejor calidad de video ya que no se requiere el redimensionamiento en la unidad central o en los puntos extremos.
Aunque esta invención se ha mostrado y descrito
particularmente con referencias a las realizaciones preferidas de
la misma, aquellos expertos en la técnica entenderán que se pueden
realizar varios cambios en la forma y los detalles de la misma sin
aparatarse del ámbito y el espíritu de la invención, como se define
en las reivindicaciones adjuntas.
En los ejemplos anteriores, las realizaciones
preferidas de la presente invención están ejemplificadas mediante
el uso de tramas de escala 4:3 y 16:9 en una visualización, sin
embargo, la solución no está limitada a la utilización de estas
relaciones de aspecto, se pueden implementar otras relaciones de
aspecto conocidas, como por ejemplo 14:9 u otras relaciones que
puede dividirse en un esquema de cuadrícula en una
visualización.
Por ejemplo, la idea de utilizar tramas
parciales basadas en el conocimiento de cada punto extremo en una
conferencia se amplía para utilizarse siempre que exista la
necesidad de enviar flujos multimedia entre una pluralidad de
usuarios. El concepto tendrá interés dentro de las emisiones
tradicionales, particularmente cuando se cubren acontecimientos a
tiempo real. Al imaginar un escenario donde se utiliza una
pluralidad de cámaras para cubrir un acontecimiento, si cada cámara
está transfiriendo información a una unidad centralizada según las
reglas negociadas entre la unidad centralizada y las cámaras, se
puede ahorrar mucha capacidad de procesamiento en la unidad
centralizada. Además, sería mucho más fácil y rápido procesar tramas
compuestas/PIP para los usuarios finales.
Otro ejemplo es que el requisito físico de la
MCU descrita y el MC sea similar, se puede realizar cualquier
combinación de conferencia Centralizada y Descentralizada, también
se espera que las realizaciones tengan MCUs tradicionales como
parte de la red para que sean compatibles con las versiones
anteriores de las soluciones de hoy en día.
Una de las ideas principales de la invención es:
la utilización de la capacidad allá donde se encuentra. En un
intercambio de flujo multimedia multipunto tradicional, hay una
estación central o unidad centralizada que administra el
intercambio de datos. Tradicionalmente, esta unidad centralizada no
ha negociado con todas las unidades periféricas que participan en
el intercambio de datos para optimizar el intercambio de datos
según la capacidad de cada unidad periférica, por tanto, no se
conoce o no es frecuente una utilización optimizada de toda la
capacidad de procesamiento disponible.
Punto extremo: cualquier terminal capaz
de unirse a una conferencia.
Medios: Audio, video y datos
similares.
Flujo: medio continuo.
Unidad de control multipunto (MCU): La
entidad que controla y se ocupa de los medios para 3 o más puntos
extremos es, en una conferencia, un Controlador
Multipunto (MC): Se ocupa del control de
3 o más puntos extremos en una conferencia.
Conferencia centralizada: Los canales de
control se señalizan de forma unidireccional o bidireccional entre
los puntos extremos y la MCU. Cada punto extremo envía sus medios a
la MCU. La MCU mezcla y combina los medios y devuelve los medios a
los puntos extremos.
Conferencia descentralizada: Los canales
de control se señalizan de forma unidireccional o bidireccional
entre los puntos extremos y la MCU. Los medios se transportan como
multidifusión entre los puntos extremos, y los puntos extremos
mezclan y combinan los medios por sí solos.
Conferencia híbrida: La MCU tiene una
conferencia que es parcialmente centralizada y parcialmente
descentralizada.
Hablante: El participante en el punto
extremo que habla más alto entre los puntos extremos en una
conferencia.
Vista Actual: El flujo de video
procedente del hablante actual.
Vista Anterior: El flujo de video
procedente del hablante anterior.
Vista Combinada: Un flujo de video de
alta resolución sacado de flujos de video de baja resolución.
Vista redimensionada: Un flujo de video
hecho de otro flujo de video mediante redimensionamiento.
\vskip1.000000\baselineskip
Esta lista de referencias citadas por el
solicitante está prevista únicamente para ayudar al lector y no
forma parte del documento de patente europea. Aunque se ha puesto
el máximo cuidado en su realización, no se pueden excluir errores u
omisiones y la OEP declina cualquier responsabilidad al
respecto.
\bullet WO 9918728 A1 [0019]
Claims (18)
1. Sistema que permite el intercambio simultáneo
de informaciones de audio, video y/o datos entre una pluralidad de
puntos extremos en una red de comunicaciones y soportado por una
unidad central,
la pluralidad de puntos extremos comprendiendo
puntos extremos transmisores y puntos extremos receptores,
en el que el sistema está adaptado para el
intercambio bidireccional de flujos multimedia entre la unidad
central y la pluralidad de puntos extremos, el sistema está adaptado
para componer flujos multimedia comprendiendo tramas parciales,
y
la unidad central está, basándose en la
información de capacidad recibida desde uno o más de los puntos
extremos, adaptada para dar instrucciones a dicho uno o más puntos
extremos transmisores para generar flujos multimedia que comprenden
tramas parciales ajustadas para corresponderse con las capacidades
de los puntos extremos receptores que participan en una sesión.
\vskip1.000000\baselineskip
2. Sistema según la reivindicación
1, caracterizado por el hecho de que
la información de capacidad es una de las
siguientes: formatos de visualización, anchos de banda de
transmisión, requisitos de procesamiento o múltiples combinaciones
de los mismos.
\vskip1.000000\baselineskip
3. Sistema según cualquiera de las
reivindicaciones 1 ó 2,
caracterizado por el hecho de que
la unidad central está adaptada para componer un
flujo de datos combinados desde uno o más flujos de datos únicos
enviados desde uno o más puntos extremos transmisores y para
encaminar dicho flujo combinado a los puntos extremos
receptores.
\vskip1.000000\baselineskip
4. Sistema según cualquiera de las
reivindicaciones 1-3,
caracterizado por el hecho de que
la sesión es una sesión de videoconferencia.
\vskip1.000000\baselineskip
5. Sistema según cualquiera de las
reivindicaciones 1-4,
caracterizado por el hecho de que
la comunicación entre dicha unidad central y la
pluralidad de puntos extremos utiliza técnicas de compresión
escalables.
\vskip1.000000\baselineskip
6. Sistema según la reivindicación 1,
caracterizado por el hecho de que
la unidad central está dispuesta para solicitar
a un punto extremo que de información respecto a su capacidad con
la utilización de un lenguaje de comandos comunicado mediante
canales de control.
\vskip1.000000\baselineskip
7. Sistema según cualquiera de las
reivindicaciones 1-6,
caracterizado por el hecho de que
una visualización, incluida en dicha pluralidad
de puntos extremos, está dividida en una cuadrícula de celdas,
donde cada dicha trama parcial ocupa una o más celdas de la
cuadrícula y la visualización puede tener varias relaciones de
aspecto.
\newpage
8. Sistema según la reivindicación 7,
caracterizado por el hecho de que
cada trama parcial ocupa un número variante de
celdas adyacentes.
\vskip1.000000\baselineskip
9. Sistema según la reivindicación 4,
caracterizado por el hecho de que
dicha sesión de videoconferencia es una
conferencia centralizada, una conferencia descentralizada o una
conferencia híbrida.
\vskip1.000000\baselineskip
10. Procedimiento para intercambiar
simultáneamente informaciones de audio, video y/o datos entre una
pluralidad de puntos extremos en una red de comunicaciones
soportado por una unidad central, la pluralidad de puntos extremos
comprendiendo puntos extremos transmisores y puntos extremos
receptores,
caracterizado por el hecho de que
da instrucciones a uno o más de los puntos
extremos transmisores, basándose en la información de capacidad
recibida desde uno o más puntos extremos, para generar flujos
multimedia comprendiendo tramas parciales ajustadas para
corresponderse con las capacidades de los puntos extremos receptores
que participan en una sesión; y por el intercambio bidireccional de
flujos multimedia entre la unidad central y los puntos extremos,
donde dichos flujos multimedia están compuestos de tramas
parciales.
\vskip1.000000\baselineskip
11. Sistema según la reivindicación 10,
caracterizado por el hecho de que
la información de capacidad es una de las
siguientes:
formatos de visualización,
ancho de banda de transmisión,
requisitos de procesamiento o
múltiples combinaciones de los mismos.
\vskip1.000000\baselineskip
12. Procedimiento según cualquiera de las
reivindicaciones 10 ó 11,
caracterizado por
la composición, en la unidad central, de un
flujo de datos combinados compuesto desde uno o más flujos de datos
únicos enviados desde uno o más puntos extremos transmisores y
por encaminar dicho flujo combinado a los puntos
extremos receptores.
\vskip1.000000\baselineskip
13. Procedimiento según cualquiera de las
reivindicaciones 10-12,
caracterizado por el hecho de que
la sesión se mantiene como una sesión de
videoconferencia.
\vskip1.000000\baselineskip
14. Procedimiento según cualquiera de las
reivindicaciones 10-13,
caracterizado por
la utilización de técnicas de compresión durante
el intercambio de datos entre dicha unidad central y la pluralidad
de puntos extremos.
\vskip1.000000\baselineskip
15. Procedimiento según cualquiera de las
reivindicaciones 10-14,
caracterizado por
la división de una visualización en una
cuadrícula de celdas, donde cada dicha trama parcial ocupa una o más
celdas de la cuadrícula y la visualización puede tener varias
relaciones de aspecto.
\vskip1.000000\baselineskip
16. Procedimiento según la reivindicación
15,
caracterizado por el hecho de que
se permite que cada trama parcial ocupe un
número variante de celdas adyacentes.
\vskip1.000000\baselineskip
17. Procedimiento según la reivindicación
13,
caracterizado por el hecho de que
dicha sesión de videoconferencia es una
conferencia centralizada, una conferencia descentralizada o una
conferencia híbrida.
\vskip1.000000\baselineskip
18. Procedimiento según la reivindicación
10,
caracterizado por el hecho de que
la unidad central solicita a un punto extremo
que dé información respecto a su capacidad con la utilización de un
lenguaje de comandos comunicado mediante canales de control.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| NO20035078A NO318911B1 (no) | 2003-11-14 | 2003-11-14 | Distribuert sammensetting av sanntids-media |
| NO20035078 | 2003-11-14 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| ES2336216T3 true ES2336216T3 (es) | 2010-04-09 |
Family
ID=29775187
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| ES04800192T Expired - Lifetime ES2336216T3 (es) | 2003-11-14 | 2004-11-15 | Compositor de medios distribuidos a tiempo real. |
Country Status (9)
| Country | Link |
|---|---|
| US (4) | US7561179B2 (es) |
| EP (1) | EP1683356B1 (es) |
| JP (1) | JP2007511954A (es) |
| CN (1) | CN100568948C (es) |
| AT (1) | ATE455436T1 (es) |
| DE (1) | DE602004025131D1 (es) |
| ES (1) | ES2336216T3 (es) |
| NO (1) | NO318911B1 (es) |
| WO (1) | WO2005048600A1 (es) |
Families Citing this family (62)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2422065B (en) * | 2005-01-05 | 2008-12-17 | Codian Ltd | Video multi-conference unit (MCU) |
| US8289370B2 (en) * | 2005-07-20 | 2012-10-16 | Vidyo, Inc. | System and method for scalable and low-delay videoconferencing using scalable video coding |
| US7932919B2 (en) * | 2006-04-21 | 2011-04-26 | Dell Products L.P. | Virtual ring camera |
| KR100754222B1 (ko) * | 2006-06-15 | 2007-09-03 | 삼성전자주식회사 | 네트워크 디바이스간에 서비스 제어 방법 및 그 방법을수행할 수 있는 네트워크 디바이스와 저장 매체 |
| US8773494B2 (en) | 2006-08-29 | 2014-07-08 | Microsoft Corporation | Techniques for managing visual compositions for a multimedia conference call |
| US7924305B2 (en) * | 2006-09-15 | 2011-04-12 | Hewlett-Packard Development Company, L.P. | Consistent quality for multipoint videoconferencing systems |
| US20080101410A1 (en) * | 2006-10-25 | 2008-05-01 | Microsoft Corporation | Techniques for managing output bandwidth for a conferencing server |
| US8259624B2 (en) * | 2006-10-27 | 2012-09-04 | Cisco Technology, Inc. | Dynamic picture layout for video conferencing based on properties derived from received conferencing signals |
| US8571027B2 (en) * | 2007-04-18 | 2013-10-29 | At&T Intellectual Property I, L.P. | System and method for multi-rate video delivery using multicast stream |
| US20080273078A1 (en) * | 2007-05-01 | 2008-11-06 | Scott Grasley | Videoconferencing audio distribution |
| MX2010002658A (es) | 2007-09-05 | 2010-04-09 | Savant Systems Llc | Sistema y metodo para control multimedia expandible. |
| WO2009045207A1 (en) * | 2007-10-01 | 2009-04-09 | Hewlett-Packard Development Company, L.P. | Systems and methods for managing virtual collaboration systems spread over different networks |
| US9043483B2 (en) * | 2008-03-17 | 2015-05-26 | International Business Machines Corporation | View selection in a vehicle-to-vehicle network |
| US9123241B2 (en) | 2008-03-17 | 2015-09-01 | International Business Machines Corporation | Guided video feed selection in a vehicle-to-vehicle network |
| EP2255530A4 (en) * | 2008-03-17 | 2012-11-21 | Hewlett Packard Development Co | PRESENTATION OF FLOW OF PANORAMIC VIDEO IMAGES |
| US8319820B2 (en) | 2008-06-23 | 2012-11-27 | Radvision, Ltd. | Systems, methods, and media for providing cascaded multi-point video conferencing units |
| BRPI0910213A2 (pt) * | 2008-06-30 | 2015-09-22 | Hewlett Packard Development Co | computador para uma reunião virtual, método para prover um serviço de leiaute comum de reunião virtual e servidor hospedeiro para videoconferência |
| US8269817B2 (en) * | 2008-07-16 | 2012-09-18 | Cisco Technology, Inc. | Floor control in multi-point conference systems |
| TW201012222A (en) * | 2008-09-12 | 2010-03-16 | Primax Electronics Ltd | Method for producing internet video images |
| US8502857B2 (en) * | 2008-11-21 | 2013-08-06 | Polycom, Inc. | System and method for combining a plurality of video stream generated in a videoconference |
| NO332009B1 (no) * | 2008-12-12 | 2012-05-21 | Cisco Systems Int Sarl | Fremgangsmate for a igangsette kommunikasjonsforbindelser |
| US20100149301A1 (en) * | 2008-12-15 | 2010-06-17 | Microsoft Corporation | Video Conferencing Subscription Using Multiple Bit Rate Streams |
| US8380790B2 (en) * | 2008-12-15 | 2013-02-19 | Microsoft Corporation | Video conference rate matching |
| US8228363B2 (en) * | 2009-01-30 | 2012-07-24 | Polycom, Inc. | Method and system for conducting continuous presence conferences |
| US8760492B2 (en) | 2009-01-30 | 2014-06-24 | Polycom, Inc. | Method and system for switching between video streams in a continuous presence conference |
| US8396960B2 (en) * | 2009-05-08 | 2013-03-12 | Canon Kabushiki Kaisha | Efficient network utilization using multiple physical interfaces |
| CN102082944B (zh) * | 2009-11-30 | 2016-03-09 | 华为终端有限公司 | 一种包含远程呈现会场的会议控制方法、装置及系统 |
| WO2011138637A1 (en) * | 2010-05-03 | 2011-11-10 | Nokia Corporation | System, method, and apparatus for facilitating group video communication |
| US8717408B2 (en) * | 2010-05-13 | 2014-05-06 | Lifesize Communications, Inc. | Conducting a private videoconference within a videoconference via an MCU |
| NO333235B1 (no) | 2010-05-25 | 2013-04-15 | Cisco Systems Int Sarl | System og fremgangsmate for konferanser med skalerbar mediesvitsjing |
| US11606537B2 (en) | 2010-05-25 | 2023-03-14 | Cisco Technology, Inc. | System and method for scalable media switching conferencing |
| US8947492B2 (en) | 2010-06-18 | 2015-02-03 | Microsoft Corporation | Combining multiple bit rate and scalable video coding |
| US9876953B2 (en) | 2010-10-29 | 2018-01-23 | Ecole Polytechnique Federale De Lausanne (Epfl) | Omnidirectional sensor array system |
| CN102655584B (zh) * | 2011-03-04 | 2017-11-24 | 中兴通讯股份有限公司 | 一种远程呈现技术中媒体数据发送和播放的方法及系统 |
| FR2972587B1 (fr) * | 2011-03-10 | 2015-10-30 | Streamwide | Dispositif et procede de mixage reparti de flux de donnees |
| CN102143349A (zh) * | 2011-03-22 | 2011-08-03 | 宋健 | 一种基于音频、视频信号分别通过独立通道传输的视频会议实现方法 |
| KR101251755B1 (ko) * | 2011-04-22 | 2013-04-05 | 권기훈 | 영상회의 시스템의 영상구조 조절방법 및 그 시스템 |
| CN102868873B (zh) | 2011-07-08 | 2017-10-17 | 中兴通讯股份有限公司 | 一种远程呈现方法、终端和系统 |
| JP2013042492A (ja) * | 2011-08-11 | 2013-02-28 | Polycom Inc | 常駐表示式ビデオ会議においてビデオストリームを切替える方法およびシステム |
| TWI491218B (zh) * | 2011-08-11 | 2015-07-01 | Polycom Inc | 媒體中繼視訊通信 |
| US10050800B2 (en) * | 2011-09-14 | 2018-08-14 | Barco N.V. | Electronic tool and methods for meetings for providing connection to a communications network |
| SG10201601302PA (en) | 2011-09-14 | 2016-03-30 | Barco Nv | Electronic tool and methods with audio for meetings |
| US10965480B2 (en) | 2011-09-14 | 2021-03-30 | Barco N.V. | Electronic tool and methods for recording a meeting |
| US8756348B2 (en) | 2011-09-14 | 2014-06-17 | Barco N.V. | Electronic tool and methods for meetings |
| US11258676B2 (en) | 2011-09-14 | 2022-02-22 | Barco N.V. | Electronic tool and methods for meetings |
| US9083769B2 (en) | 2011-09-14 | 2015-07-14 | Barco N.V. | Electronic tool and methods for meetings |
| US20130083151A1 (en) | 2011-09-30 | 2013-04-04 | Lg Electronics Inc. | Electronic device and method for controlling electronic device |
| GB2501471A (en) | 2012-04-18 | 2013-10-30 | Barco Nv | Electronic conference arrangement |
| US8810625B2 (en) * | 2012-04-26 | 2014-08-19 | Wizard of Ads, SunPop Studios Ltd. | System and method for remotely configuring and capturing a video production |
| US9313486B2 (en) | 2012-06-20 | 2016-04-12 | Vidyo, Inc. | Hybrid video coding techniques |
| US20140028788A1 (en) * | 2012-07-30 | 2014-01-30 | Polycom, Inc. | Method and system for conducting video conferences of diverse participating devices |
| US8963988B2 (en) * | 2012-09-14 | 2015-02-24 | Tangome, Inc. | Camera manipulation during a video conference |
| US20140114664A1 (en) * | 2012-10-20 | 2014-04-24 | Microsoft Corporation | Active Participant History in a Video Conferencing System |
| NO341315B1 (no) * | 2013-04-17 | 2017-10-09 | Pexip AS | Dynamisk allokering av enkodere |
| FR3011704A1 (fr) * | 2013-10-07 | 2015-04-10 | Orange | Procede de mise en œuvre d'une session de communication entre une pluralite de terminaux |
| US9338401B2 (en) * | 2014-03-31 | 2016-05-10 | Polycom, Inc. | System and method for a hybrid topology media conferencing system |
| US9602771B2 (en) | 2014-12-10 | 2017-03-21 | Polycom, Inc. | Automated layouts optimized for multi-screen and multi-camera videoconferencing calls |
| WO2017042331A1 (en) * | 2015-09-11 | 2017-03-16 | Barco N.V. | Method and system for connecting electronic devices |
| US11206244B2 (en) * | 2018-12-21 | 2021-12-21 | ARRIS Enterprise LLC | Method to preserve video data obfuscation for video frames |
| US11283969B2 (en) * | 2019-08-09 | 2022-03-22 | Verizon Media Inc. | System and method for managing a virtual studio |
| US12244432B2 (en) * | 2023-06-02 | 2025-03-04 | Zoom Communications, Inc. | High-definition distributed recording of a conference |
| US12289175B2 (en) | 2023-06-02 | 2025-04-29 | Zoom Communications, Inc. | Compositing high-definition conference recordings |
Family Cites Families (20)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2527202B2 (ja) * | 1987-10-07 | 1996-08-21 | 三菱電機株式会社 | 多地点画像伝送システム |
| JP3125552B2 (ja) * | 1993-12-28 | 2001-01-22 | 三菱電機株式会社 | テレビ会議システム |
| US5586016A (en) | 1994-07-05 | 1996-12-17 | Motorola, Inc. | Circuit for quickly energizing electronic ballast |
| US5555017A (en) * | 1994-07-08 | 1996-09-10 | Lucent Technologies Inc. | Seamless multimedia conferencing system using an enhanced multipoint control unit |
| US5687095A (en) * | 1994-11-01 | 1997-11-11 | Lucent Technologies Inc. | Video transmission rate matching for multimedia communication systems |
| CN1140126C (zh) * | 1995-06-29 | 2004-02-25 | 汤姆森多媒体公司 | 分层压缩视频数据的编解码系统 |
| JPH09149396A (ja) * | 1995-11-27 | 1997-06-06 | Fujitsu Ltd | 多地点テレビ会議システム |
| GB2328832A (en) * | 1996-08-30 | 1999-03-03 | Motorola Inc | Apparatus,method and system for audio and video conferencing and telephony |
| US6288739B1 (en) | 1997-09-05 | 2001-09-11 | Intelect Systems Corporation | Distributed video communications system |
| WO1999018728A1 (en) | 1997-10-02 | 1999-04-15 | General Datacomm, Inc. | Interconnecting multimedia data streams having different compressed formats |
| US6560280B1 (en) * | 1998-02-02 | 2003-05-06 | Vcon Ltd. | Video transmission system |
| US6523069B1 (en) | 2000-03-13 | 2003-02-18 | Yahoo! Inc. | Transmission of multicast media between networks |
| US6473137B1 (en) * | 2000-06-28 | 2002-10-29 | Hughes Electronics Corporation | Method and apparatus for audio-visual cues improving perceived acquisition time |
| US7007098B1 (en) * | 2000-08-17 | 2006-02-28 | Nortel Networks Limited | Methods of controlling video signals in a video conference |
| US20020126201A1 (en) | 2001-03-08 | 2002-09-12 | Star-Bak Communication Inc. | Systems and methods for connecting video conferencing to a distributed network |
| US20040022202A1 (en) * | 2002-08-05 | 2004-02-05 | Chih-Lung Yang | Method and apparatus for continuously receiving images from a plurality of video channels and for alternately continuously transmitting to each of a plurality of participants in a video conference individual images containing information concerning each of said video channels |
| US7263124B2 (en) * | 2001-09-26 | 2007-08-28 | Intel Corporation | Scalable coding scheme for low latency applications |
| US7362349B2 (en) * | 2002-07-10 | 2008-04-22 | Seiko Epson Corporation | Multi-participant conference system with controllable content delivery using a client monitor back-channel |
| US7627629B1 (en) * | 2002-10-30 | 2009-12-01 | Cisco Technology, Inc. | Method and apparatus for multipoint conferencing |
| US20050013309A1 (en) * | 2003-07-14 | 2005-01-20 | Channasandra Ravishankar | System and method for high quality video conferencing with heterogeneous end-points and networks |
-
2003
- 2003-11-14 NO NO20035078A patent/NO318911B1/no not_active IP Right Cessation
-
2004
- 2004-11-15 CN CNB2004800335014A patent/CN100568948C/zh not_active Expired - Lifetime
- 2004-11-15 AT AT04800192T patent/ATE455436T1/de not_active IP Right Cessation
- 2004-11-15 US US10/986,932 patent/US7561179B2/en active Active
- 2004-11-15 DE DE602004025131T patent/DE602004025131D1/de not_active Expired - Lifetime
- 2004-11-15 ES ES04800192T patent/ES2336216T3/es not_active Expired - Lifetime
- 2004-11-15 JP JP2006539418A patent/JP2007511954A/ja active Pending
- 2004-11-15 EP EP04800192A patent/EP1683356B1/en not_active Expired - Lifetime
- 2004-11-15 WO PCT/NO2004/000344 patent/WO2005048600A1/en not_active Ceased
-
2009
- 2009-07-02 US US12/497,316 patent/US8289369B2/en active Active
-
2012
- 2012-10-12 US US13/651,106 patent/US8773497B2/en not_active Expired - Lifetime
-
2014
- 2014-06-05 US US14/297,135 patent/US9462228B2/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| NO318911B1 (no) | 2005-05-23 |
| US20130038677A1 (en) | 2013-02-14 |
| EP1683356B1 (en) | 2010-01-13 |
| CN1883197A (zh) | 2006-12-20 |
| US20140354766A1 (en) | 2014-12-04 |
| US7561179B2 (en) | 2009-07-14 |
| JP2007511954A (ja) | 2007-05-10 |
| EP1683356A1 (en) | 2006-07-26 |
| US8289369B2 (en) | 2012-10-16 |
| NO20035078D0 (no) | 2003-11-14 |
| CN100568948C (zh) | 2009-12-09 |
| US8773497B2 (en) | 2014-07-08 |
| US9462228B2 (en) | 2016-10-04 |
| DE602004025131D1 (de) | 2010-03-04 |
| ATE455436T1 (de) | 2010-01-15 |
| WO2005048600A1 (en) | 2005-05-26 |
| US20100033550A1 (en) | 2010-02-11 |
| US20050122392A1 (en) | 2005-06-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| ES2336216T3 (es) | Compositor de medios distribuidos a tiempo real. | |
| CN100583985C (zh) | 一种在视频业务中实现画面切换的方法、装置及系统 | |
| EP2214410B1 (en) | Method and system for conducting continuous presence conferences | |
| RU2536807C2 (ru) | Терминал, блок многоадресного управления, система и способ для формирования многооконных изображений высокой четкости | |
| CN101262587B (zh) | 一种实现多画面视频会议的方法及多点控制单元 | |
| CN101860715A (zh) | 多画面合成方法、系统及媒体处理装置 | |
| CN105144702B (zh) | 视频会议虚拟端点 | |
| US9338401B2 (en) | System and method for a hybrid topology media conferencing system | |
| CN101370114A (zh) | 视频及音频处理方法、多点控制单元和视频会议系统 | |
| WO2011116611A1 (zh) | 用于电视会议的视频播放方法 | |
| ES2345893T3 (es) | Disposicion y procedimiento para generar imagenes de presencia continua. | |
| JPH08317366A (ja) | 多地点テレビ会議システム | |
| KR19990070821A (ko) | 화상회의 시스템에서 참가자 4명까지의 비디오를 단일 비디오 스트림으로 변환하는 서버 | |
| JPH05153583A (ja) | 多地点間ビデオ通信方式 | |
| JPH04177993A (ja) | 画像符号化方法及びその画像符号化方法を用いた多地点間テレビ会議システム | |
| JPH09261615A (ja) | 多地点テレビ会議システム | |
| HK1141381A (en) | Method and system for conducting continuous presence conferences |