CN111343473B - 直播应用的数据处理方法、装置、电子设备及存储介质 - Google Patents

直播应用的数据处理方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111343473B
CN111343473B CN202010116984.5A CN202010116984A CN111343473B CN 111343473 B CN111343473 B CN 111343473B CN 202010116984 A CN202010116984 A CN 202010116984A CN 111343473 B CN111343473 B CN 111343473B
Authority
CN
China
Prior art keywords
data
voice
client
voice control
avatar
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010116984.5A
Other languages
English (en)
Other versions
CN111343473A (zh
Inventor
张奇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Dajia Internet Information Technology Co Ltd
Original Assignee
Beijing Dajia Internet Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Dajia Internet Information Technology Co Ltd filed Critical Beijing Dajia Internet Information Technology Co Ltd
Priority to CN202010116984.5A priority Critical patent/CN111343473B/zh
Publication of CN111343473A publication Critical patent/CN111343473A/zh
Priority to EP20914765.1A priority patent/EP4114009A1/en
Priority to PCT/CN2020/130186 priority patent/WO2021169432A1/zh
Priority to US17/388,852 priority patent/US20220020373A1/en
Application granted granted Critical
Publication of CN111343473B publication Critical patent/CN111343473B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4788Supplemental services, e.g. displaying phone caller identification, shopping application communicating with other users, e.g. chatting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/18Speech classification or search using natural language modelling
    • G10L15/1822Parsing for meaning understanding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/21Server components or server architectures
    • H04N21/218Source of audio or video content, e.g. local disk arrays
    • H04N21/2187Live feed
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/472End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content
    • H04N21/47202End-user interface for requesting content, additional data or services; End-user interface for interacting with content, e.g. for content reservation or setting reminders, for requesting event notification, for manipulating displayed content for requesting content on demand, e.g. video on demand
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • H04N21/478Supplemental services, e.g. displaying phone caller identification, shopping application
    • H04N21/4781Games
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8106Monomedia components thereof involving special audio data, e.g. different tracks for different languages
    • H04N21/8113Monomedia components thereof involving special audio data, e.g. different tracks for different languages comprising music, e.g. song in MP3 format
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/81Monomedia components thereof
    • H04N21/8146Monomedia components thereof involving graphical data, e.g. 3D object, 2D graphics
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Graphics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Information Transfer Between Computers (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

本公开关于一种直播应用的数据处理方法、装置、电子设备及存储介质。所述方法包括:接收第一客户端提供的语音控制数据;获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据;将所述多媒体数据发送至所述第一客户端。本公开能够提高直播应用的交互性。

Description

直播应用的数据处理方法、装置、电子设备及存储介质
技术领域
本公开涉及计算机互联网技术领域,尤其涉及一种直播应用的数据处理方法、装置、电子设备及存储介质。
背景技术
智能语音助手在移动设备的使用中越来越广泛,使用语音助手操作移动设备,给用户带来很多便利,比如更快的搜索路径,更方便的交互方式,目前大多数语音助手都集成在收集系统或者独立的移动应用中,用于查询信息和操作手机。另外,手机直播领域,应用的主要技术为通过主播终端实时录像,形成视频数据流,主播终端的视频数据流通过压缩、编辑后上传至服务器,服务器再将视频数据流广播至观众终端,观众终端对视频数据流进行解压播放,在进行视频数据流采集和播放的过程中,主播和观众可以进行互动,现有直播系统现有比较火的交互系统有PK、连麦、聊天室、礼物等。现有直播系统中能够添加虚拟宠物,通过虚拟宠物与观众进行互动,提高了直播系统与用户的互动性。
然而,现有直播系统中对虚拟宠物发出指令,需要通过手指点击操作,不能很好的模拟真实宠物,虚拟宠物与主播的交互性差。
发明内容
本公开提供一种直播应用的数据处理方法、装置、电子设备及存储介质,以至少解决相关技术中直播应用交互性差的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种直播应用的数据处理方法,包括:
接收第一客户端提供的语音控制数据;
获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据;
将所述多媒体数据发送至所述第一客户端。
在一示例性实施例中,在所述接收第一客户端提供的语音控制数据之后,还包括:根据所述语音控制数据判断对应的虚拟形象的级别参数是否达到预设级别;每个所述语音控制数据与所述虚拟形象某一预设级别对应;所述获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据,包括:在所述虚拟形象的级别参数达到所述预设级别时,获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
在一示例性实施例中,所述语音控制数据中包括对所述虚拟形象的控制语音;
所述接收第一客户端提供的语音控制数据,包括:接收第一客户端提供的包括对所述虚拟形象的控制语音的语音控制数据;对所述语音控制数据进行指令解析,获得语音控制指令。
在一示例性实施例中,所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数据中至少一种;所述语音控制数据包括控制虚拟形象动作的数据和针对所述直播应用的功能控制数据中至少一种;所述语音控制数据与所述多媒体数据一一对应。
在一示例性实施例中,所述获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据,包括:获取所述语音控制数据对应的虚拟形象的相应级别的动画数据;
所述将所述多媒体数据发送至所述第一客户端,包括:将所述虚拟形象的相应级别的动画数据发送至所述第一客户端。
在一示例性实施例中,所述获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据,包括:获取所述语音控制数据对应的功能执行数据;
所述将所述多媒体数据发送至所述第一客户端,包括:将所述功能执行数据发送至所述第一客户端。
在一示例性实施例中,在接收第一客户端提供的语音控制数据之前,还包括:接收所述第一客户端的包括指定唤醒词的语音数据;根据所述语音数据对所述第一客户端的指定唤醒词进行识别;
所述接收第一客户端提供的语音控制数据,包括:在识别到所述指定唤醒词后,接收第一客户端提供的语音控制数据。
在一示例性实施例中,所述根据所述语音数据对所述第一客户端的指定唤醒词进行识别,包括:将所述语音数据输入预设的唤醒词识别模型,得到所述语音数据是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音数据,输出所述语音数据是否包含指定唤醒词的结果。
在一示例性实施例中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识;
在所述根据所述语音控制数据判断对应的虚拟形象的级别参数是否达到预设级别之后,还包括:在所述虚拟形象的级别参数达到所述预设级别时,将所述宠物交友请求发送至所述结交宠物标识对应的第一客户端;接收所述结交宠物标识对应的第一客户端的交友确认信息;根据所述交友确认信息,对所述当前宠物标识和结交宠物标识设置好友标识,并向所述当前宠物标识对应的第一客户端和所述结交宠物标识对应的第一客户端发送交友成功信息,所述交友成功信息触发所述第一客户端生成交友特效。
在一示例性实施例中,所述直播应用的数据处理方法,还包括:将所述多媒体数据发送至第二客户端;所述第二客户端为与所述第一客户端处于同一直播间的客户端。
在一示例性实施例中,所述直播应用的数据处理方法,还包括:向第二客户端发送任务数据包,所述任务数据包为对所述虚拟形象投递口粮的任务数据包;在接收所述第二客户端根据所述任务数据包的领取指令后,接收所述第二客户端的任务完成数据;根据所述任务完成数据,生成所述虚拟形象的宠物口粮数据,并根据所述宠物口粮数据更所述虚拟形象的升级进度参数。
在一示例性实施例中,在根据所述任务完成数据,生成所述虚拟形象的宠物口粮数据,并根据所述宠物口粮数据更新所述虚拟形象的升级进度参数,之后,还包括:在所述升级进度参数达到预设值时,更新所述虚拟形象的级别参数;根据所述级别参数,更新所述虚拟形象对应的语音控制数据的数据库;根据所述级别参数,生成所述虚拟形象的成长信息;将所述虚拟形象的成长信息发送至所述虚拟形象对应的第一客户端和/或所述第二客户端。
根据本公开实施例的第二方面,提供一种直播应用的数据处理方法,包括:
获取语音控制数据对应的虚拟形象的相应级别的多媒体数据;
在直播间页面播放所述多媒体数据。
在一示例性实施例中,所述语音控制数据包括用于控制所述虚拟形象的语音;
在获取语音控制数据对应的虚拟形象的相应级别的多媒体数据之前,包括:响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令;向服务器发送所述语音控制指令;
所述获取语音控制数据对应的虚拟形象的相应级别的多媒体数据,包括:接收所述服务器发送的所述语音控制指令对应的虚拟形象的相应级别的多媒体数据。
在一示例性实施例中,所述语音控制数据包括对所述虚拟形象的控制语音;
在获取语音控制数据对应的虚拟形象的相应级别的多媒体数据步骤之前,包括:响应于对虚拟形象互动的触发操作,向服务器发送包括对所述虚拟形象的控制语音的语音控制数据;
所述获取语音控制数据对应的虚拟形象的相应级别的多媒体数据步骤包括:接收所述服务器发送的所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
在一示例性实施例中,所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数据中至少一种;所述语音控制数据包括控制虚拟形象动作的数据和针对直播应用的功能控制数据中至少一种;所述语音控制数据与所述多媒体数据一一对应。
在一示例性实施例中,所述获取语音控制数据对应的虚拟形象的相应级别的多媒体数据,包括:获取语音控制数据对应的虚拟形象的相应级别的动画数据;
所述在直播间页面播放所述多媒体数据,包括:在直播间页面播放所述动画数据。
在一示例性实施例中,所述获取语音控制数据对应的虚拟形象的相应级别的多媒体数据,包括:获取语音控制数据对应的功能执行数据;
所述在直播间页面播放所述多媒体数据,包括:在直播间页面执行所述功能执行数据对应的功能。
在一示例性实施例中,所述直播应用的数据处理方法,还包括:向服务器发送包括指定唤醒词的语音数据;在接收到服务器发送的所述指定唤醒词正确的信息时,执行响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令的步骤。
在一示例性实施例中,所述直播应用的数据处理方法,还包括:获取用户输入的语音;根据所述语音进行初步识别,判断是否包括指定唤醒词;在所述语音包括指定唤醒词时,执行向服务器发送包括指定唤醒词的语音数据的步骤。
在一示例性实施例中,所述直播应用的数据处理方法,还包括:获取用户输入的语音;将所述语音输入预设的唤醒词识别模型,得到所述语音是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音,输出所述语音是否包含指定唤醒词的结果,在所述语音包含指定唤醒词时,执行响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令的步骤。
在一示例性实施例中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识;
在所述向服务器发送所述语音控制指令之后,还包括:接收交友成功信息;根据所述交友成功信息,将所述结交宠物的信息添加至所述虚拟形象的好友列表,并生成交友特效,并在所述直播间页面显示所述交友特效。
根据本公开实施例的第三方面,提供一种直播应用的数据处理装置,包括:
语音控制数据接收模块,被配置为执行接收第一客户端提供的语音控制数据;
多媒体数据获取模块,被配置为执行获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据;
发送模块,被配置为执行将所述多媒体数据发送至所述第一客户端。
在一示例性实施例中,所述直播应用的数据处理装置,还包括:
级别判断模块,被配置为执行根据所述语音控制数据判断对应的虚拟形象的级别参数是否达到预设级别;每个所述语音控制数据与所述虚拟形象某一预设级别对应;
所述多媒体数据获取模块,还被配置为执行在所述虚拟形象的级别参数达到所述预设级别时,获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
在一示例性实施例中,所述语音控制数据中包括对所述虚拟形象的控制语音;
所述语音控制数据接收模块包括:控制数据接收单元,被配置为执行接收第一客户端提供的包括对所述虚拟形象的控制语音的语音控制数据;解析单元,被配置为执行对针对所述语音控制数据进行指令解析,获得语音控制指令。
在一示例性实施例中,所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数据中至少一种;所述语音控制数据包括控制虚拟形象动作的数据和针对所述直播应用的功能控制数据中至少一种;所述语音控制数据与所述多媒体数据一一对应。
在一示例性实施例中,所述多媒体数据获取模块,还被配置为执行获取所述语音控制数据对应的虚拟形象的相应级别的动画数据;所述发送模块,还被配置为执行将所述虚拟形象的相应级别的动画数据发送至所述第一客户端。
在一示例性实施例中,所述多媒体数据获取模块,还被配置为执行获取所述语音控制数据对应的功能执行数据;所述发送模块,还被配置为执行将所述功能执行数据发送至所述第一客户端。
在一示例性实施例中,所述直播应用的数据处理装置,还包括:语音数据接收模块,被配置为执行接收所述第一客户端的包括指定唤醒词的语音数据;识别模块,被配置为执行根据所述语音数据对所述第一客户端的指定唤醒词进行识别;所述语音控制数据接收模块,还被配置为执行在识别到所述指定唤醒词后,接收第一客户端提供的语音控制数据。
在一示例性实施例中,所述识别模块,还被配置为执行将所述语音数据输入预设的唤醒词识别模型,得到所述语音数据是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音数据,输出所述语音数据是否包含指定唤醒词的结果。
在一示例性实施例中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识;所述装置还包括:宠物交友请求发送模块,被配置为执行在所述虚拟形象的级别参数达到所述预设级别时,将所述宠物交友请求发送至所述结交宠物标识对应的第一客户端;交友确认信息接收模块,被配置为执行接收所述结交宠物标识对应的第一客户端的交友确认信息;交友成功信息发送模块,被配置为执行根据所述交友确认信息,对所述当前宠物标识和结交宠物标识设置好友标识,并向所述当前宠物标识对应的第一客户端和所述结交宠物标识对应的第一客户端发送交友成功信息,所述交友成功信息触发所述第一客户端生成交友特效。
在一示例性实施例中,所述发送模块,还被配置为执行将所述多媒体数据发送至第二客户端,所述第二客户端为与所述第一客户端处于同一直播间的客户端。
在一示例性实施例中,所述直播应用的数据处理装置还包括:任务数据包发送模块,被配置为执行向第二客户端发送任务数据包,所述任务数据包为对所述虚拟形象投递口粮的任务数据包;任务完成数据接收模块,被配置为执行在接收所述第二客户端根据所述任务数据包的领取指令后,接收所述第二客户端的任务完成数据;升级进度更新模块,被配置为执行根据所述任务完成数据,生成所述虚拟形象的宠物口粮数据,并根据所述宠物口粮数据更新所述虚拟形象的升级进度参数。
在一示例性实施例中,所述的直播应用的数据处理装置还包括:级别参数更新模块,被配置为执行在所述升级进度参数达到预设值时,更新所述虚拟形象的级别参数;数据库更新模块,被配置为执行根据所述级别参数,更新所述虚拟形象对应的语音控制数据的数据库;成长信息生成模块,被配置为执行根据所述级别参数,生成所述虚拟形象的成长信息;成长信息发送模块,被配置为执行将所述虚拟形象的成长信息发送至所述虚拟形象对应的第一客户端和/或所述第二客户端。
根据本公开实施例的第四方面,提供一种直播应用的数据处理装置,包括:
多媒体数据获取模块,被配置为执行获取语音控制数据对应的虚拟形象的相应级别的多媒体数据;
播放模块,被配置为执行在直播间页面播放所述多媒体数据。
在一示例性实施例中,所述语音控制数据包括用于控制所述虚拟形象的语音。所述装置还包括:解析识别模块,被配置为执行响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令;指令发送模块,被配置为执行向服务器发送所述语音控制指令;所述多媒体数据获取模块,还被配置为执行接收所述服务器发送的所述语音控制指令对应的虚拟形象的相应级别的多媒体数据。
在一示例性实施例中,所述语音控制数据包括对所述虚拟形象的控制语音;所述装置还包括:语音控制数据发送模块,被配置为执行响应于对虚拟形象互动的触发操作,向服务器发送包括对所述虚拟形象的控制语音的语音控制数据;所述多媒体数据获取模块,还被配置为执行接收所述服务器发送的所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
在一示例性实施例中,所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数据中至少一种;所述语音控制数据包括控制虚拟形象动作的数据和针对直播应用的功能控制数据中至少一种;所述语音控制数据与所述多媒体数据一一对应。
在一示例性实施例中,所述多媒体数据获取模块,还被配置为执行获取语音控制数据对应的虚拟形象的相应级别的动画数据;所述播放模块,还被配置为执行在直播间页面播放所述动画数据。
在一示例性实施例中,所述多媒体数据获取模块,还被配置为执行获取语音控制数据对应的功能执行数据;所述播放模块,还被配置为执行在直播间页面执行所述功能执行数据对应的功能。
在一示例性实施例中,所述直播应用的数据处理装置,还包括:语音数据发送模块,被配置为执行向服务器发送包括指定唤醒词的语音数据;所述解析识别模块,还被配置为执行在接收到服务器发送的所述指定唤醒词正确的信息时,响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令。
在一示例性实施例中,所述直播应用的数据处理装置,还包括:语音输入模块,被配置为执行获取用户输入的语音;初步识别模块,被配置为执行根据所述语音进行初步识别,判断是否包括指定唤醒词;所述语音数据发送模块,还被配置为执行在所述语音包括指定唤醒词时,向服务器发送包括指定唤醒词的语音数据。
在一示例性实施例中,所述直播应用的数据处理装置,还包括:语音输入模块,被配置为执行获取用户输入的语音;唤醒词识别模块,被配置为执行将所述语音输入预设的唤醒词识别模型,得到所述语音是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音,输出所述语音是否包含指定唤醒词的结果;所述解析识别模块,还被配置为执行在所述语音包含指定唤醒词时,响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令。
在一示例性实施例中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识。所述装置还包括:交友成功信息接收模块,被配置为执行接收交友成功信息;交友特效显示模块,被配置为执行根据所述交友成功信息,将所述结交宠物的信息添加至所述虚拟形象的好友列表,并生成交友特效,并在所述直播间页面显示所述交友特效。
根据本公开实施例的第五方面,提供一种计算机程序产品,所述程序产品包括计算机程序,所述计算机程序存储在可读存储介质中,设备的至少一个处理器从所述可读存储介质读取并执行所述计算机程序,使得设备执行第一方面的任一项实施例中所述的直播应用的数据处理方法或第二方面的任一项实施例中所述的直播应用的数据处理方法。
本公开的实施例提供的技术方案至少带来以下有益效果:通过根据语音控制数据对应的虚拟形象的相应级别获取多媒体数据,能够根据不同的虚拟形象级别设置不同的语音控制数据,从而实现虚拟形象不同成长阶段的体现,并且通过语音控制数据执行,控制虚拟形象在直播间的动作,提高了虚拟形象的画面感以及用户与虚拟形象的交互性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理,并不构成对本公开的不当限定。
图1是根据一示例性实施例示出的一种直播应用的数据处理方法的应用环境图。
图2是根据一示例性实施例示出的应用于服务器端的一种直播应用的数据处理方法的流程图。
图3是根据另一示例性实施例示出的应用于服务器端的一种直播应用的数据处理方法的流程图。
图4是根据一示例性实施例示出的一种根据音乐播放数据播放音乐的主播客户端界面示意图。
图5是根据另一示例性实施例示出的一种根据音乐播放数据播放音乐的主播客户端界面示意图。
图6是根据一示例性实施例示出的宠物升级的主播客户端界面示意图。
图7是根据一示例性实施例示出的宠物结婚特效的主播客户端界面示意图。
图8是根据一示例性实施例示出的应用于第一客户端的一种直播应用的数据处理方法的流程图。
图9是根据一示例性实施例示出的应用于观众客户端的一种直播应用的数据处理方法的流程图。
图10是根据一示例性实施例示出的一种直播应用的数据处理装置的框图。
图11是根据另一示例性实施例示出的一种直播应用的数据处理装置的框图。
图12是根据一示例性实施例示出的一种电子设备的内部结构图。
图13是根据另一示例性实施例示出的一种电子设备的内部结构图。
具体实施方式
为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
本公开所提供的直播应用的数据处理方法,可以应用于如图1所示的应用环境中。其中,第一客户端102、第二客户端106通过网络与服务器104进行交互。服务器104接收第一客户端102提供的语音控制数据;获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据;将所述多媒体数据发送至所述第一客户端102。所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数据中至少一种;其中,虚拟形象的动画数据包括虚拟宠物给观众送礼的动画、答谢观众的动画和虚拟宠物表演的动画等,针对直播应用的功能执行数据包括在直播间播放音乐的音乐播放指令、开启直播间背景音效的控制指令和开启连麦的控制指令等。
其中,服务器104还将所述多媒体数据发送至所述第二客户端104,以控制所述第二客户端104播放所述多媒体数据。其中,所述第一客户端102为主播客户端或者具有控制权限的观众客户端,所述第二客户端104为进入所述主播客户端的直播间的观众客户端。服务器104将所述多媒体数据发送至所述第二客户端104的步骤与服务器104将所述多媒体数据发送至所述第一客户端102的步骤不分先后。
其中,当所述语音控制数据为播放音乐时,服务器104在所述虚拟形象的级别参数达到所述预设级别时,将所述音乐播放数据发送至所述第一客户端102,以控制所述第一客户端102播放音乐。当所述语音控制数据为控制虚拟形象做动作时,服务器104在所述虚拟形象的级别参数达到所述预设级别时,获取所述语音控制数据对应的虚拟形象的相应级别的动画数据;将所述动画数据发送至所述第一客户端102和第二客户端106,所述第二客户端106为进入所述第一客户端直播间的观众客户端。其中,所述动画数据为关于虚拟形象动作的画面数据和关于虚拟形象发声的音频数据。
本公开提供的直播应用的数据处理方法,可以根据应用解决该技术问题,具体的,服务器104在获取语音控制数据后,判断所述语音控制数据对应的虚拟形象的级别参数是否达到预设级别,在达到所述预设级别时,执行所述语音控制数据;本公开能够根据不同的虚拟形象级别设置不同的语音控制数据,从而实现虚拟形象不同成长阶段的体现,并且通过语音控制数据控制虚拟形象在直播间的动作,提高了虚拟形象的画面感以及主播、观众与虚拟形象的交互性。因此,通过该直播应用的数据处理方法,增加了直播过程中主播和观众互动的趣味性,降低了直播过程中观众的流失率,从而也降低了直播应用主播的流失率。
其中,第一客户端102、第二客户端106可以是但不限于各种可以包括但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备,服务器104可以是独立的服务器或者是多个服务器组成的服务器集群来实现。
图2是根据一示例性实施例示出的一种直播应用的数据处理方法的流程图,如图2所示,直播应用的数据处理方法用于服务器104中,包括以下步骤:
在步骤S110中,接收第一客户端提供的语音控制数据。
其中,第一客户端可为主播客户端或者具有控制权限的观众客户端;当然,第一客户端也可为使用直播应用的具有控制权限的其他客户端,用户可以在直播应用申请虚拟形象的使用权限来对虚拟形象进行使用和控制。为了方便描述,本实施例中的第一客户端以主播客户端为例进行描述。
其中,所述语音控制数据为音视频处理后的语音或者语音控制指令;音视频处理后的语音在第一客户端的直播间页面通过虚拟形象图标和文字结合的方式显示。如图4所通过语音发出的对计算机设备进行控制的数据,例如,主播发出“小快小快,讲个笑话”,在识别到指定唤醒词“小快”后,再接收“讲个笑话”的语音控制数据。
在步骤S130中,获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
其中,语音控制数据与所述多媒体数据对应。具体的,当语音控制数据为播放音乐时,对应的多媒体数据为在直播间播放音乐的音乐播放数据,当语音控制数据为“跳个舞”时,对应的多媒体数据为虚拟形象跳舞的动画数据。当然,多媒体数据还需要与所述虚拟形象的级别相对应,因为虚拟形象在不同的成长阶段,其形象不同,例如,语音播放数据为“跳歌舞”,虚拟形象为青少年宠物阶段,则虚拟形象跳舞的动画数据为青少年宠物阶段的虚拟形象跳舞的动画数据,所述虚拟形象可为根据直播应用设置的虚拟宠物、皮肤、道具等。
在步骤S140中,将所述多媒体数据发送至所述第一客户端。
其中,所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数中至少一种;其中,虚拟形象的动画数据包括虚拟宠物给观众送礼的动画、答谢观众的动画和虚拟宠物表演的动画等,针对直播应用的功能执行数据包括在直播间播放音乐的音乐播放指令、开启直播间背景音效的控制指令和开启连麦的控制指令等。所述语音控制数据包括控制虚拟形象动作的数据和针对所述直播应用的功能控制数据中至少一种;所述语音控制数据与所述多媒体数据一一对应。
在其中一个实施例中,所述直播应用的数据处理方法,还包括:将所述多媒体数据发送至第二客户端,以控制所述第二客户端播放所述多媒体数据;所述第二客户端为与所述第一客户端处于同一直播间的客户端。所述多媒体数据发送至所述第二客户端的步骤与将所述多媒体数据发送至所述第一客户端的步骤不分先后。
其中,第一客户端和/或第一客户端播放所述多媒体数据,具体为,在所述第一客户端和/或第二客户端的直播间页面显示所述虚拟形象的动作画面和播放所述,虚拟形象发声的音频。例如,所述语音控制数据为“播放音乐”,则服务器将所述“播放音乐”的语音控制数据获取音乐播放控制数据发送至第一客户端,第一客户端根据所述音乐播放控制数据进行音乐播放,当所述语音控制数据为“讲个笑话”,则服务器获取虚拟形象讲笑话的数据(包括动画和音频)发送至第一客户端和/或第二客户端,第一客户端和/或第二客户端播放所述动画数据,即可听到笑话和看到与所述笑话配合的虚拟形象动作画面。
其中,第一客户端可为主播客户端或者具有控制权限的观众客户端,主播客户端为主播使用的终端,具体可为主播使用的手机,观众客户端为进入所述主播所开设的直播间的观众其所使用的终端,具体也可为手机,当然也可为个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。主播客户端和观众客户端在接收所述动画数据后,对所述动画数据进行播放,所述动画数据可以仅包括所述虚拟形象的动作画面,也可以仅包括所述虚拟形象的音频数据,当然所述动画数据可以既包括所述虚拟形象的动作画面也包括所述虚拟形象的音频数据。
本实施例通过获取所述语音控制数据对应的虚拟形象的相应级别的动画数据,并发送至主播客户端,能够实现虚拟形象在直播间页面进行互动行为,并且所述语音控制数据由主播客户端发出,实现主播对虚拟形象的控制,让虚拟形象的真实感增强,有利于提高主播的积极性以提高主播节目的质量。
在一示例性实施例中,如图3所示,在步骤S110之后,还包括:步骤S120,根据所述语音控制数据判断对应的虚拟形象的级别参数是否达到预设级别;每个所述语音控制数据与所述虚拟形象某一预设级别对应。所述步骤S130包括:在所述虚拟形象的级别参数达到所述预设级别时,获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
其中,每个所述语音控制数据与所述虚拟形象某一预设级别对应,预设级别由所述语音控制数据确定,在服务器中存储了每个语音控制数据对应的预设级别。语音控制数据包括对应的虚拟形象标识,根据所述虚拟形象标识,能够获知所述语音控制数据是根据哪一个虚拟形象发出的。每个虚拟形象都有相应的级别参数,所述虚拟形象的级别参数表示所述虚拟形象的成长阶段,所述级别参数小表示所述虚拟形象的处于幼年宠物阶段,所述级别参数适中标识所述虚拟形象处于青少年宠物阶段,所述级别参数越高表示所述虚拟形象处于成年宠物阶段,不同的宠物阶段,所述虚拟形象可以完成的操作不同,当然,可以理解的是,虚拟形象的级别越高,其可以完成的操作越多。例如,幼年宠物阶段的虚拟形象只能笑、哭,青少年宠物阶段的虚拟形象能够播放音乐、讲笑话、交友、跳舞,成年宠物阶段的虚拟形象能够结婚、结拜。
其中,根据所述语音控制数据判断对应的虚拟形象的级别参数是否达到预设级别,具体为,根据所述语音控制数据判断对应的虚拟形象的级别参数是否大于或等于所述预设级别。其中,所述虚拟形象的级别参数达到所述预设级别,表明所述虚拟形象满足级别要求,能够执行所述语音控制数据。
在一示例性实施例中,在所述虚拟形象的级别参数未达到所述预设级别时,向第一客户端发送虚拟形象级别低不能执行所述指令的信息。其中,第一客户端根据所述虚拟形象级别低不能执行所述指令的信息在第一客户端的直播间页面显示,具体的,可以通过虚拟形象图标和文字结合的方式显示,可以显示文字为“虚拟形象级别低不能执行所述指令”。通过将不能执行的指令的形式,通过宠物图标和文字结合的方式显示,一方面能够提醒用户虚拟形象级别低以提高用户对虚拟形象升级的积极性,另一方面能够给用户反馈所述语音控制指令不能执行的原因。
在一示例性实施例中,所述语音控制数据中包括对所述虚拟形象的控制语音;所述步骤S110包括:接收第一客户端提供的包括对所述虚拟形象的控制语音的语音控制数据;对所述语音控制数据进行指令解析,获得语音控制指令。
其中,用户根据第一客户端发出对所述虚拟形象的控制语音,语音控制数据可以是第一客户端对所述控制语音处理后的语音数据也可以是第一客户端接收到的原始控制语音数据。服务器根据接收到语音控制数据,进行指令解析获得语音控制指令。其中,通过服务器对语音控制数据解析识别能够识别更多的语音控制指令,所述服务器存储预设的语音控制指令识别模型,通过预设的语音控制指令识别模型对语音控制指令进行识别;其中,预设的语音控制指令识别模型通过预设类型的神经网络训练获取,用于根据输入的语音控制数据,输出语音控制指令。其中,预设类型的神经网络包括LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet等神经网络,当然,预设类型的神经网络还包括逻辑回归函数。
在一示例性实施例中,所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数据中至少一种;所述语音控制数据包括控制虚拟形象动作的数据和针对所述直播应用的功能控制数据中至少一种;所述语音控制数据与所述多媒体数据一一对应。
在一示例性实施例中,所述获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据,包括:获取所述语音控制数据对应的虚拟形象的相应级别的动画数据。所述将所述多媒体数据发送至所述第一客户端,包括:将所述虚拟形象的相应级别的动画数据发送至所述第一客户端。
在一示例性实施例中,所述获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据,包括:获取所述语音控制数据对应的功能执行数据。所述将所述多媒体数据发送至所述第一客户端,包括:将所述功能执行数据发送至所述第一客户端。本实施例中,通过将所述功能执行数据发送至所述主播客户端,以控制所述主播客户端的直播应用的操作,实现了通过虚拟形象来进行直播应用的控制,比通过语音指令直接控制直播应用,更加提高了对直播应用控制的画面质量和趣味性。
上述实施例中,虚拟形象的动画数据为关于虚拟形象动作的画面数据和关于虚拟形象发声的音频数据。其中,虚拟形象的动画数据包括虚拟宠物给观众送礼的动画、答谢观众的动画和虚拟宠物表演的动画等。其中,功能执行数据为对直播应用的功能进行控制的数据,针对直播应用的功能执行数据包括在直播间播放音乐的音乐播放指令、开启直播间背景音效的控制指令和开启连麦的控制指令等,例如,功能执行数据为控制直播应用进行播放音乐、主播PK、连麦、建立聊天室和赠送礼物等。控制虚拟形象动作的数据为用户向第一客户端发出的控制虚拟形象动作的原始语音或第一客户端对所述原始语音处理过的语音数据。
例如,将所述虚拟形象的相应级别的动画数据发送至所述第一客户端为,将所述虚拟形象讲笑话的动画数据发送至第一客户端,第一客户端接收所述虚拟形象讲笑话的动画数据,在直播间页面显示所述虚拟形象讲笑话的动画和音频。例如,将所述功能执行数据发送至所述第一客户端为,将音乐播放数据发送至第一客户端,第一客户端接收所述音乐播放数据进行音乐播放。
同理,上述实施例中的动画数据和功能执行数据也可被服务器发送至第二客户端,在第二客户端播放所述动画数据或者执行所述功能执行数据对应的功能,第二客户端为具有控制权限的观众客户端。
在一示例性实施例中,在步骤S110之前,还包括,接收所述第一客户端的包括指定唤醒词的语音数据;根据所述语音数据对所述第一客户端的指定唤醒词进行识别。所述步骤S110包括:在识别到所述指定唤醒词后,接收第一客户端提供的语音控制数据。
其中,所述指定唤醒词根据所述第一客户端的虚拟形象预先设置,指定唤醒词包括对虚拟形象的称谓;例如,主播在主播客户端可以预先设置所述虚拟形象的指定唤醒词,具体的,所述指定唤醒词为所述虚拟形象的名称,例如,主播设置所述虚拟形象的名称为“小快”,则根据主播发出的语音来识别所述语音中是否包含“小快”,在所述语音中识别到“小快”即为识别到指定唤醒词。当然,主播也可以不设置指定唤醒词,系统中会存在默认的指定唤醒词,即虚拟形象的初始名称,主播通过呼唤初始名称,系统也能对语音中指定唤醒词进行识别。本实施例通过服务器对指定唤醒词进行识别,提高了指定唤醒词识别的准确性。
在其中一个实施例中,在识别到第一客户端的指定唤醒词(如小快)后,服务器接收所述第一客户端提供的语音控制数据。例如,第一客户端对用户输入的语音先进行录制,然后按照用户的语气停顿对录制的语音进行切分,再按照时间的先后顺序进行存储;逐一对切分的语音进行指定唤醒词识别,在识别到指定唤醒词后,第一客户端将包括指定唤醒词的语音和所述语音之后的其它语音发送至服务器,服务器再对所述包括指定唤醒词的语音第二次进行指定唤醒词的识别,保证识别的准确性;在识别到指定唤醒词后,再对所述语音的其它语音进行语音控制数据的识别。本实施例通过对语音进行切分来进行指定唤醒词识别和语音控制数据的识别,服务器在识别到指定唤醒词后,直接处理唤醒词语音后面的语音,节约了第一客户端再次发送的时间,提供了语音控制数据的处理效率。
另外,在服务器未识别到第一客户端的指定唤醒词时,向所述第一客户端发送停止发送语音控制数据的指令,以使得所述第一客户端停止发送后续的语音信息。本实施例,通过服务器发送停止发送语音控制数据的指令,能够通知第一客户端停止录取语音和停止发送语音,避免系统资源的浪费。
在一示例性实施例中,所述根据所述语音数据对所述第一客户端的指定唤醒词进行识别,包括:将所述语音数据输入预设的唤醒词识别模型,得到所述语音数据是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音数据,输出所述语音数据是否包含指定唤醒词的结果。
其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的数据,输出所述语音数据是否包含指定唤醒词的结果。其中,预设类型的神经网络包括LeNet-5、AlexNet、ZFNet、VGG-16、GoogLeNet、ResNet等神经网络,当然,预设类型的神经网络还包括逻辑回归函数。
本实施例通过预设的唤醒词识别模型识别指定唤醒词,能够提高指定唤醒词识别的准确性。
在一个具体的实施例中,所述语音控制数据由主播客户端发出,服务器对所述语音控制数据进行识别,获得音乐播放指令。当然,所述音乐播放指令也可由主播客户端进行识别获得。如图4所示,主播发出“小快小快,放首歌”,主播客户端在识别到指定唤醒词“小快”后,在将语音控制数据“放首歌”在主播客户端的直播间页面进行显示(如图4所示)。进一步可选的,可以将关于“小快”的语音发送至服务器进行第二次识别,服务器在识别到指定唤醒词小快后,接收主播客户端发送的“放首歌”的语音控制数据,服务器根据语音控制数据解析识别获取音乐播放指令,再将音乐播放指令发送至主播客户端,主播客户端根据所述音乐播放指令打开音乐播器302进行音乐播放(如图5所示)。当然,还有一种方式,主播客户端在接收到主播发出的“小快小快,放首歌”之后,将接收到的语音数据(“小快小快,放首歌”)发送至服务器进行识别,服务器对该语音数据进行识别,获取音乐播放指令,再将音乐播放指令发送至主播客户端,主播客户端根据所述音乐播放指令打开音乐播器进行音乐播放。
在一示例性实施例中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识。在所述根据所述语音控制数据判断对应的虚拟形象的级别参数是否达到预设级别步骤之后,还包括:在所述虚拟形象的级别参数达到所述预设级别时,将所述宠物交友请求发送至所述结交宠物标识对应的第一客户端;接收所述结交宠物标识对应的第一客户端的交友确认信息;根据所述交友确认信息,对所述当前宠物标识和结交宠物标识设置好友标识,并向所述当前宠物标识对应的第一客户端和所述结交宠物标识对应的第一客户端发送交友成功信息,所述交友成功信息触发所述第一客户端生成交友特效。
具体的,宠物交友包括宠物结拜、宠物结婚,在所述虚拟形象达到相应级别后,可以进行宠物交友(解锁宠物交友技能),当前宠物标识和结交宠物标识可以为宠物的名称、宠物的编号。例如,主播发出“与宠物A结拜”的语音信息,服务器根据“与宠物A结拜”的语音信息,生成宠物交友请求,宠物交友请求包括当前宠物标识和结交宠物标识(宠物A的标识),根据结交宠物标识找到相应的主播客户端,将所述宠物交友请求发送至所述结交宠物标识对应的第一客户端,只有在所述结交宠物标识对应的第一客户端确认的情况下,才能收到接收所述结交宠物标识对应的第一客户端的交友确认信息,服务器根据所述交友确认信息,对所述当前宠物标识和结交宠物标识设置好友标识,并向所述当前宠物标识对应的第一客户端和所述结交宠物标识对应的第一客户端发送交友成功信息,所述交友成功信息触发所述主播客户端生成交友特效,如图7所示,宠物交友为宠物结婚,交友特效为包含结婚宠物的形象和“我们结婚了啦”的文字特效,并且通过醒目的方式显示,观众在看到交友特效后可以送祝福、送礼物。
本实施例,通过宠物交友和交友特效,能够有效的提高的用户与直播应用中的虚拟形象的互动性,提高了虚拟形象的真实度。
在一示例性实施例中,所述直播应用的数据处理方法,还包括:向第二客户端发送任务数据包,所述任务数据包为对所述虚拟形象投递口粮的任务数据包;在接收所述第二客户端根据所述任务数据包的领取指令后,接收所述第二客户端的任务完成数据;根据所述任务完成数据,生成所述虚拟形象的宠物口粮数据,并根据所述宠物口粮数据更新所述虚拟形象的升级进度参数。
具体的,任务数据包由观众客户端领取,进入直播间页面的观众客户端可以根据页面显示的任务数据包点击领取,在点击领取任务数据包后,直播间页面展示任务数据包中的任务,在点击领取任务数据包后,即默认观众开始执行任务,服务器实时监听所述观众客户端的任务完成情况。本实施例,通过进入直播间的观众来领取任务对虚拟形象进行投递口粮,实现了与观众客户端的互动,增添了观看直播的趣味性,从而减少直播应用观众的流失率。
在一示例性实施例中,在根据所述任务完成数据,生成所述虚拟形象的宠物口粮数据,并根据所述宠物口粮数据更新所述虚拟形象的升级进度参数步骤之后,还包括:在所述升级进度参数达到预设值时,更新所述虚拟形象的级别参数;根据所述级别参数,更新所述虚拟形象对应的语音控制数据的数据库;根据所述级别参数,生成所述虚拟形象的成长信息,将所述虚拟形象的成长信息发送至所述虚拟形象对应的第一客户端和/或所述第二客户端。其中,所述第一客户端根据所述虚拟形象的成长信息,更新所述虚拟形象的形象和对解锁技能进行突出显示,所述第二客户端显示所述虚拟形象更新后的形象。
其中,更新所述虚拟形象的级别参数、更新所述虚拟形象对应的语音控制数据的数据库和生成所述虚拟形象的成长信息的步骤不分先后。语音控制数据的数据库存储了关于所述虚拟形象的所有的语音控制数据。所述虚拟形象的成长信息包括所述虚拟形象成长后的形象和解锁技能。例如,如图6所示,观众客户端通过任务框304领取任务,并执行任务,在任务完成后,所述虚拟形象的口粮可以按照预设数目进行增加,例如分享直播增加50g口粮,在所述虚拟形象达到一定级别后,解锁相应的技能,当然技能可以包括多个,如图6中,已经解锁了技能1并在直播间页面中进行突出显示,由于还未达到相应级别,技能2为黑色。本实施例,通过对虚拟形象的升级,能够提高主播使用直播应用的趣味性,从而减少直播应用的用户流失率。
图8是根据一示例性实施例示出的一种直播应用的数据处理方法的流程图,如图8所示,直播应用的数据处理方法用于第一客户端102中,包括以下步骤。
在步骤S210中,获取语音控制数据对应的虚拟形象的相应级别的多媒体数据。
其中,关于虚拟形象的级别参数、预设级别和多媒体数据的相关介绍参照上述实施例中的描述。
在步骤S220中,在直播间页面播放所述多媒体数据。
其中,关于多媒体数据见上述实施例中的描述。其中,直播间页面可为主播开启的直播房间的页面。在直播间页面播放所述多媒体数据包括在直播间展示所述虚拟形象的动画数据或者执行针对直播应用的功能,例如,在直播间页面展示虚拟宠物给观众送礼的动画、答谢观众的动画和虚拟宠物表演的动画,或者,在直播间页面执行音乐播放指令、开启直播间背景音效的控制指令和开启连麦的控制指令。
本实施例直播应用的数据处理方法,通过根据语音控制数据对应的虚拟形象的相应级别获取多媒体数据,能够根据不同的虚拟形象级别设置不同的语音控制数据,从而实现虚拟形象不同成长阶段的体现,并且通过语音控制数据执行,控制虚拟形象在直播间的动作,提高了虚拟形象的画面感以及用户与虚拟形象的交互性。
在本申请中,语音控制数据可以是主播客户端对控制语音处理后的语音数据,也可以是主播客户端接收到的原始语音数据。
比如,语音控制数据可以包括用于控制所述虚拟形象的语音(即主播客户端处理后的语音数据)。在这种实施例中,所述语音控制数据包括用于控制所述虚拟形象的语音。对应的,在步骤S210之前主播客户端需要进行处理:响应于对虚拟形象互动的触发操作,对所述语音控制数据(接收到的针对虚拟形象的控制语音)进行解析识别,得到语音控制指令;向服务器发送所述语音控制指令。所述步骤S210包括:接收所述服务器发送的所述语音控制指令对应的虚拟形象的相应级别的多媒体数据。
其中,对虚拟形象互动的触发操作包括用户点击发送语音的按钮或者用户向主播客户端通过语音输入指定唤醒词,例如,用户长按屏幕输入语音,或者,用户输入指定唤醒词的语音,此处的输入为用户通过声音的方式输入;控制所述虚拟形象的语音具体为用户发出的对虚拟形象进行控制的语音,例如,用户对主播客户端说“放音乐”,则语音控制数据为“放音乐”的语音数据,主播客户端可以主动对“放音乐”的语音数据进行解析识别,获得音乐播放指令。本实施例通过主播客户端在获取到语音控制数据后就进行语音控制指令识别,提高了指令的识别效率。
比如,语音控制数据可以包括用于控制所述虚拟形象的原始语音数据(未经主播客户端处理的语音数据)。在这种实施例中,所述语音控制数据包括对所述虚拟形象的控制语音。步骤S210之前,包括:响应于对虚拟形象互动的触发操作,向服务器发送包括对所述虚拟形象的控制语音的语音控制数据(控制所述虚拟形象的原始语音数据)。所述步骤S210包括:接收所述服务器发送的所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
其中,所述语音控制数据为用户向主播客户端发出的原始语音数据,例如,用户向主播客户端发出“小快小快,讲个笑话”,主播客户端获取“小快小快,讲个笑话”的语音控制数据,并将其发至服务器,通过服务器来解析识别获得“讲个笑话”的语音控制指令。
本实施例通过将对所述虚拟形象的控制语音的语音控制数据发送至服务器,通过服务器对语音控制数据进行解析,获得语音控制指令,能够提高对语音控制数据解析的准确性。
在其中一个实施例中,所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数据中至少一种;所述语音控制数据包括控制虚拟形象动作的数据和针对直播应用的功能控制数据中至少一种;所述语音控制数据与所述多媒体数据一一对应。其中,关于虚拟形象的动画数据、针对直播应用的功能执行数据、控制虚拟形象动作的数据和针对直播应用的功能控制数据参见上述实施例中的描述。
在其中一个实施例中,所述步骤S210包括:获取语音控制数据对应的虚拟形象的相应级别的动画数据。所述步骤S220包括:在直播间页面播放所述动画数据。本实施例通过获取所述语音控制数据对应的虚拟形象的相应级别的动画数据,并发送至主播客户端,能够实现虚拟形象在直播间页面进行互动行为,并且所述语音控制数据由主播客户端发出,实现主播对虚拟形象的控制,让虚拟形象的真实感增强,有利于提高主播的积极性以提高主播节目的质量。
在其中一个实施例中,所述步骤S210包括:获取语音控制数据对应的功能执行数据。所述步骤S220包括:在直播间页面执行所述功能执行数据对应的功能。本实施例中,通过将所述功能执行数据发送至所述主播客户端,以控制所述主播客户端的直播应用的操作,实现了通过虚拟形象来进行直播应用的控制,比通过语音指令直接控制直播应用,更加提高了对直播应用控制的画面质量和趣味性。
在其中一个实施例中,所述直播应用的数据处理方法,还包括:向服务器发送包括指定唤醒词的语音数据;在接收到服务器发送的所述指定唤醒词正确的信息时,执行响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令的步骤。其中,关于指定唤醒词的语音数据、对虚拟形象互动的触发操作的相关描述参见上述实施例。本实施例通过服务器对指定唤醒词进行识别,提高了指定唤醒词识别的准确性。
在其中一个实施例中,所述直播应用的数据处理方法,还包括:获取用户输入的语音;根据所述语音进行初步识别,判断是否包括指定唤醒词;在所述语音包括指定唤醒词时,执行向服务器发送包括指定唤醒词的语音数据的步骤。其中,用户通过发出声音向第一客户端输入语音。本实施例通过第一客户端对指定唤醒词进行初步识别,在通过服务器对指定唤醒词进行二次识别,提高了指定唤醒词识别的准确性。
在其中一个实施例中,所述直播应用的数据处理方法,还包括:获取用户输入的语音;将所述语音输入预设的唤醒词识别模型,得到所述语音是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音,输出所述语音是否包含指定唤醒词的结果,在所述语音包含指定唤醒词时,执行响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令的步骤。
其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入语音,输出所述语音是否包含指定唤醒词的结果。其中,预设类型的神经网络包括LeNet-5、A1exNet、ZFNet、VGG-16、GoogLeNet、ResNet等神经网络,当然,预设类型的神经网络还包括逻辑回归函数。
本实施例在第一客户端通过预设的唤醒词识别模型对唤醒词进行识别,提高了唤醒词识别的准确率和效率。
在其中一个实施例中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识。在所述向服务器发送所述语音控制指令之后,还包括:接收交友成功信息;根据所述交友成功信息,将所述结交宠物的信息添加至所述虚拟形象的好友列表,并生成交友特效,并在所述直播间页面显示所述交友特效。其中,关于交友特效和在所述直播间页面显示所述交友特效的相关描述参见上述实施例。本实施例,通过宠物交友和交友特效,能够有效的提高的用户与直播应用中的虚拟形象的互动性,提高了虚拟形象的真实度。
图9是根据一示例性实施例示出的一种直播应用的数据处理方法的流程图,如图9所示,直播应用的数据处理方法用于第二客户端106中,包括以下步骤。
在步骤S310中,接收服务器发送的任务数据包,所述任务数据包为在当前直播间对虚拟形象投递口粮的任务数据包。
其中,任务数据包包括至少一个任务,例如所述任务数据包包括观看直播到达10分钟、分享直播、给主播送礼或加入粉丝团,当前直播间的观众账户在完成任务数据包后能够给主播的虚拟形象投递口粮。所述任务数据包可以通过提醒消息的形式在主播客户端进行显示,或者任务数据包以虚拟按钮的形式显示,关于任务数据包在主播客户端的显示方式在此不作限定。
在步骤S320中,响应于领取任务的触发指令,向服务器发送所述任务数据包的领取指令。
其中,领取任务的触发指令通过观众点击任务数据包触发生成。如图6所示,例如,观众在看到赚口粮的任务数据包后,点击赚口粮的虚拟按钮,则生成领取任务的触发指令;当然,为了防止观众误点赚口粮的虚拟按钮,可以在点击赚口粮的虚拟按钮,对赚口粮的任务数据包显示相应的介绍信息,再次让观众进行确认,观众通过点击确认按钮,即表示接收任务,此时再生成领取任务的触发指令。
在步骤S330中,监听任务完成进度;所述任务完成进度包括一项或多项任务的完成进度。
其中,任务完成进度表示任务的完成情况,在观众接受任务后,观众客户端会实时监听任务的完成情况。例如,当任务数据包为观看直播10分钟,则监听观众客户端是否停留在直播间页面10分钟,当任务数据包为分享直播,则监听观众是否触发对当前直播的分享操作。
在步骤S340中,在所述任务完成进度满足任务完成条件时,向所述服务器发送任务完成数据;所述任务完成数据用于生成所述虚拟形象的宠物口粮数据,所述宠物口粮数据用于更新所述虚拟形象的升级进度参数。
其中,任务完成条件可以根据相应的任务进行设置,例如,任务数据包为观看直播10分钟,则观众客户端是否停留在直播间页面10分钟为任务完成条件。任务完成数据包括完成任务的编号,根据完成任务的编号生成的对应的虚拟口粮,例如,当任务数据包为分享直播+10g口粮,则根据任务完成数据对相应的虚拟形象增加10g口粮。
在其中一个实施例中,直播应用的数据处理方法还包括:获取语音控制数据对应的虚拟形象的相应级别的多媒体数据;在直播间页面播放所述多媒体数据。其中,关于虚拟形象的级别参数、预设级别和多媒体数据的相关介绍参照上述实施例中的描述;直播间页面可为主播开启的直播房间的页面。在直播间页面播放所述多媒体数据包括在直播间展示所述虚拟形象的动画数据或者执行针对直播应用的功能,例如,在直播间页面展示虚拟宠物给观众送礼的动画、答谢观众的动画和虚拟宠物表演的动画,或者,在直播间页面执行音乐播放指令、开启直播间背景音效的控制指令。
应该理解的是,虽然图2-3、8-9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-3、8-9中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
图10是根据一示例性实施例示出的一种直播应用的数据处理装置框图。参照图10,该装置400包括语音控制数据接收模块410、多媒体数据获取模块420和发送模块430。
语音控制数据接收模块410,被配置为执行接收第一客户端提供的语音控制数据。
多媒体数据获取模块420,被配置为执行获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
发送模块430,被配置为执行将所述多媒体数据发送至所述第一客户端。
在一示例性实施例中,所述直播应用的数据处理装置400,还包括:级别判断模块,被配置为执行根据所述语音控制数据判断对应的虚拟形象的级别参数是否达到预设级别;每个所述语音控制数据与所述虚拟形象某一预设级别对应;所述多媒体数据获取模块430,还被配置为执行在所述虚拟形象的级别参数达到所述预设级别时,获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
在一示例性实施例中,所述语音控制数据中包括对所述虚拟形象的控制语音;所述语音控制数据接收模块410包括:控制数据接收单元,被配置为执行接收第一客户端提供的包括对所述虚拟形象的控制语音的语音控制数据;解析单元,被配置为执行对所述语音控制数据进行指令解析,获得语音控制指令。
在一示例性实施例中,所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数据中至少一种;所述语音控制数据包括控制虚拟形象动作的数据和针对所述直播应用的功能控制数据中至少一种;所述语音控制数据与所述多媒体数据一一对应。
在一示例性实施例中,所述多媒体数据获取模块420,还被配置为执行获取所述语音控制数据对应的虚拟形象的相应级别的动画数据;所述发送模块430,还被配置为执行将所述虚拟形象的相应级别的动画数据发送至所述第一客户端。
在一示例性实施例中,所述多媒体数据获取模块420,还被配置为执行获取所述语音控制数据对应的功能执行数据;所述发送模块430,还被配置为执行将所述功能执行数据发送至所述第一客户端。
在一示例性实施例中,所述直播应用的数据处理装置,还包括:语音数据接收模块,被配置为执行接收所述第一客户端的包括指定唤醒词的语音数据;识别模块,被配置为执行根据所述语音数据对所述第一客户端的指定唤醒词进行识别;所述语音控制数据接收模块,还被配置为执行在识别到所述指定唤醒词后,接收第一客户端提供的语音控制数据。
在一示例性实施例中,所述识别模块,还被配置为执行将所述语音数据输入预设的唤醒词识别模型,得到所述语音数据是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音数据,输出所述语音数据是否包含指定唤醒词的结果。
在一示例性实施例中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识;所述装置400还包括:宠物交友请求发送模块,被配置为执行在所述虚拟形象的级别参数达到所述预设级别时,将所述宠物交友请求发送至所述结交宠物标识对应的第一客户端,交友确认信息接收模块,被配置为执行接收所述结交宠物标识对应的第一客户端的交友确认信息;交友成功信息发送模块,被配置为执行根据所述交友确认信息,对所述当前宠物标识和结交宠物标识设置好友标识,并向所述当前宠物标识对应的第一客户端和所述结交宠物标识对应的第一客户端发送交友成功信息,所述交友成功信息触发所述第一客户端生成交友特效。
在一示例性实施例中,所述发送模块430,还被配置为执行将所述多媒体数据发送至第二客户端;所述第二客户端为与所述第一客户端处于同一直播间的客户端。
在一示例性实施例中,所述直播应用的数据处理装置400,还包括:任务数据包发送模块,被配置为执行向第二客户端发送任务数据包,所述任务数据包为对所述虚拟形象投递口粮的任务数据包;任务完成数据接收模块,被配置为执行在接收所述第二客户端根据所述任务数据包的领取指令后,接收所述第二客户端的任务完成数据;升级进度更新模块,被配置为执行根据所述任务完成数据,生成所述虚拟形象的宠物口粮数据,并根据所述宠物口粮数据更新所述虚拟形象的升级进度参数。
在一示例性实施例中,所述的直播应用的数据处理装置400,还包括:级别参数更新模块,被配置为执行在所述升级进度参数达到预设值时,更新所述虚拟形象的级别参数;数据库更新模块,被配置为执行根据所述级别参数,更新所述虚拟形象对应的语音控制数据的数据库;成长信息生成模块,被配置为执行根据所述级别参数,生成所述虚拟形象的成长信息;成长信息发送模块,被配置为执行将所述虚拟形象的成长信息发送至所述虚拟形象对应的第一客户端和/或所述第二客户端。
图11是根据一示例性实施例示出的一种直播应用的数据处理装置框图。参照图11,该装置500包括多媒体数据获取模块510和播放模块520。
多媒体数据获取模块510,被配置为执行获取语音控制数据对应的虚拟形象的相应级别的多媒体数据。
播放模块520,被配置为执行在直播间页面播放所述多媒体数据。
在一示例性实施例中,所述语音控制数据包括用于控制所述虚拟形象的语音。所述装置500还包括:解析识别模块,被配置为执行响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令;指令发送模块,被配置为执行向服务器发送所述语音控制指令;所述多媒体数据获取模块,还被配置为执行接收所述服务器发送的所述语音控制指令对应的虚拟形象的相应级别的多媒体数据。
在一示例性实施例中,所述语音控制数据包括对所述虚拟形象的控制语音;所述装置500还包括:语音控制数据发送模块,被配置为执行响应于对虚拟形象互动的触发操作,向服务器发送包括对所述虚拟形象的控制语音的语音控制数据;所述多媒体数据获取模块,还被配置为执行接收所述服务器发送的所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
在一示例性实施例中,所述多媒体数据包括虚拟形象的动画数据和针对直播应用的功能执行数据中至少一种;所述语音控制数据包括控制虚拟形象动作的数据和针对直播应用的功能控制数据中至少一种;所述语音控制数据与所述多媒体数据一一对应。
在一示例性实施例中,所述多媒体数据获取模块510,还被配置为执行获取语音控制数据对应的虚拟形象的相应级别的动画数据;所述播放模块520,还被配置为执行在直播间页面播放所述动画数据。
在一示例性实施例中,所述多媒体数据获取模块510,还被配置为执行获取语音控制数据对应的功能执行数据;所述播放模块520,还被配置为执行在直播间页面执行所述功能执行数据对应的功能。
在一示例性实施例中,所述直播应用的数据处理装置500,还包括:语音数据发送模块,被配置为执行向服务器发送包括指定唤醒词的语音数据;所述解析识别模块,还被配置为执行在接收到服务器发送的所述指定唤醒词正确的信息时,响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令。
在一示例性实施例中,所述直播应用的数据处理装置500,还包括:语音输入模块,被配置为执行获取用户输入的语音;初步识别模块,被配置为执行根据所述语音进行初步识别,判断是否包括指定唤醒词;所述语音数据发送模块,还被配置为执行在所述语音包括指定唤醒词时,向服务器发送包括指定唤醒词的语音数据。
在一示例性实施例中,所述直播应用的数据处理装置500,还包括:语音输入模块,被配置为执行获取用户输入的语音;唤醒词识别模块,被配置为执行将所述语音输入预设的唤醒词识别模型,得到所述语音是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音,输出所述语音是否包含指定唤醒词的结果;所述解析识别模块,还被配置为执行在所述语音包含指定唤醒词时,响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令。
在一示例性实施例中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识。所述装置500还包括:交友成功信息接收模块,被配置为执行接收交友成功信息;交友特效显示模块,被配置为执行根据所述交友成功信息,将所述结交宠物的信息添加至所述虚拟形象的好友列表,并生成交友特效,并在所述直播间页面显示所述交友特效。
上述实施例中关于直播应用的数据处理装置的具体限定可以参见上文中对于直播应用的数据处理方法的限定,在此不再赘述。上述直播应用的数据处理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
图12是根据一示例性实施例示出的一种电子设备700的内部结构图。例如,设备700可以是移动电话、计算机、数字广播终端、消息收发设备、游戏控制台、平板设备、医疗设备、健身设备、个人数字助理等。
参照图12,设备700可以包括以下一个或多个组件:处理组件702、存储器704、电力组件706、多媒体组件708、音频组件710、输入/输出(I/O)的接口712、语音识别组件714以及通信组件716。
处理组件702通常控制设备700的整体操作,诸如与显示、电话呼叫、数据通信、相机操作和记录操作相关联的操作。处理组件702可以包括一个或多个处理器720来执行指令,以完成上述的方法的全部或部分步骤。此外,处理组件702可以包括一个或多个模块,便于处理组件702和其他组件之间的交互。例如,处理组件702可以包括多媒体模块,以方便多媒体组件708和处理组件702之间的交互。
存储器704被配置为存储各种类型的数据以支持在设备700的操作。这些数据的示例包括用于在设备700上操作的任何应用程序或方法的指令、联系人数据、电话簿数据、消息、图片、视频等。存储器704可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(SRAM)、电可擦除可编程只读存储器(EEPROM)、可擦除可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁存储器、快闪存储器、磁盘或光盘。
电源组件706为设备700的各种组件提供电力。电源组件706可以包括电源管理系统,一个或多个电源,及其他与为设备700生成、管理和分配电力相关联的组件。
多媒体组件708包括在所述设备700和用户之间的提供一个输出接口的屏幕。在一些实施例中,屏幕可以包括液晶显示器(LCD)和触摸面板(TP)。如果屏幕包括触摸面板,屏幕可以被实现为触摸屏,以接收来自用户的输入信号。触摸面板包括一个或多个触摸传感器以感测触摸、滑动和触摸面板上的手势。所述触摸传感器可以不仅感测触摸或滑动动作的边界,而且还检测与所述触摸或滑动操作相关的持续时间和压力。在一些实施例中,多媒体组件708包括一个前置摄像头和/或后置摄像头。当设备700处于操作模式,如拍摄模式或视频模式时,前置摄像头和/或后置摄像头可以接收外部的多媒体数据。每个前置摄像头和后置摄像头可以是一个固定的光学透镜系统或具有焦距和光学变焦能力。
音频组件710被配置为输出和/或输入音频信号。例如,音频组件710包括一个麦克风(MIC),当设备700处于操作模式,如呼叫模式、记录模式和语音识别模式时,麦克风被配置为接收外部音频信号。所接收的音频信号可以被进一步存储在存储器704或经由通信组件716发送。在一些实施例中,音频组件710还包括一个扬声器,用于输出音频信号。
I/O接口712为处理组件702和外围接口模块之间提供接口,上述外围接口模块可以是键盘,点击轮,按钮等。这些按钮可包括但不限于:主页按钮、音量按钮、启动按钮和锁定按钮。
语音识别组件714包括语义识别库,语义识别库存储了识别指定唤醒词的相关词语,用于对指定唤醒词进行初步识别。
通信组件716被配置为便于设备700和其他设备之间有线或无线方式的通信。设备700可以接入基于通信标准的无线网络,如WiFi,运营商网络(如2G、3G、4G或5G),或它们的组合。在一个示例性实施例中,通信组件716经由广播信道接收来自外部广播管理系统的广播信号或广播相关信息。在一个示例性实施例中,所述通信组件716还包括近场通信(NFC)模块,以促进短程通信。
在示例性实施例中,设备700可以被一个或多个应用专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑器件(PLD)、现场可编程门阵列(FPGA)、控制器、微控制器、微处理器或其他电子元件实现,用于执行上述方法。
在示例性实施例中,还提供了一种包括指令的非临时性计算机可读存储介质,例如包括指令的存储器704,上述指令可由设备700的处理器720执行以完成上述方法。例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD一ROM、磁带、软盘和光数据存储设备等。
图13是根据另一示例性实施例示出的一种用于电子设备800的内部结构图。例如,设备800可以为一服务器。参照图13,设备800包括处理组件820,其进一步包括一个或多个处理器,以及由存储器822所代表的存储器资源,用于存储可由处理组件820的执行的指令,例如应用程序。存储器822中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件820被配置为执行指令,以执行上述实施例中所述的直播应用的数据处理方法。
设备800还可以包括一个电源组件824被配置为执行设备800的电源管理,一个有线或无线网络接口826被配置为将设备800连接到网络,和一个输入输出(I/O)接口828。设备800可以操作基于存储在存储器822的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
在示例性实施例中,还提供了一种包括指令的存储介质,例如包括指令的存储器822,上述指令可由设备800的处理器执行以完成上述实施例所述的直播应用的数据处理方法。存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD一ROM、磁带、软盘和光数据存储设备等。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims (28)

1.一种直播应用的数据处理方法,其特征在于,应用于服务器,包括:
接收第一客户端提供的语音控制数据;所述语音控制数据包括控制虚拟形象动作的数据和针对直播应用的功能控制数据中的至少一种;
根据所述语音控制数据,确定对应的虚拟形象和预设级别;每个所述语音控制数据与所述虚拟形象某一预设级别对应;
当所述虚拟形象的级别参数达到所述预设级别时,获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据;所述多媒体数据包括所述虚拟形象的动画数据和针对所述直播应用的功能执行数据中的至少一种;
将所述动画数据发送至所述第一客户端,所述动画数据用于控制所述虚拟形象进行动作;
将所述功能执行数据发送至所述第一客户端,所述功能执行数据用于通过所述虚拟形象控制所述第一客户端的直播应用的操作;
其中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识;
在所述虚拟形象的级别参数达到所述预设级别之后,还包括:将所述宠物交友请求发送至所述结交宠物标识对应的第一客户端;接收所述结交宠物标识对应的第一客户端的交友确认信息;根据所述交友确认信息,对所述当前宠物标识和结交宠物标识设置好友标识,并向所述当前宠物标识对应的第一客户端和所述结交宠物标识对应的第一客户端发送交友成功信息,所述交友成功信息触发所述第一客户端生成交友特效。
2.根据权利要求1所述的直播应用的数据处理方法,其特征在于,所述语音控制数据中包括对所述虚拟形象的控制语音;
所述接收第一客户端提供的语音控制数据,包括:
接收第一客户端提供的包括对所述虚拟形象的控制语音的语音控制数据;
对所述语音控制数据进行指令解析,获得语音控制指令。
3.根据权利要求1所述的直播应用的数据处理方法,其特征在于,在接收第一客户端提供的语音控制数据之前,还包括:
接收所述第一客户端的包括指定唤醒词的语音数据;
根据所述语音数据对所述第一客户端的指定唤醒词进行识别;
所述接收第一客户端提供的语音控制数据,包括:
在识别到所述指定唤醒词后,接收第一客户端提供的语音控制数据。
4.根据权利要求3所述的直播应用的数据处理方法,其特征在于,所述根据所述语音数据对所述第一客户端的指定唤醒词进行识别,包括:
将所述语音数据输入预设的唤醒词识别模型,得到所述语音数据是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音数据,输出所述语音数据是否包含指定唤醒词的结果。
5.根据权利要求1所述的直播应用的数据处理方法,其特征在于,还包括:
将所述多媒体数据发送至第二客户端;所述第二客户端为与所述第一客户端处于同一直播间的客户端。
6.根据权利要求1所述的直播应用的数据处理方法,其特征在于,还包括:
向第二客户端发送任务数据包,所述任务数据包为对所述虚拟形象投递口粮的任务数据包;
在接收所述第二客户端根据所述任务数据包的领取指令后,接收所述第二客户端的任务完成数据;
根据所述任务完成数据,生成所述虚拟形象的宠物口粮数据,并根据所述宠物口粮数据更新所述虚拟形象的升级进度参数。
7.根据权利要求6所述的直播应用的数据处理方法,其特征在于,在根据所述任务完成数据,生成所述虚拟形象的宠物口粮数据,并根据所述宠物口粮数据更新所述虚拟形象的升级进度参数,之后,还包括:
在所述升级进度参数达到预设值时,更新所述虚拟形象的级别参数;
根据所述级别参数,更新所述虚拟形象对应的语音控制数据的数据库;
根据所述级别参数,生成所述虚拟形象的成长信息;
将所述虚拟形象的成长信息发送至所述虚拟形象对应的第一客户端和/或所述第二客户端。
8.一种直播应用的数据处理方法,其特征在于,应用于第一客户端,所述方法包括:
获取语音控制数据对应的虚拟形象的相应级别的多媒体数据;所述语音控制数据还包括控制虚拟形象动作的数据和针对直播应用的功能控制数据中的至少一种,所述多媒体数据包括所述虚拟形象的动画数据和针对所述直播应用的功能执行数据中的至少一种;
在直播间页面播放所述动画数据,和/或在直播间页面执行所述功能执行数据对应的功能;
其中,所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识;所述方法还包括:接收交友成功信息;根据所述交友成功信息,将所述结交宠物的信息添加至所述虚拟形象的好友列表,并生产交友特效,并在所述直播间页面显示所述交友特效。
9.根据权利要求8所述的直播应用的数据处理方法,其特征在于,所述语音控制数据包括用于控制所述虚拟形象的语音;
在获取语音控制数据对应的虚拟形象的相应级别的多媒体数据之前,包括:
响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令;
向服务器发送所述语音控制指令;
所述获取语音控制数据对应的虚拟形象的相应级别的多媒体数据,包括:
接收所述服务器发送的所述语音控制指令对应的虚拟形象的相应级别的多媒体数据。
10.根据权利要求8所述的直播应用的数据处理方法,其特征在于,所述语音控制数据包括对所述虚拟形象的控制语音;
在获取语音控制数据对应的虚拟形象的相应级别的多媒体数据步骤之前,包括:
响应于对虚拟形象互动的触发操作,向服务器发送包括对所述虚拟形象的控制语音的语音控制数据;
所述获取语音控制数据对应的虚拟形象的相应级别的多媒体数据步骤包括:
接收所述服务器发送的所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
11.根据权利要求9所述的直播应用的数据处理方法,其特征在于,还包括:
向服务器发送包括指定唤醒词的语音数据;
在接收到服务器发送的所述指定唤醒词正确的信息时,执行响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令的步骤。
12.根据权利要求9所述的直播应用的数据处理方法,其特征在于,还包括:
获取用户输入的语音;
根据所述语音进行初步识别,判断是否包括指定唤醒词;
在所述语音包括指定唤醒词时,执行向服务器发送包括指定唤醒词的语音数据的步骤。
13.根据权利要求9所述的直播应用的数据处理方法,其特征在于,还包括:
获取用户输入的语音;
将所述语音输入预设的唤醒词识别模型,得到所述语音是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音,输出所述语音是否包含指定唤醒词的结果;
在所述语音包含指定唤醒词时,执行响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令的步骤。
14.一种直播应用的数据处理装置,其特征在于,包括:
语音控制数据接收模块,被配置为执行接收第一客户端提供的语音控制数据;所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识;所述语音控制数据还包括控制虚拟形象动作的数据和针对直播应用的功能控制数据中的至少一种;
多媒体数据获取模块,被配置为执行根据所述语音控制数据,确定对应的虚拟形象和预设级别;在所述虚拟形象的级别参数达到所述预设级别时,获取所述语音控制数据对应的虚拟形象的相应级别的多媒体数据;所述多媒体数据包括所述虚拟形象的动画数据和针对所述直播应用的功能执行数据中的至少一种;每个所述语音控制数据与所述虚拟形象某一预设级别对应;
发送模块,被配置为执行将所述动画数据发送至所述第一客户端,所述动画数据用于控制所述虚拟形象进行动作;
所述发送模块,还被配置为执行将所述功能执行数据发送至所述第一客户端,所述功能执行数据用于通过所述虚拟形象控制所述第一客户端的直播应用的操作;
所述装置还包括宠物交友请求发送模块,被配置为执行在所述虚拟形象的级别参数达到所述预设级别时,将所述宠物交友请求发送至所述结交宠物标识对应的第一客户端;
交友确认信息接收模块,被配置为执行接收所述结交宠物标识对应的第一客户端的交友确认信息;
交友成功信息发送模块,被配置为执行根据所述交友确认信息,对所述当前宠物标识和结交宠物标识设置好友标识,并向所述当前宠物标识对应的第一客户端和所述结交宠物标识对应的第一客户端发送交友成功信息,所述交友成功信息触发所述第一客户端生成交友特效。
15.根据权利要求14所述的直播应用的数据处理装置,其特征在于,所述语音控制数据中包括对所述虚拟形象的控制语音;
所述语音控制数据接收模块包括:
控制数据接收单元,被置为执行接收第一客户端提供的包括对所述虚拟形象的控制语音的语音控制数据;
解析单元,被配置为执行对所述语音控制数据进行指令解析,获得语音控制指令。
16.根据权利要求14所述的直播应用的数据处理装置,其特征在于,还包括:
语音数据接收模块,被配置为执行接收所述第一客户端的包括指定唤醒词的语音数据;
识别模块,被配置为执行根据所述语音数据对所述第一客户端的指定唤醒词进行识别;
所述语音控制数据接收模块,还被配置为执行在识别到所述指定唤醒词后,接收第一客户端提供的语音控制数据。
17.根据权利要求16所述的直播应用的数据处理装置,其特征在于,所述识别模块,还被配置为执行将所述语音数据输入预设的唤醒词识别模型,得到所述语音数据是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音数据,输出所述语音数据是否包含指定唤醒词的结果。
18.根据权利要求14所述的直播应用的数据处理装置,其特征在于,所述发送模块,还被配置为执行将所述多媒体数据发送至第二客户端;所述第二客户端为与所述第一客户端处于同一直播间的客户端。
19.根据权利要求14所述的直播应用的数据处理装置,其特征在于,还包括:
任务数据包发送模块,被配置为执行向第二客户端发送任务数据包,所述任务数据包为对所述虚拟形象投递口粮的任务数据包;
任务完成数据接收模块,被配置为执行在接收所述第二客户端根据所述任务数据包的领取指令后,接收所述第二客户端的任务完成数据;
升级进度更新模块,被配置为执行根据所述任务完成数据,生成所述虚拟形象的宠物口粮数据,并根据所述宠物口粮数据更新所述虚拟形象的升级进度参数。
20.根据权利要求19所述的直播应用的数据处理装置,其特征在于,还包括:
级别参数更新模块,被配置为执行在所述升级进度参数达到预设值时,更新所述虚拟形象的级别参数;
数据库更新模块,被配置为执行根据所述级别参数,更新所述虚拟形象对应的语音控制数据的数据库;
成长信息生成模块,被配置为执行根据所述级别参数,生成所述虚拟形象的成长信息;
成长信息发送模块,被配置为执行将所述虚拟形象的成长信息发送至所述虚拟形象对应的第一客户端和/或所述第二客户端。
21.一种直播应用的数据处理装置,其特征在于,包括:
多媒体数据获取模块,被配置为执行获取语音控制数据对应的虚拟形象的相应级别的多媒体数据;所述语音控制数据包括宠物交友请求,所述宠物交友请求包括当前宠物标识和结交宠物标识;所述语音控制数据还包括控制虚拟形象动作的数据和针对直播应用的功能控制数据中的至少一种,所述多媒体数据包括所述虚拟形象的动画数据和针对所述直播应用的功能执行数据中的至少一种;
播放模块,被配置为执行在直播间页面播放所述动画数据,和/或在直播间页面执行所述功能执行数据对应的功能;
交友成功信息接收模块,被配置为执行接收交友成功信息;
交友特效显示模块,被配置为执行根据所述交友成功信息,将所述结交宠物的信息添加至所述虚拟形象的好友列表,并生成交友特效,并在所述直播间页面显示所述交友特效。
22.根据权利要求21所述的直播应用的数据处理装置,其特征在于,所述语音控制数据包括用于控制所述虚拟形象的语音;
所述装置还包括:
解析识别模块,被配置为执行响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令;
指令发送模块,被配置为执行向服务器发送所述语音控制指令;
所述多媒体数据获取模块,还被配置为执行接收所述服务器发送的所述语音控制指令对应的虚拟形象的相应级别的多媒体数据。
23.根据权利要求21所述的直播应用的数据处理装置,其特征在于,所述语音控制数据包括对所述虚拟形象的控制语音;
所述装置还包括:语音控制数据发送模块,被配置为执行响应于对虚拟形象互动的触发操作,向服务器发送包括对所述虚拟形象的控制语音的语音控制数据;
所述多媒体数据获取模块,还被配置为执行接收所述服务器发送的所述语音控制数据对应的虚拟形象的相应级别的多媒体数据。
24.根据权利要求22所述的直播应用的数据处理装置,其特征在于,还包括:
语音数据发送模块,被配置为执行向服务器发送包括指定唤醒词的语音数据;
所述解析识别模块,还被配置为执行在接收到服务器发送的所述指定唤醒词正确的信息时,响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令。
25.根据权利要求22所述的直播应用的数据处理装置,其特征在于,还包括:
语音输入模块,被配置为执行获取用户输入的语音;
初步识别模块,被配置为执行根据所述语音进行初步识别,判断是否包括指定唤醒词;
所述语音数据发送模块,还被配置为执行在所述语音包括指定唤醒词时,向服务器发送包括指定唤醒词的语音数据。
26.根据权利要求22所述的直播应用的数据处理装置,其特征在于,还包括:
语音输入模块,被配置为执行获取用户输入的语音;
唤醒词识别模块,被配置为执行将所述语音输入预设的唤醒词识别模型,得到所述语音是否包含指定唤醒词的结果;其中,预设的唤醒词识别模型通过预设类型的神经网络训练获取,用于根据输入的语音,输出所述语音是否包含指定唤醒词的结果;
所述解析识别模块,还被配置为执行在所述语音包含指定唤醒词时,响应于对虚拟形象互动的触发操作,对所述语音控制数据进行解析识别,得到语音控制指令。
27.一种电子设备,其特征在于,包括:
处理器;
用于存储所述处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述指令,以实现如权利要求1至7中任一项所述的直播应用的数据处理方法或如权利要求8至13中任一项所述的直播应用的数据处理方法。
28.一种存储介质,当所述存储介质中的指令由电子设备的处理器执行时,使得电子设备能够执行如权利要求1至7中任一项所述的直播应用的数据处理方法或如权利要求8至13中任一项所述的直播应用的数据处理方法。
CN202010116984.5A 2020-02-25 2020-02-25 直播应用的数据处理方法、装置、电子设备及存储介质 Active CN111343473B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN202010116984.5A CN111343473B (zh) 2020-02-25 2020-02-25 直播应用的数据处理方法、装置、电子设备及存储介质
EP20914765.1A EP4114009A1 (en) 2020-02-25 2020-11-19 Data processing method and apparatus of live broadcast application, electronic device and storage medium
PCT/CN2020/130186 WO2021169432A1 (zh) 2020-02-25 2020-11-19 直播应用的数据处理方法、装置、电子设备及存储介质
US17/388,852 US20220020373A1 (en) 2020-02-25 2021-07-29 METHODS FOR PROCESSING DATA OF LIVE STREAMING APPLICATION, and ELECTRONIC DEVICE

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010116984.5A CN111343473B (zh) 2020-02-25 2020-02-25 直播应用的数据处理方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111343473A CN111343473A (zh) 2020-06-26
CN111343473B true CN111343473B (zh) 2022-07-01

Family

ID=71187884

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010116984.5A Active CN111343473B (zh) 2020-02-25 2020-02-25 直播应用的数据处理方法、装置、电子设备及存储介质

Country Status (4)

Country Link
US (1) US20220020373A1 (zh)
EP (1) EP4114009A1 (zh)
CN (1) CN111343473B (zh)
WO (1) WO2021169432A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111343473B (zh) * 2020-02-25 2022-07-01 北京达佳互联信息技术有限公司 直播应用的数据处理方法、装置、电子设备及存储介质
CN113014854B (zh) * 2020-04-30 2022-11-11 北京字节跳动网络技术有限公司 互动记录的生成方法、装置、设备及介质
CN113766253A (zh) * 2021-01-04 2021-12-07 北京沃东天骏信息技术有限公司 基于虚拟主播的直播方法、装置、设备及存储介质
CN115580753A (zh) * 2021-06-21 2023-01-06 北京字跳网络技术有限公司 一种基于多媒体作品的交互方法、装置、设备及存储介质
CN113691829B (zh) * 2021-10-26 2022-04-08 阿里巴巴达摩院(杭州)科技有限公司 虚拟对象互动方法、装置、存储介质及计算机程序产品
CN114025186A (zh) * 2021-10-28 2022-02-08 广州方硅信息技术有限公司 直播间内的虚拟语音互动方法、装置及计算机设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657471A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 一种虚拟资源的展示方法、客户端及插件
CN108415552A (zh) * 2017-02-09 2018-08-17 南宁富桂精密工业有限公司 虚拟影院交互系统及方法
CN108648754A (zh) * 2018-04-26 2018-10-12 北京小米移动软件有限公司 语音控制方法及装置
CN110062267A (zh) * 2019-05-05 2019-07-26 广州虎牙信息科技有限公司 直播数据处理方法、装置、电子设备及可读存储介质

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11212934A (ja) * 1998-01-23 1999-08-06 Sony Corp 情報処理装置および方法、並びに提供媒体
JP2000317138A (ja) * 1999-05-13 2000-11-21 Konami Co Ltd ビデオゲーム装置、ビデオゲームのキャラクタ育成制御方法及びその育成プログラムを記録した可読記録媒体
US20070111795A1 (en) * 2005-11-15 2007-05-17 Joon-Hyuk Choi Virtual entity on a network
KR101789619B1 (ko) * 2010-11-22 2017-10-25 엘지전자 주식회사 멀티미디어 장치에서 음성과 제스쳐를 이용한 제어 방법 및 그에 따른 멀티미디어 장치
CN102750125A (zh) * 2011-04-19 2012-10-24 无锡天堂软件技术有限公司 基于语音的控制方法与控制系统
US8600417B1 (en) * 2011-10-10 2013-12-03 West Corporation Consumer care system
CN104239328A (zh) * 2013-06-18 2014-12-24 联想(北京)有限公司 多媒体处理方法及多媒体系统
US10354256B1 (en) * 2014-12-23 2019-07-16 Amazon Technologies, Inc. Avatar based customer service interface with human support agent
US20170078880A1 (en) * 2015-09-16 2017-03-16 CloudMondo, Inc. Cloud-based friend onboarding for wi-fi network communication authentication
CN105654354A (zh) * 2016-03-11 2016-06-08 武汉斗鱼网络科技有限公司 一种视频直播中的用户交互优化方法和系统
CN105959718A (zh) * 2016-06-24 2016-09-21 乐视控股(北京)有限公司 一种视频直播中实时互动的方法及装置
CN106375774B (zh) * 2016-08-31 2019-12-27 广州酷狗计算机科技有限公司 一种直播间显示内容控制的方法、装置和系统
CN106507207B (zh) * 2016-10-31 2019-07-05 北京小米移动软件有限公司 直播应用中互动的方法及装置
CN106878390B (zh) * 2017-01-09 2020-07-28 北京奇虎科技有限公司 电子宠物互动控制方法、装置及可穿戴设备
CN107423809B (zh) * 2017-07-07 2021-02-26 北京光年无限科技有限公司 应用于视频直播平台的虚拟机器人多模态交互方法和系统
US10680993B2 (en) * 2018-03-30 2020-06-09 Facebook, Inc. Sonic social network
US10930269B2 (en) * 2018-07-13 2021-02-23 Google Llc End-to-end streaming keyword spotting
CN109871238A (zh) * 2019-01-02 2019-06-11 百度在线网络技术(北京)有限公司 语音交互方法、装置和存储介质
CN110610699B (zh) * 2019-09-03 2023-03-24 北京达佳互联信息技术有限公司 语音信号处理方法、装置、终端、服务器及存储介质
CN110634483B (zh) * 2019-09-03 2021-06-18 北京达佳互联信息技术有限公司 人机交互方法、装置、电子设备及存储介质
US11704855B2 (en) * 2020-01-22 2023-07-18 Salesforce, Inc. Customizable animation experience
CN111343473B (zh) * 2020-02-25 2022-07-01 北京达佳互联信息技术有限公司 直播应用的数据处理方法、装置、电子设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107657471A (zh) * 2016-09-22 2018-02-02 腾讯科技(北京)有限公司 一种虚拟资源的展示方法、客户端及插件
CN108415552A (zh) * 2017-02-09 2018-08-17 南宁富桂精密工业有限公司 虚拟影院交互系统及方法
CN108648754A (zh) * 2018-04-26 2018-10-12 北京小米移动软件有限公司 语音控制方法及装置
CN110062267A (zh) * 2019-05-05 2019-07-26 广州虎牙信息科技有限公司 直播数据处理方法、装置、电子设备及可读存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
H5互动形式在新闻媒体中的运用分析——以建国70周年国庆案例分析;寇吉梅;《传播力研究》;20200128;第4卷(第03期);全文 *

Also Published As

Publication number Publication date
US20220020373A1 (en) 2022-01-20
WO2021169432A1 (zh) 2021-09-02
CN111343473A (zh) 2020-06-26
EP4114009A1 (en) 2023-01-04

Similar Documents

Publication Publication Date Title
CN111343473B (zh) 直播应用的数据处理方法、装置、电子设备及存储介质
CN110634483B (zh) 人机交互方法、装置、电子设备及存储介质
CN112218103B (zh) 直播间互动方法、装置、电子设备和存储介质
CN113382274B (zh) 数据处理方法、装置、电子设备及存储介质
CN106507207B (zh) 直播应用中互动的方法及装置
CN111107421B (zh) 视频处理方法、装置、终端设备及存储介质
CN111312240A (zh) 数据控制方法、装置、电子设备及存储介质
WO2016177287A1 (zh) 互动信息处理方法、客户端、服务平台和存储介质
CN109660873B (zh) 基于视频的交互方法、交互装置和计算机可读存储介质
CN110719530A (zh) 一种视频播放方法、装置、电子设备及存储介质
CN112732374A (zh) 一种页面展示方法、展示装置、电子设备及存储介质
CN119342239B (zh) 直播处理方法、装置、电子设备及存储介质
CN114911346A (zh) 一种终端设备的交互方法和装置
CN110139164A (zh) 一种语音评论播放方法、装置,终端设备及存储介质
CN112685599B (zh) 视频推荐方法及装置
CN114390304A (zh) 直播变声方法、装置、电子设备及存储介质
CN113259754B (zh) 视频生成方法、装置、电子设备及存储介质
CN114666643A (zh) 一种信息显示方法、装置、电子设备及存储介质
CN113347484A (zh) 评论推荐方法、装置及电子设备
CN109977303B (zh) 多媒体信息的交互方法、装置及存储介质
CN115086741B (zh) 直播互动方法、装置、系统、电子设备及存储介质
CN112565913B (zh) 视频通话方法、装置和电子设备
CN116437155A (zh) 一种直播互动方法、装置、计算机设备和存储介质
CN115022654A (zh) 一种直播场景下的视频编辑方法及装置
CN112672172B (zh) 一种音频替换系统、方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant