如今利用人工智能生成模型已能产生以假乱真的媒体内容,这对个人隐私、社会秩序、国家安全造成了严重的不良影响。该项目拟分析AI生成图像的内在异常痕迹,研发可区分自然采集的真实图像和通过AI绘图生成的虚假图像的技术,为维护图像内容安全提供必要保障
声音克隆技术可实现个性化语音生成,广泛应用于数字人、语音社交、内容播报、视频制作等场景。该项目以提高合成声音的自然度和真实感为目标,拟研发基于神经网络的声学模型,通过文本和语音驱动生成克隆音频,对声音的音色、语气、语速、情感等多维度进行模拟
数字人在影视、传媒、金融、教育、零售等领域有着广阔的应用前景。数字人唇形驱动是实现数字人自然发声的关键。该项目拟结合语音理解、唇部动作生成、图形渲染等技术,研发高效逼真的数字人唇形驱动技术,实现人机可视化交互,满足用户真实感体验的需求
随着高动态范围(HDR)终端设备的普及,将SDR源媒体转换为HDR能有效解决HDR内容短缺的问题,并能显著提升用户在HDR设备上的观看体验。该项目拟研发SDR转HDR的逆色调映射技术,优化媒体可视细节,提升色彩对比度,为图像视频的画质增强提供有力支撑
联系电话:0755-86716669
联系地址:深圳市南山区深圳大学南区致信楼N801