-
1
图片鉴伪模型如今利用人工智能生成模型已能产生以假乱真的媒体内容,这对个人隐私、社会秩序、国家安全造成了严重的不良影响。该项目拟分析AI生成图像的内在异常痕迹,研发可区分自然采集的真实图像和通过AI绘图生成的虚假图像的技术,为维护图像内容安全提供必要保障 -
2
声音克隆模型声音克隆技术可实现个性化语音生成,广泛应用于数字人、语音社交、内容播报、视频制作等场景。该项目以提高合成声音的自然度和真实感为目标,拟研发基于神经网络的声学模型,通过文本和语音驱动生成克隆音频,对声音的音色、语气、语速、情感等多维度进行模拟 -
3
数字人唇形驱动模型数字人在影视、传媒、金融、教育、零售等领域有着广阔的应用前景。数字人唇形驱动是实现数字人自然发声的关键。该项目拟结合语音理解、唇部动作生成、图形渲染等技术,研发高效逼真的数字人唇形驱动技术,实现人机可视化交互,满足用户真实感体验的需求 -
4
SDR转HDR算法模型随着高动态范围(HDR)终端设备的普及,将SDR源媒体转换为HDR能有效解决HDR内容短缺的问题,并能显著提升用户在HDR设备上的观看体验。该项目拟研发SDR转HDR的逆色调映射技术,优化媒体可视细节,提升色彩对比度,为图像视频的画质增强提供有力支撑