五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

歡迎光臨散文網(wǎng) 會(huì)員登陸 & 注冊(cè)

【技術(shù)分享】AI數(shù)字人實(shí)時(shí)互動(dòng)直播技術(shù):數(shù)字人口型驅(qū)動(dòng)(算法篇)

2023-05-18 19:46 作者:Siyuejiang  | 我要投稿

數(shù)字人口型驅(qū)動(dòng)

FACS根據(jù)面部肌肉群對(duì)面部動(dòng)作編碼

51個(gè)通道


音頻特征:MFCC、基于深度學(xué)習(xí)的表征方法etc,選擇deepspeech,音頻-文本工具/音頻抽取特征,音頻轉(zhuǎn)成音頻圖


面部口型驅(qū)動(dòng):音頻特征提取——切分音頻特征(階梯過(guò)濾器)——縮放后到vit——加一層MLP——加一層position embedding

用到19個(gè)通道

階梯過(guò)濾器;attention機(jī)制(關(guān)注靠后音頻);loss function





【技術(shù)分享】AI數(shù)字人實(shí)時(shí)互動(dòng)直播技術(shù):數(shù)字人口型驅(qū)動(dòng)(算法篇)的評(píng)論 (共 條)

分享到微博請(qǐng)遵守國(guó)家法律
阜新市| 浙江省| 屏山县| 安国市| 云林县| 鲁山县| 那曲县| 东兴市| 台前县| 嵊州市| 保定市| 岳阳县| 盖州市| 新密市| 额济纳旗| 富平县| 治县。| 嘉荫县| 岚皋县| 汉川市| 秦皇岛市| 德化县| 日喀则市| 平和县| 北宁市| 海盐县| 井冈山市| 延长县| 浙江省| 霍山县| 千阳县| 常山县| 南宁市| 民丰县| 桦甸市| 余干县| 化州市| 商南县| 武安市| 乌拉特前旗| 武平县|