2023世界人工智能大會(huì)|一分鐘擁有專屬名畫 AI主播有了新技能?
你心里的春天是愉悅的、悲傷的、平靜的還是激動(dòng)的?如果在5秒內(nèi)就能擁有一幅塞尚的專屬畫作,你會(huì)選擇哪個(gè)選項(xiàng)?
7月6日,在2023世界人工智能大會(huì)上,上游新聞?dòng)浾呖吹剑珹I技術(shù)生成的藝術(shù)海報(bào)、虛擬形象體驗(yàn)成了展會(huì)上最熱鬧的區(qū)域。
▲AI技術(shù)生成的蝴蝶畫作。攝影/上游新聞?dòng)浾?時(shí)婷婷
點(diǎn)開小程序,選擇自己喜歡的季節(jié)、心情以及對(duì)塞尚畫風(fēng)的理解,就能生成一幅專屬的塞尚繪畫作品。這是京東云推出的人工智能文創(chuàng)體驗(yàn)功能。工作人員介紹,一分鐘內(nèi)畫出一幅“塞尚名畫”的背后,是京東云AIGC能力的技術(shù)支持,基于京東云視覺內(nèi)容生成大模型,經(jīng)過大量訓(xùn)練與優(yōu)化,能夠自動(dòng)學(xué)習(xí)并識(shí)別各類場(chǎng)景與數(shù)據(jù),生成指定畫風(fēng)和內(nèi)容的高質(zhì)量畫作。目前,京東云正在將視覺內(nèi)容生成大模型技術(shù)與產(chǎn)業(yè)融合,并嘗試在零售、健康、營(yíng)銷等場(chǎng)景落地。
在商湯科技展區(qū),上游新聞?dòng)浾唧w驗(yàn)了輸入關(guān)鍵詞生產(chǎn)不同海報(bào)的“秒畫”程序。在系統(tǒng)里輸入“中國(guó)風(fēng)寫實(shí)庭院”等關(guān)鍵字,系統(tǒng)在幾秒鐘時(shí)間內(nèi)就生成了不同風(fēng)格的海報(bào),根據(jù)需要,還可以加入所需要的素材和元素,就算是沒有繪畫基礎(chǔ)也能擁有一幅堪比專業(yè)設(shè)計(jì)的海報(bào),且生動(dòng)形象。
▲使用AI技術(shù),1分鐘就能擁有名畫。攝影/上游新聞?dòng)浾?時(shí)婷婷
上游新聞?dòng)浾吡私獾?,商湯“秒畫SenseMirage”是一個(gè)包含商湯自研AIGC大模型和便捷的LoRA訓(xùn)練能力,并提供第三方社區(qū)開源模型加速推理的創(chuàng)作平臺(tái),為創(chuàng)作者提供更加便利、完善的內(nèi)容生產(chǎn)創(chuàng)作工具。模型內(nèi)使用了flash attention的算子優(yōu)化技術(shù),作圖速度提升3倍。其自研生成大模型參數(shù)已提升至70億量級(jí),能帶來更強(qiáng)圖片生成效果,實(shí)現(xiàn)專業(yè)攝影級(jí)細(xì)節(jié)刻畫,使所生成圖片具備超強(qiáng)質(zhì)感和精細(xì)度。
站在展臺(tái)前,秒變卡通形象,根據(jù)自己的形象還能生成AI視頻主播,而且虛擬主播還能實(shí)現(xiàn)拍照、錄視頻、直播互動(dòng)、24*7在線,這樣神奇的操作又是如何實(shí)現(xiàn)的?
▲站在鏡子前就能生成卡通形象。攝影/上游新聞?dòng)浾?時(shí)婷婷
商湯科技工作人員介紹,虛擬形象依托的“如影”平臺(tái)僅需一段2-5分鐘手機(jī)拍攝的真人視頻素材,就能生成動(dòng)作、表情、口型,甚至發(fā)絲都能如真人一般自然的逼真復(fù)刻,且多語種精通的數(shù)字分身,其中真人相似度高達(dá)90%~95%,口型匹配度可達(dá)95%。平臺(tái)還打通了從文生文、文生視頻的整個(gè)流程,通過文字驅(qū)動(dòng),即可自由無門檻地開展各類視頻內(nèi)容制作,同時(shí),平臺(tái)還提供了豐富的在線編輯能力,包括模板、美顏濾鏡、音樂、背景和前景等,可創(chuàng)造出不同的作品。
此外,隨著綜合性能的提升,虛擬人在英語、日語、西班牙語、阿拉伯語等多語種的精準(zhǔn)度提升30%以上,讓數(shù)字人的語音和口型匹配度更流暢自然;還能實(shí)現(xiàn)電影級(jí)4K高清視頻輸出效果。不僅如此,在新的版本中,用戶還能通過輸入提示詞自動(dòng)生成與描述匹配的專屬數(shù)字人形象,實(shí)現(xiàn)數(shù)字人歌唱功能,便捷打造虛擬藝人<愛尬聊_尬聊百科>和網(wǎng)紅,或通過大模型生成短劇腳本,生成數(shù)字人短片。
上游新聞?dòng)浾?時(shí)婷婷