顯示具有 人工智慧應用 標籤的文章。 顯示所有文章
顯示具有 人工智慧應用 標籤的文章。 顯示所有文章

2021年12月26日 星期日

想要人工智慧畫出你心目中的美景?給它文字吧!

 人工智慧替你畫出美景,只要寥寥幾句就可以做到!

有人工智慧替你畫出美景,只要寥寥幾句就可以做到!



 

繪圖用人工智慧發展到「你說我畫」的境界!透過 NVIDIA 在上個月發表的最新版 GauGAN2(點此繪圖),你只要key「海灘的日落」 (sunset at a beach) 等短句,人工智慧就可以自動生成精細的日落海灘圖像!如果你覺得還不夠,沒關係!你還可以進一步加入更精確的敘述句如「沿岸的日落」 (sunset at a rocky beach),或是將「夕陽」換成「下午」、「雨天」等字詞,都能讓 GauGAN2 立即調整生成圖像。

過去 NVIDIA 在 2019 年 GPU 技術大會(GTC)上,首次發表了人工智慧繪圖工具——「GauGAN」的第一代,能透過簡單的手繪草圖自動生成栩栩如生的風景圖;現在又持續更新為第二代的 GauGAN2,加入了能以簡單的描述字句,即可自動建立人工智慧圖像的功能、且精細度更符合使用者所需結果:如自動形成使用者所構想海灘形式,夕陽呈現的位置等。

依據 NVIDIA 官方說明,GauGAN2 採用分割映射(segmentation mapping)、圖像修復以及文字轉圖像生成功能,能依據文字敘述或手繪生成高品質的精細圖像之外;也是第一個在單一對抗生成網路(Generative Adversarial Network,GAN)運算中,加入文字語意識別,讓藝術創作者能以更簡單的方式,指引人工智慧快速生成圖像。

使用者不需畫出心中場景的每個元素,只需輸入短句,人工智慧技術就能依照短語,快速生成關鍵特徵和主題:如被白雪覆蓋的山脈;接著,使用者特於特定的山上草草點個幾筆,讓那座山更高;最後還可在前方加入幾棵樹、或天空增加幾朵雲來點綴整副畫作。簡單幾個動作,藝術家就能描繪出栩栩如生的美景圖、或是超現實的蒸氣龐克風格繪畫。

NVIDIA 強調,GauGAN2 背後運算則採用了 NVIDIA Selene 超級電腦運算系統,已經使用 1 千萬張高品質風景圖片訓練 GauGAN2 人工智慧模型,並讓系統能將描述字詞與風景圖像建立關連,以能快速對應到使用者輸入字詞後產生相應圖像。

透過人工智能,GauGAN2 讓藝術家們的作畫工具變得更強大多元、且作畫速度變得更有效率、更開啟了NVIDIA藝術創作的無限可能性。

GauGAN2 傳送門在此,點我來作畫吧!使用教學如以下影片所示:

 
相關文章:
母逝遺憾…PTT之父打造人工智慧 即時預測敗血症即刻救命
FDA批准內視鏡AI 測腸癌靈敏度99.7%!人工智慧醫療再突破
AI 知我心!能夠判別憂鬱症的人工智慧
人工智慧幫你診斷皮膚疾病!Google AI鏡頭變身皮膚科幫手
Google地圖結合人工智慧推出的新功能!讓你省油錢又省時!
人工智慧讓你不懂代碼也能成為寫程式達人!(上)
這個人工智慧成為首位非人類的專利發明者(上)
 

2021年12月5日 星期日

連編舞都難不倒人工智慧!讓它為你編舞吧!(下)

 人工智慧又有新技能了!這回的新身分是專業編舞家!讓它為你編舞吧!

人工智慧又有新技能了!這回的新身分是專業編舞家!讓它為你編舞吧!


本文為下篇,上篇請看此連結

 

與其他人工智慧應用相比:FACT編舞能力一流

把FACT 的功能,對每個指示性指標,與其他的人工智慧應用進行比較:

如上表所示,FACT 與三種最先進的編舞人工智慧應用(Li et alDancenetDance Revolution)相比,FACT 模型生成的動作更逼真,與輸入音樂的相關性更好,並且在以不同的音樂為條件時更多樣化。*注意的是 Li et al生成的運動是不連續的,使得平均運動特徵距離異常高。

Google 還透過使用者研究,評估音樂與動作的相關性:讓每位使用者觀看 10 個影片,片中有一個 FACT 模型與一個隨機對照模型所生成的編舞結果然後讓使用者選擇哪個模型生成的舞步比較能夠與音樂同步。使用者共有 30 名,包含專業舞者以及很少跳舞的人。

結果顯示:81% 的使用者喜歡 FACT 模型生成的結果勝於 「Li et al.」的;跟 Dancenet 相比,71% 的人喜歡 FACT 勝過 Dancenet;跟 Dance Revolution 比較, 77% 的人也更喜歡 FACT。。有趣的是,75% 的參與者喜歡 AIST++ 未配對的舞蹈動作勝於透過 FACT 所生成的。這並不奇怪,因為最初的舞蹈紀錄具有很強的表現力。

定性結果

如下圖所示,與先前 DanceNet(左)與 Li et. al.(中)相較之下,使用 FACT 模型(右)生成的 3D 舞蹈更逼真,並且與音樂的相關性更好。



使用 FACT 人工智慧模型生成更多 3D 舞蹈:









人工智慧發展下一步:為每首歌生成逼真舞蹈

Google開發了一個人工智慧模型,可以學習音頻與動作對應的關係,還可以基於音樂,生成的高質量 3D 動作序列。由於從音樂生成 3D 動作是一個新興的研究領域,Google 希望此項研究成果能為未來跨模組「音頻-3D 動作」的生成鋪道。

透過這項研究,Google 還發布了迄今為止最大的 3D 人類舞蹈資料庫「AIST++」——具有多視角、多種舞蹈形式、跨模態的 3D 動作數據集,不僅對 3D 動作生成研究有幫助,一般來說,也對人類理解研究幫助。Google 將在 GitHub 中發布代碼,並在此處發布經過訓練的模型。

雖然此項結果給了這個「基於音樂來生成 3D 動作」的議題一個有希望的方向,但還有更多的東西需要探索:像是Google 所使用的方法是基於運動學的、並沒有將舞者和地板間的身體互動考慮進去。因此,若進行全局平移的話,會導致如腳滑動和浮動的假影。因此,接下來的方向是要探索如何為每首音樂來生成多個逼真的舞蹈。

 

相關文章:

油價漲免驚!Google Maps 用人工智慧規劃「最省油路線」

人類又輸了?工程師需花數月設計出IC晶片,AI六小時就搞定!

人工智慧幫你診斷皮膚疾病!Google AI鏡頭變身皮膚科幫手

生物學最大謎團被人工智慧 破解!DeepMind 攻克「蛋白質折疊」奧秘

人工智慧讓你不懂代碼也能成為寫程式達人!(上)

以色列靠AI人工智慧將軍事戰力再升級!(上)

人工智慧GPT-3成為超強寫手勝過人類(上)

 

2021年11月29日 星期一

連編舞都難不倒人工智慧!讓它為你編舞吧!(中)

人工智慧又有新技能了!這回的新身分是專業編舞家!讓它為你編舞吧!

人工智慧又有新技能了!這回的新身分是專業編舞家!讓它為你編舞吧!


上篇請看此連結

 

人工智慧編舞一把罩:FACT 模型

Google 運用上述的 AIST 資料庫,培訓 FACT 模型由音樂生成 3D 舞蹈。這個模型先用動作轉換器和音頻轉換器,分別對一段音樂和一個短的(2 秒)種子動作(seed motion)進行編碼。之後再將嵌入碼連接、發送到跨模型轉換器,該轉換器學習兩種模型之間的對應關係,並生成 N 個未來的動作序列。

然後使用這些序列以自我監督的方式訓練模型。在測試時,Google 將此模型用於自回歸框架,其中所預測的動作則作為下一個生成步驟的輸入。因此,FACT 模型能夠一個框架接著一個框架地,生成長時間的舞蹈動作。

 

FACT 網絡接收音樂片段 (Y) 和 2 秒的種子運動序列 (X),然後生成與輸入音樂相關的長期未來動作。|圖片出處:Google AI Blog

Google 用三指標評估 FACT 的性能

Google 依據以下所述之三個指標,評估人工智慧 FACT 的性能:

動作品質:我們計算 AIST++ 資料庫中的「真實舞蹈動作序列」與 40 個「模型生成的動作序列」之間的 Frechet 起始距離(FID),每個序列具有 1200 幀鏡頭(20 秒)。我們將基於幾何和動力學特徵的 FID 分別表示為 FIDg 和 FIDk

生成多樣性:之前的工作(指深度慣性姿勢捕捉」:從少許的慣性量測中學習而重建人體姿勢)類似:Google 從 AIST++ 測試集中的 40 個「模型生成動作特徵空間」中,計算平均歐氏距離,用以評估模型生成各式舞蹈動作的能力。,接著再比較幾何特徵空間 (Dist g ) 和動力學特徵空間 (Dist k )。

Google 使用不同的音樂,來生成四個不同的編舞版本:Break、Ballet Jazz、Krump 和 Middle Hip-hop(右),但有兩秒是相同的 Hip-hop 舞蹈動作(左),這些相同的動作被稱為「種子動作」。|圖片出處:Google AI Blog

運動-音樂相關:由於沒有合適的指標來衡量輸入音樂(音樂節拍)與所生成的 3D 動作(動作節拍)之間的相關性。所以 Google 提出了一種新的「節拍對齊分數 (BeatAlign)」作為指標。

上圖中顯示 FACT 所生成的舞蹈動作的動作速率(藍色曲線)、動作節拍(綠色虛線),及音樂節拍(橙色虛線)。通過從動作速率曲線中找到局部最小值,來提升動作節拍。|圖片出處:Google AI Blog

 

下篇請看此連結

 

相關文章:

油價漲免驚!Google Maps 用人工智慧規劃「最省油路線」

人類又輸了?工程師需花數月設計出IC晶片,AI六小時就搞定!

人工智慧幫你診斷皮膚疾病!Google AI鏡頭變身皮膚科幫手

生物學最大謎團被人工智慧 破解!DeepMind 攻克「蛋白質折疊」奧秘

人工智慧讓你不懂代碼也能成為寫程式達人!(上)

以色列靠AI人工智慧將軍事戰力再升級!(上)

人工智慧GPT-3成為超強寫手勝過人類(上)

 

 

2021年11月28日 星期日

連編舞都難不倒人工智慧!讓它為你編舞吧!(上)

 人工智慧又有新技能了!這回的新身分是專業編舞家!讓它為你編舞吧!

人工智慧又有新技能了!這回的新身分是專業編舞家!讓它為你編舞吧!


人工智慧學編舞,動作搭配音樂複雜度高

Google正在進行一種人工智慧研究,開發稱它為「FACT (Full-Attention Cross-modal Transformer)」的模型,它會模仿、理解舞蹈動作,而且可以提升個人的編舞才能。Google 研究團隊為了訓練該模型,也隨之發布一個大規模、多模態的 3D 舞蹈動作資料庫「AIST++」,包含長達 5.2 小時的 1408 個 3D 舞蹈動作序列,涵蓋 10 種舞蹈類型。都包含了已知相機位置的多視角影片,可生成逼真流暢的 3D 舞蹈動作。

Google 提到:雖然隨著音樂節拍編排出動作,是人類的本能;然而舞蹈是「需要練習」的藝術形式。專業的舞者都需要經過大量的、包含各式各樣舞步的曲目來訓練,才有編舞能力。這樣的訓練,對人類來說已不容易;對 ML(Maching Learning,機器學習)來說更是難上加難。因為要使用人工智慧來實現編舞,需要生成動力複雜度高的連續動作,同時還要捕捉動作與配樂間的非線性關係。

人工智慧如何學舞?Google修正AIST舞蹈資料庫成教材

Google 從現有的 AIST 舞蹈影片資料庫(一組帶有音樂伴奏的舞蹈影片,但無任何 3D 信息)生成 3D 動作資料庫。AIST 包含 10 種舞蹈類型:Old School(地板舞 Breaking、機械舞 Popping、鎖舞 Locking 和 Waack)以及 New School(Middle Hip-Hop、LA-style Hip-Hop、House、Krump、Street Jazz 和 Ballet Jazz),雖然包含了許多舞者的多視角影片,但鏡頭都沒有經過校準。 Google 依研究人員的需求,根據常用的 SMPL 3D模型參數,修復 AIST 影片的拍攝校準正後的數值和 3D 人體動作,重建為「AIST++ 數位資料庫」,包含與音樂搭配的各種 3D 動作,並將上述十種舞蹈均勻地呈現在動作中、以每分鐘節拍 (BPM) 為單位涵蓋各種音樂節奏。每種舞蹈類型都含 85% 的基本動作和 15% 的進階動作(舞者自由設計的更長編舞)。

未經修正的 AIST 舞蹈影片資料庫如下所示:

Google 依研究人員的需求,根據常用的 SMPL 3D 模型參數,修復 AIST 影片的拍攝校準正後的數值,以及 3D 人體動作,重建為「AIST++」數位資料庫。重建後的「AIST++」包含與音樂搭配的各種 3D 動作,並將上述十種舞蹈均勻地呈現在動作中、以每分鐘節拍 (BPM) 為單位涵蓋各種音樂節奏。每種舞蹈類型都含 85% 的基本動作和 15% 的進階動作(舞者自由設計的更長編舞)。

AIST++ 數位資料庫還包括多視角同步圖片資訊,以便於應用在其他研究(如 2D/3D人體姿勢評估)。就我們所知,含有 1408 個序列、30 個主題和 10 個舞蹈流派的 AIST++ 是當前最大的 3D 人類舞蹈資料庫。

Google 使用 SMPL 3D 模型參數,將 AIST 舞蹈影片資料庫(上圖左)重建為具有 3D 動作的「AIST++」數位資料庫(上圖右)

AIST 資料庫原作為教學使用,記錄了多個真人舞者以相同的編舞搭配不同配樂的舞蹈影片——這是舞蹈中的常見作法。由於模型需要學習音樂和動作間的一對多布局,因此在跨模型序列到序列生成(cross-modal sequence-to-sequence generation)中,斷定是獨一無二的挑戰!Google 在 AIST++ 上仔細構建了非重疊訓練(non-overlapping train)和測試子集,以確保在子集間既不共享編舞、也不共享音樂。

 

下篇請看此連結

 

相關文章:

油價漲免驚!Google Maps 用人工智慧規劃「最省油路線」

人類又輸了?工程師需花數月設計出IC晶片,AI六小時就搞定!

人工智慧幫你診斷皮膚疾病!Google AI鏡頭變身皮膚科幫手

生物學最大謎團被人工智慧 破解!DeepMind 攻克「蛋白質折疊」奧秘

人工智慧讓你不懂代碼也能成為寫程式達人!(上)

以色列靠AI人工智慧將軍事戰力再升級!(上)

人工智慧GPT-3成為超強寫手勝過人類(上)

 

2021年5月18日 星期二

人工智慧虛擬電廠,電能管理新趨勢!

 人工智慧虛擬電廠將能拯救脫離停電.跳電之苦!?

人工智慧虛擬電廠將能拯救脫離停電.跳電之苦!?

 

人工智慧」可以拯救停電?日前因為電網故障造成「513 大停電」,讓使用電力、電網管理等議題受到關注,要怎麼進行能源管理?也成為大家討論的焦點。

而這個問題,桃園龜山區文欣國小的師生選擇交給人工智慧來解決!

日前文欣國小與能源物聯網公司「NextDrive」(聯齊科技)於記者會宣佈,雙方攜手打造的台灣第一所「校園虛擬電廠」將正式上線。NextDrive 表示,本次是受到桃園市綠能辦公室與資科局的邀請,以「虛擬電廠」為概念,為文欣國小打造出校園能源管理系統。

系統為 AI 人工智慧所驅動,除了能幫助學校輕鬆掌控用電軌跡、真實用電需求等資料,能更進一步改善用電行為。比起不斷加強發電量能,這種從用電端改善的智慧方案,更能讓校園保持穩定供電。

能源物聯網結合人工智慧 打造智慧能源系統

NextDrive 創立於 2013 年,是一家專注於能源物聯網(Internet of Energy,IoE)服務的公司,提供軟、硬體整合及雲端服務,並透過通訊技術串接,使模組化的平台架構能深入用電裝置,匯流各式能源。

NextDrive 試圖透過 AI 人工智慧技術、物聯網技術與能源技術的整合,以創造「智慧能源社區」為目標,整合個別家庭及社區內的用電、產電、儲電資料,透過大數據分析,並最大化電力使用效率,達到「善用每一度電」的效果。

而這次為文欣國小建置的校園能源管理系統,即是以此目標而打造。

這套校園能源管理系統包含一套 AI 人工智慧能源管理系統、太陽能板及蓄電池。人工智慧能即時監控全校園的用電狀況,並進行預測,若預測到用電量即將超標,則會自動調控如冷氣等高功率電器,並將太陽能板及蓄電池中蓄積的電能用來供電,以壓低用電量,避免超出與台電簽訂的契約電容量。

但 AI 也不是強硬的關閉冷氣,而是會針對環境舒適程度進行微調,教室內裝有溫濕度感測器、紅外線遙控器,人工智慧會以此判斷是否關閉冷氣。

NextDrive 創辦人兼執行長顏哲淵表示,以前如果學校的契約容量快到了,頂多只能發個簡訊給總務主任,再由人力一一去關冷氣等高功率電器。

但這次推出的校園 AI 能源管理系統,整合校園過往用電數據,電腦分析用電、產電、蓄電的資料,提供即時用電監控,每 30 分鐘預測校園的用電變化。當預測校園整體用電即將超標,會自動根據用電規模調控冷氣,或規劃蓄電池放電。

AI「虛擬電廠」 最多可降低 30% 的用電量

經過實測後,這套人工智慧系統在用電高峰時,可以協助校園降低約 30% 用電量。

而隨著用電數據量持續滾動收集,AI 預測將會更精準,為校園量身打造最合適的契約容量方案,同時讓校園在突發狀況時,仍可透過蓄電池穩定供電。

而目前文欣國小校內有總容量約 40kW 的太陽能板,可自給自足、供給校園將近 1/3 的用電,不僅節省學校電費支出,「自發自用」的模式也讓電力無需跋山涉水,從發電起點便節省下約 1~3% 的電力線損,提高能源效率,甚至有機會在未來於寒暑假期間,將多餘的電能投入用電交易市場。

更便宜更環保 人工智慧成電能管理新解方

以往習慣透過調整發電量來達到供需穩定,現在藉由 AI 系統的儲能管理,也可以有效控制需求端的用電量。

未來若有越來越多的校園加入,使用這套系統,便可透過電網雲平台架構,共同管理區域間電力供應與用電需求,增加區域電網間的可調度能力。

透過人工智慧,在不壓迫到真實用電需求的同時,發展出「自發自用」與實時調控的用電模式,亦能兼顧到綠電使用效率,讓永續環保不再是困難、昂貴的選擇。

 

相關文章:

Google 為保護隱私,棄 Cookie 卻改用人工智慧?

Google放寬Search Console網站核心指標的標準!SEO會更好做嗎?

年過 50 歲的日本副社長自學 Python!寫出的 AI 還被雀巢採用

AI 一對一客服、電話行銷一把罩!人工智慧語音機器人夯

Google全新搜尋功能竟讓SEO更複雜了!?

AI人工智慧導盲犬問世!將有助全球的視障者!

網站核心指標將影響SEO排名!(上)

2021年5月17日 星期一

首支人工智慧KPOP女團誕生啦!

人工智慧打造完美女團?螢幕前的各位你吃這一套嗎?

用人工智慧打造完美女團?螢幕前的各位你吃這一套嗎?


  

人工智慧 AI 新聞主播、人工智慧 AI YouTuber 之後,大家對人工智慧模擬、生成的「虛擬人物」接受度越來越高,儼然成為一股新潮流。

而日前,一家南韓科技公司「Pulse9」更是瞄準了 KPOP 現今在世界上的熱門程度,將AI 與韓流偶像結合,推出全員都是人工智慧的 AI 女團,模擬出真人動作、聲音,還能如真的偶像一般發行單曲、拍攝 MV!

結合所有女藝人的美麗 首支人工智慧KPOP女團誕生

Pulse9 為一間研究人工智慧、深度學習技術的韓國公司,從 2020 年就已開始為 AI 偶像鋪路、宣傳。

他們利用公司旗下的 DeepFake 技術「Deep Real AI」,透過演算大量女藝人的臉龐,擷取將所有最動人、美麗的特徵後重新合成,創造出 101 名虛擬「AI 偶像練習生」。這些虛擬的練習生們長相各有特色,每個人也都具有不同的風格,乍看之下就跟真人沒兩樣。

隨後,公司參考了韓國知名選秀節目《PRODUCE 101》的選拔形式,舉辦名為「AI.DOL 心動挑戰」的投票比賽,讓由網友根據照片,選出前 11 名能夠正式「出道」組團的人工智慧女偶像。

全員AI!KPOP女團首支MV「我是真的」 網友:可怕

而投票活動結束後,公司也依言先讓脫穎而出者 11 名中的 5 名 AI 成員組團,團名為「Eternity」(이터니티),中文為「永恆」之意。

到此時,網友都還對這些人工智慧偶像抱有很高地期待──直到他們於 YouTube 上發表影片。

2021 年 3 月,Eternity 發表了出道曲《I’m Real》(我是真的),也推出了單曲 MV。在影片中,雖然這些 AI 偶像們賣力地唱歌跳舞,但表情、姿態與眼神都顯得十分不自然,並且合成的痕跡也十分明顯;而團員們的歌聲也帶有明顯的機械音,令許多網友感到驚訝。

 
이터니티 Eternity – I’m Real M/V

 

在影片下方,有一則留言獲得了 7500 個讚:「抱歉,這是我在 KPOP 中看過最可怕的東西。並不是討厭,但這真的太讓人毛骨悚然了。」或許這也是大多數網友的心聲。

不過也有網友認為,韓國演藝圈競爭激烈,每個月都有與多偶像團體出道,像 Pulse9 這樣一家科技公司,願意跳出來嘗試新東西,也是一件好事。

即使初試啼聲並沒有博得普遍好評,Pulse9 依然打算繼續經營這個 AI 女子團體,未來會不但預計讓 Eternity 成員繼續活動,還會讓每個成員發行個人單曲。

除此之外,也會讓這些 AI 偶像們朝多元的方向發展,如模特兒、YouTuber 或品牌代言人等等。例如成員之一的咸初瓏(함초롱),已經於韓國一家金融控股公司「新韓金融投資」(Shinhan Investment Corp.)的廣告中擔綱演出了。

人工智慧真能幫助我們用更低成本 打造超完美藝人?

Pulse9 表示,公司研發的 Deep Real AI 技術,雖是以 Deepfake 技術為基礎,但能夠打造出更貼近真人、更生動的虛擬人物,而且製作時間更短、成本也更低。Pulse9 表示:「這種 AI 技術能創造出如她們(指Eternity)真實存在的逼真人物。」

而以人工智慧打造出來的女團成員們,不只是外貌、聲音,從眼神細微的變化到嘴角上揚的角度都能控制,一顰一笑、一舉一動都在掌握中──這或許是許多娛樂經紀公司都希望做到的。

也許在未來,等相關技術都成熟後,真的能看到由 AI 生成的虛擬偶像在演藝圈大放異彩。

 

相關文章:

Google 為保護隱私,棄 Cookie 卻改用人工智慧?

Google放寬Search Console網站核心指標的標準!SEO會更好做嗎?

年過 50 歲的日本副社長自學 Python!寫出的 AI 還被雀巢採用

AI 一對一客服、電話行銷一把罩!人工智慧語音機器人夯

Google全新搜尋功能竟讓SEO更複雜了!?

AI人工智慧導盲犬問世!將有助全球的視障者!

網站核心指標將影響SEO排名!(上)