2021年6月28日 星期一

AI人工智慧讓視訊會議體驗更完美!(下)

 AI 人工智慧視訊會議體驗再升級!讓你視訊開會隨時都是好狀態!

AI人工智慧讓視訊會議體驗再升級!讓你視訊開會隨時都是好狀態!

 

本文為該系列的下篇,上篇(Maxine 是如何運作,讓視訊頻寬消耗減少至原本的十分之一)請點此連結

 

眼神接觸、臉部對齊……人工智慧提升視訊會議的體驗

臉部眼神校正功能:模擬面對面開會

Maxine 運用了 NVIDIA 在生成對抗網路 (GAN) 的優勢,讓視訊會議服務供應商可以幫使用者提供各種 AI 人工智慧功能,讓用戶有真實「面對面」的感受。

例如:「臉部對齊」功能可自動調整臉部角度,讓用戶在參與會議的過程中,看起來像是彼此相對、「眼神校正」能模擬眼神接觸、校正會議參與者的視線。這些功能能幫助與會者保持互動,無需一直盯著攝影機。

替身與虛擬背景:人再邋遢、家中再亂都能體面開會!

除此之外,視訊會議服務的供應商也能增加替身功能,讓用戶選擇自己的動畫當替身,能即時地透過用戶的聲音、情緒音調,自動生成逼真的動畫。

除了替身功能,Nvidia 也在今年六月 CVPR 大會,發表 Maxine 平台最新的「Vid2Vid Cameo」的深度學習模型:採用生成對抗網絡(GAN)的技術,只需將一個人的 2D 照片合成至談話影像中,就能輕易地打造數位虛擬化身、節省視訊頻寬,並能夠進行人臉辨識等強大功能。如此一來,就算鏡頭另一端的用戶衣衫不整、頭髮凌亂也不怕了!只要你在會議前拿出一張自己穿正式衣服的照片,就能讓穿著得體的自己當成替身參與視訊會議喔!

假如家中小孩太吵、或是燈光太暗的話,也不用怕!Maxine 的人工智慧技術可以移除背景噪音、並且提供超高解析度的畫面,也提升光線較暗時的清晰度,甚至為臉重新打光!


若上述的都不行的話,你也可以乾脆直接更換成虛擬背景!

Jarvis 對話式 AI:即時翻譯、會議記錄

透過 NVIDIA 對話式人工智慧功能 Jarvis SDK,開發人員可藉由整合使用虛擬助手,在視訊會議服務中進行語音辨識、語言理解與語音生成的功能。虛擬助手可做紀錄、設置執行項目,並以人聲回答問題,也能提供即時翻譯、即時字幕和逐字稿等,有助與會者了解會議中正在討論的內容。

Maxine 平台整合多個 NVIDIA 人工智慧 SDK 和 API 技術。除了上述的 Jarvis 外,還有強化音訊和視訊功能的  NVIDIA DeepStream ,並以 TensorRT SDK 執行高效能深度學習推理。官方提到,Maxine 平臺的人工智慧運算,因為都在雲端處理,所以終端用戶不需升級任何硬體,就能獲得這些功能。

以下為 Maxine 的串流視訊 AI SDK 展示影片:

相關文章:

3款人工智慧彩妝,讓你在家就可試妝、立馬客製粉底液!

人工智慧成最強替身演員 還可能得奧斯卡?

隱私是基本人權!蘋果新功能「App 追蹤透明度」讓 Facebook 急跳腳?

AI判定洋蔥照片「太性感」、乳癌文宣為色情,FB人工智慧出包!

人工智慧現在有情緒也能做表情!

人工智慧有了皮膚輔助診斷功能,讓你不再求助無門!

老人更愛人工智慧機器人陪他們玩遊戲!?

2021年6月27日 星期日

AI人工智慧讓視訊會議體驗更完美!(上)

 AI 人工智慧讓視訊會議體驗再升級!讓你視訊開會隨時都是好狀態!

AI人工智慧讓視訊會議體驗再升級!讓你視訊開會隨時都是好狀態!

 

新冠肺炎期間,WFH 已經是常態,全世界有數百萬人使用視訊來開會、學習、娛樂,甚至就診。IT 大廠紛紛發展視訊會議能應用的人工智慧技術。微軟甚至聯合美妝大廠資生堂,共同推出能「立即上妝」的視訊會議 AI 技術呢

而顯示卡大廠 NVIDIA 去年末推出的雲端視訊串流 AI 人工智慧平台「Maxine」,能使用人工智慧視訊壓縮技術—只要從人臉上「抓到」幾個關鍵點後,就能在另一端依據這些臉部特徵關鍵點  (facial points),重建人臉動畫。如此一來,就不需串流整個影像的畫素,大幅度降低視訊傳輸所需的頻寬。

以下影片為 NVIDIA Maxine 的各種功能介紹:

無需強大硬體,即可享有高解析.無噪音的視訊會議體驗

NVIDIA Maxine 是雲端原生的視訊串流 AI平台,其嶄新的 AI 功能可被導入到各式各樣的網路視訊會議中。視訊會議的服務供應商可透過 NVIDIA 的雲端 GPU(沒錯!此款 GPU 真的就在雲端上,因此你無需添購任何專業的設備~)上運行該平台,為用戶提供全新的 AI 功能,包括視線校正(Gaze Correction)、超高解析度、噪音消除和臉部打光等功能。

由於資料是在雲端而不是在本地設備上處理,因此使用者無需任何強大的硬體設備,即可享受高解析度、無背景噪音、自動修正的角度、甚至虛擬背景、替身、即時翻譯等進階功能!

AI 捕捉臉部關鍵點,所需頻寬減至原本一成

以下為 NVIDIA Research AI 視訊壓縮展示影片:

NVIDIA 使用的人工智慧技術可以分析每個會議參與者的臉部關鍵點(眼、鼻、口等周圍的要點 key points),並在接收器端運用所抓到的臉部要點來重建臉部動畫。如此一來就不需要傳輸完整的畫面,傳輸的資料減少了,所需的頻寬也因而大大減少。

Nvidia 使用的人工智慧技術可以抓住會議參與者的臉部關鍵點

透過上述人工智慧抓住臉部關鍵點的影像壓縮技術,視訊頻寬消耗減少至原本 H.264 串流視訊壓縮標準要求的十分之一,讓服務供應商的成本也跟著減少、終端用戶也可獲得順暢的視訊會議體驗。

透過抓住臉部關鍵點的 AI 影像壓縮技術,視訊頻寬消耗減少至原本 H.264 串流視訊壓縮標準要求的十分之一

 

本文為該系列的上篇,下篇(關於眼神接觸、臉部對齊……人工智慧提升視訊會議的體驗)請點此連結

 

相關文章:

3款人工智慧彩妝,讓你在家就可試妝、立馬客製粉底液!

人工智慧成最強替身演員 還可能得奧斯卡?

隱私是基本人權!蘋果新功能「App 追蹤透明度」讓 Facebook 急跳腳?

AI判定洋蔥照片「太性感」、乳癌文宣為色情,FB人工智慧出包!

人工智慧現在有情緒也能做表情!

人工智慧有了皮膚輔助診斷功能,讓你不再求助無門!

老人更愛人工智慧機器人陪他們玩遊戲!?

2021年6月21日 星期一

人工智慧機器人比真人更擅長擔任賓果遊戲主持人!?

這款人工智慧機器人主持賓果竟比真人更吃香!?養老院的長者超愛

這款人工智慧機器人主持賓果竟比真人更吃香!?養老院的長者超愛”她”

目錄

 

團康中常見賓果遊戲,它在 5×5 方格的紙上進行,依據抽出的號碼做記號,最先集滿五條線的玩家獲勝。由於賓果規則簡單、只需要一個主持人即可舉辦、也有一定互動性,在國外的養老院等場所經常可以看到。

而面對近代社會的少子化、高齡化等現象,安養長照的壓力越發沉重,養老院所也常有人力短缺的問題。為了減輕人力不足上的負擔,許多機構都在研究「陪伴型 AI 人工智慧 機器人」的可能。

來自新加坡南洋理工大學(Nangyang Technological University,NTU)的研究團隊,便發表了有柔軟肌膚、豐富表情的 AI 人工智慧 機器人「Nadine」,不只與老人互動,還能主持賓果遊戲!以下為人工智慧「Nadine」的介紹影片:

「人」工智慧:與創造者一模一樣的AI機器人Nadine

 

 

Nadine 是類人機器人,具有自己的個性、情緒和情感。不過,她的名字與外型都來自她的創造者── Nadia Magnenat Thalmann 教授。

Thalmann 教授是一名在虛擬人類、社交機器人等領域都有著許多貢獻的學者,目前也任教於新加坡南洋理工大學。而這台機器人 Nadine 看起來幾乎就是教授的分身一般,看起來栩栩如生,更擅長與人交流互動。

「我們希望了解擬人化機器人能否有辦法透過交談與遊戲,降低老年人的孤獨感。」Thalman 教授表示,這是他們創造出Nadine的初衷。

在與人互動時,Nadine 會依照對方反應給出相對應的回答、變化自己的手勢跟表情,同時也會記住曾經互動過的對象、相關資訊,察覺對話者的情緒並從對話的上下文、當下環境來理解意思,就像是跟真人互動一般。

由於這些優點,Nadine 在許多場合上大放異彩。她曾與許多不同領域、企業的人互動,如瑞士信貸、德意志銀行,還曾和印度總理納倫德拉.莫迪有過交流。

甚至,在接受了新加坡友邦保險的客服培訓後,擔任該公司的客服代理,這也是第一次有機器人擔任這項職位。

 

人工智慧 機器人當主持人 比真人擅長陪玩賓果遊戲

 

那麼,Nadine 擔任賓果遊戲主持人的成果又是如何呢?

在活動進行的過程中,Nadine 會留意每一位參與的老人家狀況,將自身的語速放慢,也會重複報號以確保每個人都能聽到並理解。

與此同時,研究員也利用攝影機記錄了每一位老人在遊戲中的表情、手勢,用以評估他們與 Nadine 互動時的專注力、情緒等。並且還另外請了一位真人護理師,主持另一場賓果遊戲作為 AI 的對照組。

令人驚訝的是,結果發現與由真人主持的遊戲相比,Nadine 所主持的賓果活動讓養老院的老者們更投入遊戲,也更加地樂在其中!

這是一個令人振奮的結果,表示在未來,AI 機器人很有機會在安養長照領域佔有一席之地。團隊也表示將會繼續開發,也希望能讓 Nadine 有能力自由的移動,增加與環境互動的能力,主動接近與人互動。

人類是社會性的動物,總是希望能有人相陪、談天,但現代社會人們多了許多事需要處理、生活節奏快了很多,不一定能時時找到人作伴,不過在持續的發展下,或許在將來我們都能夠有個 AI 機器人,和我們談天說地、還能玩場遊戲!

 

相關文章:

你笑,AI也笑!人工智慧也能用「表情」回應「感情」了

我的AI家人中,4個人工智慧暴躁阿公唱情歌、憂鬱阿嬤笑了!

日本研發 AI 人妻?假的!但本尊也是會跟你聊天的人工智慧美女

人工智慧成最強替身演員 還可能得奧斯卡?

有了AI人工智慧,工程師要失業了嗎!?

人工智慧也能協助診斷你的皮膚!

人工智慧審核貼文大出包!?

AI創造出超難通關的的俄羅斯方塊遊戲!

AI 打造了史上最難的俄羅斯方塊!會讓你玩到懷疑人生的俄羅斯方塊遊戲,你敢接招嗎?          

AI打造了史上最難的俄羅斯方塊!會讓你玩到懷疑人生的俄羅斯方塊遊戲,你敢接招嗎?

目錄

 

經典遊戲再進化!AI 打造史上最難「惡」羅斯方塊

 

俄羅斯方塊(Tetris)可說是最長壽、最受歡迎的電子遊戲之一,1980 年代問世至今,一直風靡在不同的國家、各種年齡層的玩家之間,亦開創「落下型益智遊戲」這個類別。

為何這款遊戲能夠如此家喻戶曉、歷久不衰呢?因為它規則簡單好懂,只要將隨機出現的不同形狀方塊由下而上堆疊,當橫排的格子被填滿時就能消除並得分,但要是疊起的方塊碰到頂部、無法再擺放新的方塊時就 Game Over 了。

不過,即使容易入門,想要玩得出色卻也不容易,在邏輯計算、反應力缺一不可,讓許多人著迷於挑戰「世界紀錄」等級的高分。還有人透過人工智慧,設計出一款世界最難的俄羅斯方塊,向全世界的玩家發出挑戰!


 

被人工智慧壓著打的人類玩家……

 

這款公認最難的俄羅斯方塊名為「Hatetris」,也就是讓人討厭的俄羅斯方塊(Hate + Tetris)。打造出它的工程師「qntm」曾經表示:「這是根據科幻小說《無聲狂嘯》中的邪惡 AI 所打造出的俄羅斯方塊。」

顧名思義,Hatetris 在遊玩的過程中絕對能讓你倍感痛苦,因為它會透過 AI ,計算出讓你最難消除的落下組合!

在俄羅斯方塊中,玩家最難駕馭的方塊形狀就是 S 型、Z 型兩種,而 Hatetris 便是一開始就掉落大量的 S、Z 方塊,讓玩家無法將底部鋪平,而這還只是一開始的下馬威而已。


若只是一直出現 S 型或 Z 型,玩家依然能穩定地消去一行行。但是 Hatetris 是不會讓玩家好過的,因此接下來,AI 就會看看哪個形狀的方塊能讓狀況變得最糟,來決定接下來要掉出什麼方塊。

什麼叫做「最糟」呢?AI 的邏輯其實不難理解,其演算法會比較不同形狀的方塊落下後,哪一個能讓玩家的堆疊變得最高,如果結果是差不多就優先選擇 S 型。

這讓許多玩家在遊玩時體會到「被 AI 針對」的感覺,也讓「Hatetris 世界紀錄」一度保持在最多只消去 31 行。以下為 Hatetris 消去 30 行的遊玩影片:


 

玩家呼籲「用 AI 反制 AI!」

 

既然 Hatetris 如此之難,也有不少玩家疾呼:只有借助 AI 才能戰勝 Hatetris 了!

一名來自日本的玩家「threepipes_s」就曾鑽研過此道,透過將集束搜索(beam search)算法應用在分析方塊版面,對所有可能落下的方塊、盤面狀態進行評估和搜索,找出最佳解。後來還曾前往会津大学(日本第一所專門教授計算機科學技術的研究型大學)中演講他攻略 Hatetris 的方法。


 

即使被 AI 虐 還是樂此不疲

 

Hatetris 是以 JavaScript 語言編寫而成,目前也在 GitHub 平台上開源。

同時,也支援 Base2048 編碼,每個人都能夠把自己遊玩的紀錄透過編碼分享到社群中,只要在「show a replay」選項中輸入代碼,就能看到自己或其他玩家的遊玩過程,甚至可以從記錄檔的最後一步接續遊玩。

經過全球玩家們不懈的努力,目前的世界紀錄來到了 41 行的消除數(2021-06-20的最新紀錄),而且這是歷經十年才終於達到的成績。看來即使口中喊著「hate」,大家還是樂在其中啊。

Hatetris 的遊戲網址如下,有興趣的人不妨自己挑戰看看喔!

遊戲網址:https://qntm.org/files/hatetris/hatetris.html

 

相關文章:

你笑,AI也笑!人工智慧也能用「表情」回應「感情」了

我的AI家人中,4個人工智慧暴躁阿公唱情歌、憂鬱阿嬤笑了!

日本研發 AI 人妻?假的!但本尊也是會跟你聊天的人工智慧美女

人工智慧成最強替身演員 還可能得奧斯卡?

有了AI人工智慧,工程師要失業了嗎!?

人工智慧也能協助診斷你的皮膚!

人工智慧審核貼文大出包!?

2021年6月16日 星期三

Google更新影片SEO啦!教你SEO優化15招(下)

 Google更新了影片搜尋SEO!我們該如何優化影片搜尋呢?以下15招學起來!

上篇介紹了幾項影片搜尋 SEO 的方法,這次我們將繼續介紹如何讓影片SEO搜尋最佳化!

允許 Google 擷取影片內容檔案

讓 Google擷取影片檔案是很重要,因為如果沒有事先設定,就算將影片編入索引中,還是無法讓「影片預覽」或「重要時刻」等功能顯示在搜尋結果中。想要允許 Google 擷取影片可以參考以下作法:

6. 以支援的檔案格式提供

例如:MOV、MP4、MPEG、WMV……等等。

7. 避免阻擋搜尋機器人

避免使用 noindex 標記或 robots.txt 檔案等方式封鎖影片內容網址或網域,這會讓 Google 無法擷取影片的檔案。

8. 確認頻寬

確認所選擇的網站主機代管​以及實際處理影片的伺服器擁有實際的頻寬,才不會在 Google 嘗試讀取影片時超過負荷。

9. 建立固定 URL

為影片與縮圖建立穩定的網址,免得因為網址過期、更動或失連而導致無法順利查找。

啟用 Google 特定的影片搜尋功能

上一篇我們提過幾個名詞,如「影片預覽」、「重要時刻」等,這些都是 Google 為搜尋使用者提供的「摘要」,能讓人對影片有個基本認識、預先了解是否有自己想要的資訊等,和沒有摘要的影片比起來,這樣更能夠讓人想點開影片。

這些功能各有什麼效果呢?要如何才能有效顯示?

10. 影片預覽

為了讓使用者對影片有初步了解,Google 會將影片中的幾秒擷取出來當作動態預覽。只要允許 Google 擷取的影片,就能使用這項功能,也可以使用 max-video-preview  指令,來設定你希望提供預覽的時間上限喔。

11. 重要時刻

這一項功能,就像是在看書時能在目錄中看到章節的標題、在第幾頁一樣,現在 Google 也能在搜尋結果中看到,從幾分幾秒開始是怎麼樣的章節、各章節時間長度等等。

不用特別設定,系統就會自動偵測內容與分段,也可以透過提供結構化資料來自行設定每個片段開頭跟結束的時間、要放上什麼標籤。

而如果是上傳到 Youtube 的影片,只需在說明欄中標記時間、標籤,就能夠自動產生了。

12.  直播標記

有的時候你會想要透過實況的方式,和觀眾、粉絲們有最即時的互動,這時如何讓大家知道你正在直播就很重要了!

可以在結構化資料中提供你的直播預計開始時間、結束時間等資訊,如此一來當你在直播時,就能將你的實況在搜尋結果中貼上「LIVE」的紅色貼紙。

被判定成敏感內容怎麼辦?!

有時會發生影片被判定為內容錯誤、有較為敏感的內容或是版權問題等狀況,此時需要將影片設定為不會被搜尋到,或是排除特定地區、年齡的使用者,這是為了保護網站中的其他內容,避免被預防性歸為敏感內容,導致整個網站的曝光度都受到影響。

可參考以下方式:

13. 移除影片的搜尋結果

透過在網頁的 HTML 回傳 404 (Not found)狀態碼,或是將目標影片從索引中移除,亦可在結構化資料中指定到期日,如此一來,你的影片就不會被放在搜尋結果當中。

14. 依使用者的位置不同,顯示不同的影片搜尋結果:

在使用結構化資料描述影片時,能夠設定不同區域能見度的屬性,也可以從影片  Sitemap 的標記中設定是否要出現在特定國家、地區的搜尋結果中。

若是沒有設定的話,所有區域的使用者都能搜尋到這部影片。

15. 若有成人內容,最好針對安全搜尋進行設定:

有些使用者因年齡不足或是本身並不想看到煽情露骨內容,便會開啟安全搜尋的設定,這樣便能夠避免在 Google 搜尋結果中出現不想看到的圖片、影片和網站。

如果你的網站或影片有成人內容相關的元素,Google 會建議將其標上標記,並且要與其他全年齡向的影片有所區隔,才不會讓安全性演算法為了避免漏網之魚,而將整個網站的內容與影片都判定為敏感內容。

 

相關文章:

【SEO關鍵字研究教學1】關鍵字分類篇

【SEO關鍵字研究教學2】冷門的長尾關鍵字篇

【SEO關鍵字研究教學3】關鍵字挑選五步驟

網站核心指標5月將成SEO排名因素!LCP,FID,CLS詳解與優化方式

Google的FLoC可能加重歧視的問題?(上)

造成多方疑慮的Google的FLoC!(下)

Google棄”餅乾”轉用人工智慧!(上)

2021年6月15日 星期二

Google更新影片SEO啦!教你SEO優化15招(上)

 Google更新了影片搜尋SEO!我們該如何優化影片搜尋呢?以下15招學起來!

Google更新了影片搜尋SEO囉!我們該如何優化影片搜尋呢?以下15招學起來!


目錄

 

SEO(Search Engine Optimization),意思是指依據搜尋引擎的規則運作、不需要付費購買廣告即可以自然排序在搜尋結果最前位,增加能見度的方法。當使用者主動搜尋關鍵字,通常也就代表著感興趣,而人們往往只點擊前幾項搜尋結果,因此搜尋結果第一名可以說是兵家必爭之地

每日,都有上億的網友搜尋各種與新聞、美食、娛樂等等主題的相關內容,且越來越多人喜歡透過影片來接收資訊。

比起一篇文章,影片給人的感覺更有溫度、娛樂性更高、接收訊息的門檻也更低,因此除了網站排名之外,「影片」類 SEO 的重要性可說是與日俱增。

如果希望你的影片獲得更多的聲量與關注,就需時時掌握如 Google 等主要搜尋引擎的脈動,若搜尋引擎的演算法則有更新,就會使原本的搜尋結果排名發生變化,對流量的影響不容忽視。掌握 Google 搜尋排序背後的 SEO「潛規則」,才能讓影片被演算法則所青睞!

Google 的新影片 SEO 多了哪些重點呢?我們將分成上下篇,為大家詳細介紹Google SEO

協助 Google 找到您的影片

首先最重要的就是影片本身要讓使用者好找,也要讓 Google 好找!

1. 公開影片

確保影片位於公開的網頁,而且使用者不需要經過複雜的操作,即可載入影片,這樣除了方便 Google 找到之外,也能讓使用者更簡單的觀看影片。

2. 為影片加上適當的 HTML 標籤:

一份 HTML 文件中會有許多標籤 (tag),不同的標籤表示不同語意(semantic)內容的區塊, 如果加入如 <video>、<embed>、<iframe> 或 <object> 等HTML 標籤,可以讓 Google 更輕易辨別。

3. 提交影片 Sitemap

Sitemap 常常翻譯為「網站地圖」,就像是網站的目錄,將站內所有頁面依分類呈現。而影片 Sitemap 與一般 Sitemap 一樣,只是主要索引的是影片類型的內容。可以選擇專為影片建立一個 Sitemap,也可以在現有的 Sitemap 中嵌入影片  Sitemap。

另外要特別注意的是,提交 Sitemap 前得先在「Google Search Console」中新增並驗證你的網站。

我是採用第三方內嵌播放器,怎麼辦?

有些人會使用 YouTube、Vimeo 或 Facebook 等平台來存放影片,再嵌入到網站中。

如果你是使用這種方法,還是可以提供結構化資料,或將網頁放入影片 Sitemap 中,來協助Google Search Console瞭解影片的內容。不過,也需要留意所使用的平台是否支援 Google 。

確保影片能編入索引

4. 提供高畫質的縮圖

一張好的影片縮圖能夠大大吸引觀眾,同樣的,高品質縮圖也能吸引到 Google 演算法。

怎麼樣能被 Google 判定為「高品質」呢?可以透過 HTML 標記、在影片 Sitemap 中指定或在結構化資料中設定;也可以允許 Google 直接擷取影片內容,讓 Google 來自動產生縮圖。

如果沒有設定好的話,即使網頁已編入索引,也只會顯示藍色字體的一般連結而已。

5. 提供結構化資料

結構化資料是用來描述影片的相關資訊,讓 Google 能了解影片相關內容並在查詢結果中展示,其中包含了說明、縮圖網址、上傳日期、重要時刻和時間長度等資訊,這些摘要都會讓搜尋結果更一目瞭然喔!

 

相關文章:

【SEO關鍵字研究教學1】關鍵字分類篇

【SEO關鍵字研究教學2】冷門的長尾關鍵字篇

【SEO關鍵字研究教學3】關鍵字挑選五步驟

網站核心指標5月將成SEO排名因素!LCP,FID,CLS詳解與優化方式

Google的FLoC可能加重歧視的問題?(上)

造成多方疑慮的Google的FLoC!(下)

Google棄”餅乾”轉用人工智慧!(上)