2021年7月26日 星期一

NVIDIA AI 讓你披頭散髮也能開視訊會議(下)

 視訊會議的救星NVIDIA AI,超強大的視訊串流平台,解決你視訊開會的各種煩惱!

視訊會議的救星NVIDIA AI,超強大的視訊串流平台,解決你視訊開會的各種煩惱!
 

本文為該系列的下篇,上篇(Vid2Vid Cameo 的完美功能)請點此連結

 

Vid2Vid Cameo:完美結合 2D 照片與 3D 動態

Vid2Vid Cameo 是 NVIDIA Maxine AI視訊串流平台背後、以生成對抗網絡(Generative Adversarial Network,GAN)是基礎的深度學習模型之一。

根據相關的論文解釋,該模型在 NVIDIA DGX 系統上使用 18 萬高品質的對話頭像資料集來進行訓練,學習分辨認識20 個關鍵點(用來建模「臉部表情」與「頭部運動」所必備的關鍵點),以便在沒有人類加以標註的情況下,可以針對臉部的動作來建立模型。關鍵點中,包含針對眼睛、嘴巴、鼻子等特徵位置來進行編碼。

下圖展示了 20 個關鍵點當中,前 5 個關鍵點的計算流程,給來源圖像及預測模型來規範關鍵點。


NVIDIA 的研究人員表示:從用戶的參考圖片中抓取這些關鍵點,用戶的參考圖片可事先發給其他的視訊與會者,或是從過往的視訊會議中擷取並重複使用。如此一來,視訊會議平台只需傳送用戶臉部特徵的動作數據,而不需要在每一個與會者間傳送龐大的即時視訊資料。對接收者來說,GAN 模型使用這些資料,在接收端合成一個模擬參考圖片外觀的視訊畫面。

整體來說,NVIDIA 去年推出的「會議神器」Maxine 平台就使用 AI 人工智慧驅動來實現高解析度、背景噪音消除、眼神校正等功能,讓你不需升級電腦效能也能擁有高品質的視訊會議。近期新推 Maxine 平台的深度學習模型 Vid2Vid Cameo 更讓你體面開會,AI  人工智慧技術完美掩蓋鏡頭前的蓬頭亂髮!Vid2Vid Cameo 目前已可在 NVIDIA AI Playground 上測試使用,其開發套件也將在不久後推出,讓開發人員可以運用優化後的訓練模型,為視訊、直播串流強化效果。

相關文章:

再邋遢都能體面開會!NVIDIA推AI視訊會議神器Maxine

AI打造史上最難「惡」羅斯方塊!世界紀錄僅消去41行

AI 人工智慧「Nadine」能說能笑 還能陪老人玩賓果

你笑,AI也笑!人工智慧也能用「表情」回應「感情」了

人工智慧有了皮膚輔助診斷功能,讓你不再求助無門!

AI人工智慧完勝人類工程師!

AI人工智慧也能做知”心”醫生

NVIDIA AI 讓你披頭散髮也能開視訊會議(上)

視訊會議的救星NVIDIA AI ,超強大的視訊串流平台,解決你視訊開會的各種煩惱!

視訊會議的救星NVIDIA AI,超強大的視訊串流平台,解決你視訊開會的各種煩惱!

 

視訊會議邋遢怎辦?AI 讓正式照片中的你「動起來」當替身!

新冠肺炎疫情持續影響大家的工作與生活,視訊會議讓我們的房間取代了原本的會議室,大家也希望自己能在鏡頭前體面的呈現。繪圖晶片大廠 NVIDIA 於去年 10 月在 GPU 技術大會(GTC)上發表了全新雲端的視訊串流平台「Maxine」,整合各種 AI 人工智慧輔助功能,能即時美化鏡頭前「太過真實」的畫面、或優化不佳的音訊。

大家都希望在每次的視訊會議中,保持個人最佳狀態。但是辦公室移到家裡後,難免會因剛睡醒、或是小孩、寵物吵鬧等,導致自己蓬頭亂髮,無法在會議平台中顯現出體面的打扮。針對此問題,NVIDIA 研究團隊在 2021 年的 CVPR 會議發表論文中,提出全新的解決方案——Vid2Vid Cameo,如以下影片所示:

Vid2Vid Cameo:AI 讓人像照跟著你擠眉弄眼!

NVIDIA「Vid2Vid Cameo」是新的深度學習模型,利用生成對抗網路 (GAN) ,只需一張使用者的臉部照片以及一段視訊串流內容,就能利用這兩種素材建立出可動的、用於視訊的擬真對話頭像。這意味著我們只需在會議前上傳一張體面、正式的個人照片,平台系統就會自動抓取照片中的幾個關鍵點,開會時 AI 模型再抓取個人在鏡頭前的即時動作,再將這些動作套用在先前上傳的靜態圖片上。

如此一來,鏡頭前的你無論是多麼蓬頭垢面,在視訊中都可以如同照片中的你一樣衣冠楚楚的參與會議!也藉著Vid2Vid Cameo 的 AI  人工智慧把你的臉部動作與即時動作轉移到照片上,你就像是如同照片中體面地參加會議!

Vid2Vid Cameo 的功能如下:

真人視角調整方向

透過 Vid2Vid Cameo,使用者能自由調整所生成的人臉視角,人臉的角度可選側面(上圖左)或正面(上圖右)、或是透過調整攝影機的的角度高低來顯示對話時的頭像視角。

虛擬角色逼真動態

在視訊通話越來越普遍的當下,親和力高的卡通人物有助於緩解網絡社交的壓力。Vid2Vid Cameo 亦可將卡通形象與真人進行即時合成。

AI演算法節省頻寬,保留絕佳視訊通話品質


透過 Vid2Vid Cameo 的新 AI 演算法 ,視訊會議只需傳送用戶的臉部關鍵點的動作資料,接著在所有與會者的視訊中即時模擬出立體頭像即可,而不需像以往的視訊會議中,每個與會者之間都要互相發送龐大的即時視訊串流內容。

這樣的技術可將視訓通話的流量需求減少十倍,讓通話品質更流暢、也不影響視訊畫質。

本文為該系列的上篇,下篇請點此連結

相關文章:

再邋遢都能體面開會!NVIDIA推AI視訊會議神器Maxine

AI打造史上最難「惡」羅斯方塊!世界紀錄僅消去41行

AI 人工智慧「Nadine」能說能笑 還能陪老人玩賓果

你笑,AI也笑!人工智慧也能用「表情」回應「感情」了

人工智慧有了皮膚輔助診斷功能,讓你不再求助無門!

AI人工智慧完勝人類工程師!

AI人工智慧也能做知”心”醫生

 

2021年7月19日 星期一

AI人工智慧也能判別憂鬱症

 AI 人工智慧現今也能夠快速分析患者有無憂鬱傾向了!

AI人工智慧現今也能夠快速分析患者有無憂鬱傾向了!


傳統的憂鬱檢測量表包含了自我覺察的題目如情緒、感受等,會因每個人不同標準等因素而失真。因此日本就有研究團隊利用人工智慧技術,研發能客觀偵測憂鬱症的 AI。

疫情下憂鬱症增30%!日研發AI快速找出潛在患者

隨著新冠肺炎疫情爆發、擴及全世界,全球各地人們的生活、工作、家庭等方面都有著劇烈的轉變,對疾病的恐懼與居家防疫帶來的孤獨,讓不少人備感焦慮、憂鬱,更出現其他心理壓力過大的狀況。

美國疾病管制與預防中心(CDC) 經調查近萬名的成年人發現,疫情之下有超過 40% 的民眾出現心理、行為健康問題,30% 的人出現憂鬱症的相關症狀、更有 26.3% 的人有疫情有關的創傷和壓力。

憂鬱症的盛行率在全球都有逐年升高的趨勢,然而,由於其本身的疾病特徵,讓許多人即使已經罹病卻仍未有病識感,以致延誤了治療時機。因此,如何快速且有效地找出潛在患者,便成為一件迫在眉睫的事情。

在日本,就有研究團隊嘗試將這項重任交付給 AI 人工智慧來達成──筑波大學道喜將太郎教授,就帶領團隊研發能出偵測憂鬱症傾向的 AI 系統。

心理要怎麼「健康檢查」?

因心理疾病較難有明顯的外觀可供辨識,有許多醫療機構會提供憂鬱症健康檢測量表,協助民眾先瞭解自己的身心狀況。

傳統的憂鬱檢測量表,通常包含了自我覺察類型的題目,像是情緒狀況、壓力感受等。然而,這類主觀感受問題常因每個人不同標準、擔心周遭眼光與評價等因素而失真,無法準確反映實際情況。

而隸屬於筑波大學醫學醫療系的道喜教授,認為 AI 系統也許能做到在沒有這些數據的情況下,評估受試者的心理健康。

道喜教授表示:「我們想看看 AI 是否可以做到只從社會人口統計學、生活方式和睡眠因素等客觀條件檢測出人們的心理困擾,而無關於人們對自己情緒的主觀認定。」

為了實踐這個想法,研究人員完成了一項關於社會人口統計學的調查,擬定出不同於傳統的新測量標準──包括年齡、婚姻狀態、家庭社經情況等變項,以及生活習慣和睡眠狀況等。

接著,團隊開發了一個 AI 模型,並讓 AI 學習這套新測量模式,並招募志願者提供資料讓 AI對其的心理狀態進行評估。

和真人醫生表現的一樣出色

最後,團隊總共蒐集了 7251 名參與者的資料,除了由 AI 模型評估外,也請 6 名精神科醫師進行分析,再將兩邊的結果交互比對。

令人驚訝的是,AI 人工智慧與專家團隊的評估結果非常接近,在心理困擾嚴重者的評估上,AI 甚至比人類醫師更為準確。

「結果令人驚訝,」道喜教授表示:「我們發現,即使沒有關於情緒的資料,AI 也能做出和專家團隊同樣的評估。」

道喜教授亦表示,有 AI 評估系統的幫助,未來在進行相關疾病的判別時,能夠避免較不準確的主觀情緒資料,也減少了因刻板印象或社會眼光帶來的額外壓力。

同時,這也有助於快速、大規模地找出有憂鬱傾向或相關困擾的人,減輕專業醫療人力的需求,更能降低社會經濟的負擔。

及早發現,及早治療

研究團隊接下來的目標,是提升 AI 判斷系統的準確率,以及在不同國家的文化脈絡、經濟環境等因素下的表現,發展出一套適用多國的心理檢測系統。

憂鬱症等疾患在現代社會並不算罕見,其成因包含了生理和心理因素。若評估後發現自己可能有憂鬱症傾向或相關心理困擾,也不用太過緊張。

而不需要面對真人的「AI 醫師」,或許也能減低許多人對於就醫的恐懼,讓更多人可以透過早期發現,接受適當的療程,有效地改善相關症狀,重拾健康。

 

相關文章:

27歲華裔工程師用人工智慧,預測疫情比專業準!

AI 一對一客服、電話行銷一把罩!人工智慧語音機器人夯

人工智慧寫文太療癒,奪排行榜冠軍!學霸敲碗求更新

Python 變身告白神器、還會幫你整理電腦?6 種 Python 隱藏版技能一次學

程式語言排行榜Python要超前Java了嗎?

AI人工智慧讓視訊會議變得超easy!(上)

AI打造出超邪惡的俄羅斯方塊!

能坐上談判桌的談判型AI人工智慧來了!

 AI 人工智慧來場唇槍舌戰吧!你可能有幸遇到""這麼一個難纏的對手!

跟AI人工智慧來場唇槍舌戰吧!你可能有幸遇到"它"這麼一個難纏的對手!

目錄

說到 AI 人工智慧,你腦海中出現的是怎麼情境?大部分的人印象裡的 AI 人工智慧,通常是會遵照人們下達的指令執行任務、讓人類的工作與生活更加便利。然而在未來,我們也很有可能會看到 AI 對我們說:「不!」的情況。

在今年的計算語言學協會(NAACL 2021)北美分會年會上,一位來自美國南加州大學博士生 Kushal Chawla 與他的團隊就發表了能夠與人類談判、辯論的AI 人工智慧系統「CaSiNo」。

以露營為背景 透過 AI 實現「人機協商」

這項計畫的主持人 Kushal Chawla  專精於自然語言處理(NLP)與人機互動(HCI),對於如何應用 NLP 來實現人與機器間的溝通更是感興趣。

Chawla 表示,現今對話式 AI 已被廣泛地運用,而他們希望能推動實用性高的NLP「談判 AI 人工智慧」,因此團隊打造出了「CaSiNo」──一個包含一千條以上英語談判語料庫的 AI

「CaSiNo」這個名字來自於 Camp Site Negotiations ,中文為營地談判,顧名思義這項計畫以露營地當作背景情境,參與者能與人工智慧在這樣的設定下互動,彼此協商如何分配有限的資源如:食物、飲用水、柴火等等,最後才能夠順利地完成露營。

Chawla 表示,這樣的設計是為了能讓談判時使用到的詞句豐富化、多樣化,同時還能確保 AI 處於一個易於測試、處理的封閉環境中。

而與過往類似的研究不同,CaSiNo 傾向直接使用語言來與參與者進行交流,而不是透過互動介面。

雖然透過選單、按鍵等功能來溝通的互動介面,在建立與應用上更為簡單,但 Chawla 認為,如此一來便無法掌握到談判中出現的情緒,同時也限制了交流。

在溝通協調的過程中,AI 會嘗試使用各種層面的策略,試圖與對方討論資源分配的問題,並且提出自己意見,甚至會表達反對、修正或是做出妥協讓步。

在經過一千多次的談判對話後,研究團隊歸納出九種 AI 在當中所使用的談判策略,進而發現,其中「合作策略」帶來的效果較其他種方式更好,而這也讓 AI 在學習後,會更喜歡與人類建立起合作關係。

發展可能無限的談判 AI

Chawla 以及他的團隊已經將目前為止 CaSiNo 的研究整理成冊,並刊登在論文預印本網站 arXiv.org 上。

但是他們也並不打算止步於此,CaSiNo 目前的成果還侷限在部分情境、雙方有著露營這樣共同目標的環境下,在這之後,研究團隊希望朝向非協作型對話,讓人工智慧與對談者有著不一致的目標、不易合作,訓練其說服對方退讓的各種策略。

除此之外,也希望能夠擴展更多的情境,達成在現實環境中、語言形式自由的狀況下有良好的談判結果,並增強 AI 判讀對話過程中產出的情緒的能力。

其實談判、協商、辯論等技能是現代社會一項重要的工具,但同時又困難不易掌握。而就算是談判專家,在高張力情境中需要即時做出決定,勢必得承受龐大的壓力,也很容易因此判斷失誤,產生不可抹滅的代價。

如 CaSiNo 這樣的自動協商 AI,在不同領域都有著一定的需求:像是訓練商業協商人才、協助律師擬定答辯策略、警匪對峙狀況下的談判顧問等等,也可以應用在不同情境下的模擬訓練,以及開發新的談判技巧。

或許,在未來你的小孩不想寫作業的時候,也能夠出動你的個人 AI 顧問,協助你跟他談判!

相關文章:

27歲華裔工程師用人工智慧,預測疫情比專業準!

AI 一對一客服、電話行銷一把罩!人工智慧語音機器人夯

人工智慧寫文太療癒,奪排行榜冠軍!學霸敲碗求更新

Python 變身告白神器、還會幫你整理電腦?6 種 Python 隱藏版技能一次學

程式語言排行榜Python要超前Java了嗎?

AI人工智慧讓視訊會議變得超easy!(上)

AI打造出超邪惡的俄羅斯方塊!

2021年7月13日 星期二

學Python讓你擁有不一樣的職涯

 零基礎學Python成功轉職不是夢!活到老,學到老,給你不一樣的人生!

零基礎學Python成功轉職不是夢!活到老,學到老,給你不一樣的人生!


進入社會工作六、七年換了三、四份工作,忽然有一天發現軟體工程師才是極具發展潛力、心所嚮往的職務,完全零基礎的情況下,可能轉職成功嗎?目前任職 PCHome 的林炳丞就是透過在職進修 Python 線上課程,為自己的職涯另闢新道路。

原先在醫療科技公司擔任品保人員的林炳丞,曾做過作業員、船務報關人員,與公司工程師閒聊時,發現軟體工程師的薪資幅度非常廣,而自己所任職的品保領域,即使再做十年、二十年,月薪可能依然只有三、四萬元。他意識到自己再不改變,也許一輩子都無法突破薪資天花板。於是,2019 年成為林炳丞人生中重要的轉捩點,他決定放手一搏,從零開始學起,直到當上軟體工程師為止。

在職進修成為軟體工程師 突破薪資天花板

設下軟體工程師的轉職目標之後,林炳丞開始尋找學習資源,最後選擇達內教育的 Python 線上課程,原因在於它適用於零基礎學員、課程規畫完善,包含網頁製作、數據分析、AI 人工智慧等符合就業市場需求的課程應有盡有,並且協助就業銜接。

為了順利進修,他毅然回到自家經營的公司幫忙汽車耗材買賣,並展開為期一年的在職進修生活,周間白天工作、晚上七時到十時進行Python線上課程;而周末六、日早上也不間斷,有時甚至是全天課程。

看似完全沒有休閒娛樂的在職進修生活,林炳丞是如何堅持下去?他笑著說當初在做這個決定之前,已做好心理建設,認為自己已經沒有任何退路;而就現實面來說,十萬元學費也是一個很有用的提醒,心裡隨時有個聲音在告訴自己,絕對不能浪費這筆錢。

在職進修一年之後,林炳丞如願進入以物聯網系統概念發展智能農業的金子進科技擔任軟體工程師,負責網頁前端、後端的維護與更新,薪資較先前的品保人員提升將近三成。他分享,由於選的Python線上課程很符合職場需要的技能,加上進修過程中不斷累積實作專案,學習程式的實際應用,即使是自己第一份軟體工程師的工作,銜接還是相當順利。

一年後他發現自己更嚮往數據分析與AI的領域,今(2021)年五月順利進入 PChome 擔任大數據工程師。

他在 PChome 的工作職務,主要是優化搜尋功能,以及建立應用程式介面(Application Programming Interface, 簡稱 API)方便同事抓取數據或資料加以運用。成功轉職軟體工程師,再跳槽成為大數據工程師,讓林炳丞的薪資三級跳,與轉職前的品保人員相較,薪資幅度足足成長將近五成。

成為工程師之後,他也發現英文的重要性,不僅撰寫程式需要英文,有時跟團隊溝通也需要英文。為此,他利用一個月的時間,透過線上英文課程、每日一集美劇密集加強聽力,接下來也將持續學習英文,並報考 TOEIC 檢視自己的英文能力,希望有朝一日能進入外商公司,與外國工程師一起切磋、學習軟體工程師的技能。


透過在職進修,讓林炳丞順利轉職成為軟體工程師,更進一步往數據分析領域發展。

時刻提醒進修初衷 就能堅持下去

利用一年在職進修的時間便成功轉職、達成目標,是許多上班族的夢想,但總是心有餘而力不足。對此,林炳丞認為只要心態正確、做好心理建設,知道自己為什麼要改變?為什麼要進修?當過程中遇到阻礙、卡關,隨時提醒自己進修的初衷,就能堅持下去,這也是支持他度過一年在職進修、未曾放棄的最大動力。

進修過程其實也不是一路順遂,實作遇到困難也很常有。林炳丞分享,當他卡關了,第一步會先上網找資料,看是否有人也曾遇到相同問題、是否有解決方案,如果找不到答案,再試著詢問軟體工程師朋友,或是尋求老師跟助教協助。他認為主動找解答是在職進修過程中不可或缺的能力。

對於未來想在職進修或是也想轉職成為軟體工程師的人,林炳丞強調只要先想清楚自己為什麼要這麼做,心態對了,就能秉持這個想法走下去。其次,有效率找到正確的學習資源也很重要。

他認為現在進修的方式相當多樣,資源很多,例如資策會或補習班都有業界最新的資訊,可以省下很多自己摸索、找學習素材的時間。最重要的是選擇能夠快速銜接職場需求管道和課程,持續下去,就能無縫接軌,利用在職進修達成轉職的目標。(原文出處:English Career

林炳丞的進修課程三大法則:
1. 做好心理建設,想清楚自己為什麼要進修,不要忘記初衷。
2. 有效率找到正確的學習資源,省去自己摸索的時間。
3. 遇到困難,要積極主動找解答,慢慢建立成就感。


About 林炳丞
出生:1989年
現職:PChome 大數據工程師
經歷:金子進科技軟體工程師、醫療科技公司品保人員
學歷:真理大學工業管理與經營資訊學系

 

相關文章:

AI打造史上最難「惡」羅斯方塊!世界紀錄僅消去41行

AI 人工智慧「Nadine」能說能笑 還能陪老人玩賓果

人類又輸了?工程師需花數月設計出IC晶片,AI六小時就搞定!

你笑,AI也笑!人工智慧也能用「表情」回應「感情」了

人工智慧審核貼文大出包!?

人工智慧有了皮膚輔助診斷功能,讓你不再求助無門!

AI人工智慧讓視訊會議變得超easy!(上)

2021年7月12日 星期一

程式語言排行榜Python要超前Java了嗎?

這回的程式語言排行Python有望擠下Java奪冠?

這回的程式語言排行Python有望擠下Java奪冠?

 

從2001 年起,創建滿 20 週年的程式語言排行榜「TIOBE Index」都會公布當月的程式語言排行。第一次 TIOBE 榜上前三名:Java、C 與 C++。這幾年來,穩居在榜上前三名的常客為 Java、C 和 Python,與 20 年前異常地相似。

Python奪第三!分數卻與第一名史無前例地相近

而最新一期(2021 年七月)的結果也不意外,JavaC 和 Python 穩居前三名。但是,長期居冠的 C 語言和第二名的 Java 分數都明顯下降、Python 的分數卻竄升,使得前三名的分數差異史無前例的靠近,第一名和第三名的分數只相差了 0.67%!這意味著接下來的幾個月,榜上的前三名將有史無前例的結果。

人工智慧、新冠藥物⋯Python應用廣有望奪冠

近幾年,人工智慧(Artificial Intelligence)與資料挖掘(Data Mining)都在蓬勃發展中,剛好 Python 又是這兩大領域的領導語言,這優勢可讓 Python 在接下來幾個月隨時都可能成為第一。除了上述兩大領域,Python 的應用領域也包含網頁前後段、嵌入式系統等;去年更因 Covid-19 的爆發,研究人員積極使用 ​Python 進行統計分析,尋找對抗病毒的藥物,讓 Python 的分數有前所未有的竄升。

Covid-19 除了帶動 Python 的熱門度外,用於醫療軟體開發的 C 和 C++ 也受到影響。C 語言擠下了近年來居冠的 Java 成第一名。

總體而言,位居榜首的 C 語言分數為 11.62%,自去年 7 月以來下降了 4.83%。緊接在後的 Java 得分為 11.17%,較去年下降了 3.93%。排名第三的 Python 得分 10.95%,較去年增加了 1.86%,也是榜上前 20 名中增幅最大的程式語言。

前七名上榜語言與去年同期相同

有趣的是,本次榜上前七名的程式語言都與去年同期(2020 年七月)相同:C++ 與 C# 分別以 8.01% 與 4.83% 位居第四、第五、Visual Basic 以 4.50% 的分數排名第六,JavaScript (2.71%) 排名第七。而第八名的 PHP 相較去年變化不大,只升了一個名次;組合語言 ASM 則在一年間升了四個名次,進 Top10 榜到第九名;SQL 也在一年內加入 Top10,位居第十。

TIOBE Index 的其他變動,還有位居第 11 名的 Visual Basic,自去年七月以來以來上升了 9 名;在此一年間,第 12 名的 R 語言下滑了 4 名、位居第 14 的 Fortran 則飆升了 36 個名次、第 15 名的 Groovy 竄升九個名次、第 16 名的 Swift 則滑落六個名次、Perl 與 MATLAB 則不約而同地在一年內滑落四個名次,分別居於第 18、19。

TIOBE 使用許多指標來決定每月一度的排名,指標包含了 Bing、亞馬遜、YouTube、維基百科、Google、Yahoo 和百度上的搜尋結果。讀者們想要進一步查詢完整指標的話,就親自至 TIOBE 官網上看看吧!


延伸閱讀:使用 Java、Python 等 22 種語言寫出「Hello World」會如何?

 

相關文章:

AI打造史上最難「惡」羅斯方塊!世界紀錄僅消去41行

AI 人工智慧「Nadine」能說能笑 還能陪老人玩賓果

人類又輸了?工程師需花數月設計出IC晶片,AI六小時就搞定!

你笑,AI也笑!人工智慧也能用「表情」回應「感情」了

人工智慧審核貼文大出包!?

人工智慧有了皮膚輔助診斷功能,讓你不再求助無門!

AI人工智慧讓視訊會議變得超easy!(上)