當AI遇上雲-Amazon的生成式AI發展策略─資策會 FIND科技報─智邦公益電子報
enews.url.com.tw · October 31,2024當AI遇上雲-Amazon的生成式AI發展策略
FIND研究員:莊鈞諺
隨著生成式人工智慧(Generative AI)的熱潮崛起,包含Google Cloud Platform (GCP)、Microsoft Azure以及Amazon Web Services (AWS)在內的雲端服務供應商紛紛投入競爭,提供各自的方案。儘管微軟已在此競爭中取得先機,但GCP與AWS仍不遑多讓,積極推出各項新產品以迎合市場需求。
生成式人工智慧(Generative AI) 簡介
生成式AI是一種以創建全新內容與概念為特色的AI類型,其核心驅動力源來自被稱為基礎模型(Foundation Models)的大型AI模型,這些模型經由大規模自我監督學習或半監督學習進行訓練,早期的例子如Google的BERT或OpenAI的GPT-n等語言模型,以及應用於視覺或多模態的基礎模型如DALL-E和Flamingo等。這類模型在海量數據訓練的基礎上,能夠根據給定輸入生成對應的新內容。
雖然微軟透過與OpenAI的長期合作並將其整合至雲端服務Azure,成功搭上Chat GPT的熱潮,但在此篇文章中,將介紹另一雲端巨頭-AWS在生成式AI領域推出的產品-專為程式開發者設計的CodeWhisperer。
工程師寫程式的利器-Amazon的CodeWhisperer
Amazon CodeWhisperer是一種AI編碼助手,它可以基於開發者的自然語言註解和他們在整合開發環境(IDE)中的先前代碼,即時的產出程式編寫建議。工程師只需透過註解文字的方式告訴 CodeWhisperer 想要進行的任務,如下面的範例,我希望寫一段程式從yahoo finance 取回Apple公司的股價,因此在註解的部分寫了一段話,告訴CodeWhisperer我們要做的事情是甚麼,接著正常的import相關的套件,這時CodeWhisperer就會實時的提醒開發者可以使用的程式碼,如下圖的情境中,我需要對yahoo finance下API指令,CodeWhisperer讀懂我需要的函數是yf中的download,參數是Apple 股價的 ticker與時間段,因此產生了程式碼推薦。
圖一、Amazon CloudWhisper 自動生成程式碼
圖片來源:本文作者於AWS帳號中的AWS Cloud9環境
圖二、程式輸出畫面
圖片來源:本文作者於AWS帳號中的AWS Cloud9 環境
CodeWhisperer現在支援包括Python、Java、JavaScript、TypeScript、C#等在內的多種語言,還支援新的語言,如Go、Kotlin、Rust、PHP和SQL。並且支援通過AWS Toolkit IDE擴展各種IDE環境來使用 CodeWhisperer。它也具備一些檢查程式代碼的安全性能力,可以自動檢測出一些隱藏的、較難以發現的漏洞,並給出解決問題的建議。
AWS的其他Gen AI產品
Amazon推出Amazon Bedrock與Amazon Titan,提供更便利的途徑來建立與擴展生成式AI應用。Amazon Bedrock是透過API讓使用者獲取第三方AI公司如:AI21 Labs、Anthropic、Stability AI與Amazon的基礎模型輕鬆構建和擴展生成式AI應用,著重於與他人的合作。
另一個產品是Amazon Titan模型,是Amazon即將推出的兩種新大型語言模型(LLM) 。第一種是生成性語言模型,用於文章相關任務,如:摘要文章、生成對話、分類文字、機器問答等任務。第二種是嵌入式語言模型,可以將文本輸入(單詞、短篇文字或大篇幅文本)轉換為包含文本語義的向量表示對於個性化和搜尋等應具有相當的幫助。
Amazon建構中立平台直攻toB市場
AI領域已成為科技巨頭爭奪的焦點。如微軟整合生成式AI至Bing和軟體產品中,而Alphabet則於引擎中添加聊天機器人,主要服務對象為一般消費者。然而,Amazon選擇另外一條路,以吸引企業客戶為目標,建構一個包含多種AI功能的中立平台,以串接各個AI新創的服務為主,避免大規模投資於任一AI新創,如Amazon Bedrock產品線就與多家AI 廠商合作,以串接API的方式將AI服務整合進自己的產品。
資料來源
- 封面圖片來源:https://unsplash.com/photos/t1PaIbMTJIM (Photo by Hitesh Choudhary on Unsplash)
- https://www.chinatimes.com/newspapers/20230417000060-260202?chdt
人工智慧的進化與重塑:邁向AIGC時代
FIND研究員:邱育生
隨著生成式AI蓬勃發展,我們不免要來了解AI的前世今生,才能鑑往知來,迎接普AI時代的到來!
近代人工智慧發展四大進程
回顧當代人工智慧(Artificial Intelligence)的發展,約可將其分為以下幾個階段:
【專家知識期】:專家學者們嘗試透過各領域的專家知識庫收集,將領域知識進行適當轉換,透過電腦的邏輯運算能力來協助進行問題推理,提供領域工作者決策輔助。
【聯結主義期】:此一時期專家學者們開始提出模仿人類神經系統的結構和功能,並利用大量的數據進行類神經網路模型訓練。然而,在硬體條件(運算能力)受限的情況下,其研究進展相對緩慢。
【統計學期期】:此時期專注於數據關聯分析與巨量資料探勘,透過統計學習的方式進行個類型人工智慧應用發展(如:影像辨識、語音識別等)。
【深度學習期】:伴隨硬體技術的發展,在運算能力大幅進化提昇的條件下,專家學者們開始基於多層次的類神經網路結構,進行人工智慧服務優化(如:自然語言處理)。
從上述人工智慧的演進過程中,可以發現專家學者們的動心起念,都是希望能夠透過電腦的輔助,來協助改善人們在日常、工作中所遇到的各種困難、棘手問題。而伴隨著「解題」的目標差異,各自搭配著合適的解題技巧(如:統計分析、機器學習、深度學習等)。
生成式AI的崛起與技術原理
而近年生成式AI(Generative AI)的崛起,無疑是人工智慧歷史演進的一大躍進,其代表著在目前軟硬體技術的搭配下,AI已逐漸具備「理解」能力。以ChatGPT應用為例,當使用者輸入一段句子後,ChatGPT便會使用「Self-Attention」機制來進行不同詞語的相關性與重要性判斷。在理解使用者的提問內容後,便運用過往已知知識來進行回覆內容生成。於日前,微軟首席技術長 Kevin Scott更在自家的AI部落格上提到:「我可以自信地說,2023 年將是人工智慧社群裡有史以來最激動人心的一年」。
如同人類的認知學習發展一樣,在懵懂無知的階段,需要的是一位學識淵博的老師給予提攜指導,一旦具備「理解」能力之後,便可以透過外部資訊的汲取展開自學,進而演化成具備「創作」能力,而AIGC(AI Generated Content)服務便衍然而生。
生成式AI憑藉著大量數據來源(如:文字、圖片、影片、聲音等)的學習,依賴於深度學習技術的運用,從而具備仿效、創造的能力。以常見的生成對抗網路(Generative Adversarial Networks, GAN)演算為例,其演算核心包含兩大模組:生成器(Generator)、鑑別器(Discriminator),前者用以進行倣真數據生成、後者用以進行數據真偽區分。過程中會由生成器進行反覆數據生成,並透過鑑別器來進行數據優劣判定,並持續地依據每次判定結果進行生成技術的滾動精進。
圖一:生成對抗網路架構圖(圖片來源:Google Developer)
而就自然語言處理、聲音生成這類型的創作(如:ChatGPT)來說,則多數是搭配Transformer模型演算,其模型架構如下圖所示,其主要組成包含了左側的Encoder(編碼器)、右側的Decoder(解碼器)。從架構圖可以看到,Encoder和Decoder均由Multi-Head Attention與Feed-Forward Neural Network所組成。其主要原理為憑藉著序列資料中的關聯釐清,嘗試著「先理解」輸入序列彼此間的脈絡意義,然後「再產出」最適切的答案/成果。透過「理解」能力的賦予,伴隨著模型訓練集(知識集)的涵蓋範疇增長,生成式AI所能提供的服務將更為多元寬廣。
生成式AI成為資安防護新利器
以ChatGPT為例,人們僅需透過自然語言說明自身需求,便可以由它幫忙進行應用程式撰寫。更甚者,也已有資安公司將生成式AI的技術運用到滲透測試上,用以協助網管人員尋找/修補資安潛在漏洞,以減少資安防護的作業效率。
圖二:Transformer架構圖(圖片來源:Attention Is All You Need)
AI技術賦能 數位應用邁向新境界
目前常見的AIGC應用包含自然語言生成、圖像合成/繪圖、音樂創作、影片創作等,相關服務可依據使用者所提供的參數和條件進行內容生成。生成式AI相關應用的推出,無疑將把各行各業的數位賦能應用邁進一個嶄新的階段。可以預期到,在生成式AI技術的輔助下,將可有助於產業作業流程改善、個人工作效率提昇等,讓人們可以更專注在需要投入的事情上。而人們在仰賴AI工具的過程中,也需關注到學習資料偏頗所衍生的潛在風險。因此,在使用生成式AI服務的過程中,人們將需要具備更清晰思路與自主判斷,才能真正享受到新興科技所帶來的美好生活。
參考來源:
[1] 封面圖資料來源:https://www.freepik.com/
[2] 生成對抗網路架構圖:https://developers.google.com
[3] Ashish Vaswani, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin. Attention Is All You Need. https://arxiv.org/pdf/1706.03762.pdf
Markets and Markets報告全球5G服務市場將以每年25.3%之速度發展
FIND研究員:陳景松 根據市調機構Markets and Markets於2023年3月的調查報告,全球5G服務市場規模(Global 5G Services Market)在2022年約達1,070億美元,全球5G服務市場規模未來將以每年約25.3%之速度成長,至2027年整體市場規模將可達到約3,311.2億美元。>
新加坡打造智慧港口發展航港產業
FIND研究員:劉仲祥、黃盈婷、陳伯錚 新加坡港推出全球首個智慧港口計畫(Smart Port),該計畫藉由軟硬體整合,硬體如智慧貨櫃系統、無人駕駛車、自動堆場起重機等技術,軟體為資訊平台等,使其港口業務更加高效、快速和智慧化。 >