淺談IBM WatsonX AI新平台─資策會 FIND科技報─智邦公益電子報
enews.url.com.tw · October 31,2024淺談IBM WatsonX AI新平台
FIND研究員:盧建智
WatsonX為IBM即將推出的企業級人工智慧和數據平台,旨在擴大人工智慧對企業的影響,該平台主要在AI模型開發工具、數據處理優化及AI治理策略等面向,提供對應的解決方案,期望透過AI和自動化技術,協助企業打造AI加值應用服務,簡化核心業務工作流程,提升企業生產力。
技術發展背景:
IBM曾在十多年前,就創建了AI系統Watson,當時在機智問答節目「Jeopardy」中,因擊敗人類獲得冠軍而引起關注,但卻沒有帶來獲利,近期因ChatGPT應用,使得生成式AI技術獲得熱烈關注,隨著生式成AI應用逐漸普及,包含:文本摘要、對話問答、程式撰寫、圖像生成…等語言類及圖像類的應用,現在IBM試圖搭上近期AI熱潮,推出WatsonX平台,同時支援傳統機器學習及生成式AI模型建置與管理,協助企業透過AI技術優化服務流程,提升產業競爭力。
圖說一、IBM搭上近期AI熱潮,推出WatsonX平台,協助企業優化服務流程。
圖片來源:IBM
技術介紹:
IBM WatsonX AI新平台主要包含3個強大的元件:watsonx.ai、watsonx.data、watsonx.governance,協助企業可依據其業務性質,快速訓練和部署自定義的AI模型,發揮數據集的價值,進而提供預測建議與決策參考。
- watsonx.ai:為企業級AI模型開發工具,支援傳統機器學習及生成式AI模型的訓練、驗證、調整和部署,在AI模型建置過程中,可使用IBM精選基礎模型套件及其合作夥伴Hugging Face的開源模型,以確保業務應用模型的可信度和效率,從而定義滿足企業需求的最佳模型,同時提供完整的SDK和API函式庫,讓企業能在很短的時間內,使用少量數據,建構符合企業需求的AI應用服務。
- watsonx.data:提供安全性及可靠性的數據儲存優化管理功能,可以跨混合雲環境,透過單一入口方式取得所有數據,可快速連接到儲存和分析環境,並可透過內建的治理、安全和自動化機制,增強對數據的信任,同時在跨多個查詢引擎及資料儲存層處理時,透過將正確的工作負載與正確的引擎配對,可降低資料倉儲處理成本,使企業能夠更彈性地擴展AI工作負載及數據應用。
- watsonx.governance:當AI技術應用到日常工作流程中的次數越多,就越需要主動治理來推動整個企業,做出負責任且合乎道德的決策,透過此元件進行AI生命週期治理,用來指導、管理和監控組織內的AI活動,並透過軟體自動化來識別、管理、監控和報告風險與合規性,以降低企業風險,並符合監管要求。
未來展望:
隨著生成式AI技術發展,帶動資本市場投資熱度,新創業者如雨後春筍般出現,國際大廠與新創業者皆想搶這塊市場大餅,然而各技術皆有其發展重點方向,以IBM WatsonX而言,聚焦在提供一個為企業打造的人工智慧及數據平台,幫助企業可以更輕鬆地建構AI加值應用與服務,優化企業工作流程,創造更具競爭力的優勢。
封面圖片來源:IBM官網
資料來源:
- IBM官網,https://www.ibm.com/watson
- pcmarket,https://www.pcmarket.com.hk/ibm-think-watsonx-ge-ai/
- gvm,https://www.gvm.com.tw/article/102522
- technews,https://technews.tw/2023/05/11/ibm-announces-watsonx-platform/
- inside,https://www.inside.com.tw/article/31578-IBM-WatsonX
- cnyes,https://news.cnyes.com/news/id/5171518
探討如何運用MLOps來持續改進GPT模型
FIND研究員:李啟榮
ChatGPT的問世,除了展現令人驚豔的回答能力外,卻也有AI模型架構缺乏安全性、資料不真實等隱憂,需要藉由後續的維護和改良,才能讓ChatGPT發揮應有的使命,來造福使用者。若能藉由導入MLOps來改善GPT模型源頭的資料模型和資料集,可以讓AI模型的訓練和改良,導入敏捷化策略,才能讓AI模型與時俱進、去蕪存菁。
技術發展背景
現行ChatGPT以GPT 3.5模型為核心,先準備龐大、未經分類的「訓練前資料集(Pre-training)」,再經由轉化器(Transformer)將資料集的Raw data進行反覆訓練,並基於正確答案來提升再次訓練的準確率和匹配率;最後,這些訓練出來的資料就銜接到「指引式GPT(Instruct GPT)」介面,讓訓練出來的結果結合人類語法來造樣造句,藉此將正確答案的片段,拼湊為完整的對話語句,才會使GPT成為具備模擬真人對話的ChatGPT。
圖 1:ChatGPT運作簡圖
資料來源: (Cuofano, 2023)
技術介紹與應用現況
隨著GPT的資料輸入量不斷膨脹,ChatGPT也面臨到答題失準、失控的狀況;有鑑於此,為逐步糾正ChatGPT的錯誤答案,早期採用人工評分(點讚、倒噓)的方式,提升正確答案的準確度和匹配度。
若要從源頭資料集來強化GPT的品質和準確度,可藉由導入MLOps的方法,在最源頭的ML循環,建立資料模型、打好基礎;接著再進入Dev循環,進行資料模型的正確性測試,同時採CI/CD管線化部署;在部署上線後,就進入對外運作的Ops循環,除了持續監控資料模型和答案之間的匹配結果外,也能依據使用者意見反饋,來協助資料科學家改良資料模型的品質。
圖 2:MLOps運作簡圖
資料來源: (Khomich, 2022)
未來展望/挑戰
MLOps除了可以用自動化測試、自動化部署的方式,降低人工調校GPT資料模型的麻煩之外,也能夠因應日新月異的最新資料、求新求變的客戶需求,讓資料模型和資料集,能時時自我調整、自我校正。
近期,隨著最新版GPT-4上路,MLOps可藉由此一契機嘗試與GPT-4整合,以先進的開發策略搭配全新的AI模型訓練方式,來提高AI模型的品質,強化AI模型不斷追求快、狠、準的回答速度和準度。
圖片來源:123RF
參考資料
- Chauhan, A. (2021, October 19). MLOps: Basic Standard Principles. Retrieved from Towards AI: https://pub.towardsai.net/devops-e2b28176724d
- Cuofano, G. (2023, February 24). How Does ChatGPT Work? Retrieved from FourWeekMBA: https://fourweekmba.com/how-does-chatgpt-work/
- Khomich, A. (2022, April 11). Why Machine Learning Solutions are Difficult to Implement without Machine Learning Operations? Retrieved from Product Coalition: https://productcoalition.com/why-machine-learning-solutions-are-difficult-to-implement-without-machine-learning-operations-674385693733
膚質好不好一試便知,肌膚檢測有一套!
FIND研究員:曾雅鈴 面對百貨公司專櫃、開架門市琳瑯滿目的保養品,總是讓人「選擇困難症」大發作,即使爬遍網路上的保養分享文,仍舊不確定哪個保養品是自己的蜜糖還是毒藥。化妝台上的瓶瓶罐罐,有的針對美白、有的針對保濕、有的針對抗老等等,>
IFPI全球音樂報告出爐,2023流行音樂產業趨勢一次看!
FIND研究員:李盈瑩 【IFPI公布最新全球音樂報告:2022年全球音樂收入成長9.0%】 國際唱片業協會(IFPI)近日公布2022年全球音樂報告,報告中顯示2022年在付費訂閱串流音樂成長的推動下,全球音樂市場的收入提升了9個百分比,總收入為262億美元,又以串流音樂為收入比例最大宗,>