跟上語音辨識!臺灣語音辨識應用近況─資策會 FIND科技報─智邦公益電子報
enews.url.com.tw · December 19,2024跟上語音辨識!臺灣語音辨識應用近況
FIND研究員:陳文濤
日用科技產品持續往貼近人類使用直覺的方向前進,從鍵盤、觸控螢幕、到近期不斷發展的語音辨識。而語音辨識這種較先進科技應用,事實上已經漸漸在臺灣「落地」,無論是國外廠商向臺灣進軍,如Google Assistant的臺式中文語音辨識、或是國內廠商自行研發,如遠傳愛講、雅婷逐字稿等,都推出了適用於臺灣用語的語音辨識應用。
【適合臺灣的語音辨識】
以語音使用科技產品,通常是比手動輸入訊息還要直覺的方式,因此包含如Siri、Alexa的語音助理、或是依此發展,已經在全球掀起第一波競爭的智慧音響、或很可能成為下一波競爭市場的智慧家庭用品等等,都是奠基於語音辨識的應用。
而雖然最初的中文語音辨識,是較接近為中國腔的辨識,但事實上從去(2018)年開始,已經有許多廠商注意到臺灣語音辨識的需求,並也慢慢出現臺灣腔、臺灣用語習慣的中文語音辨識。如去(2018)年10月Google Pixel 3手機登臺發表會時,就展現其能流暢的理解臺式中文、並結合Google其他的功能將其應用擴大,包括查詢天氣、匯率兌換、翻譯詢問等等。
【臺灣語音辨識:臺灣智慧音響,遠傳愛講再推「小狐狸」】
而除了Google這種大廠進軍臺灣的例子以外,也有不少臺灣廠商自創的語音辨識應用。其中遠傳的「愛講」語音助理,內建於去(2018)年6月開賣的「問問智慧音響」中,算是開啟臺灣智慧音箱市場的第一槍。而其更在周一(14日)推出攜帶型智慧音箱「小愛講」以及「小狐狸」,兩者皆內建電池、且不超過300公克,適合外出時使用,並依然保留聲控家電、查詢資料等功能。
【臺灣語音辨識:聽打逐字稿實用工具,「雅婷逐字稿」】
而臺灣人工智慧實驗室(AI Labs.tw)也在去(2018)年底推出了聽打逐字稿APP「雅婷逐字稿」,已在蘋果的App Store、以及Android的Play商店上架供人下載使用。而在對演講影片作測試的影片中可以看出,雖然其依然存在一定的出錯率、也還沒有自動插入標點符號的功能,但其可以自動分段、而且可以看出,其在持續接收語音的同時,會根據後文來改變前文、並且在錄音時是將錄音檔與逐字稿一同儲存下來,讓使用者可以事後再依照逐字稿需要修改的地方聽原始稿手動修改。這些功能,讓還不臻於完美的雅婷逐字稿,具有一定程度的實用性。
【威盛推臺語語音辨識、信望愛基金會推雙語口說練習】
威盛電子在去(2018)年五月,成功在其研發的OLAMI語音助理中推出臺語辨識功能,可以說讓語音辨識這項技術,確實的在臺灣「落地」。
而除此之外,由威盛董事長陳文琦與宏達電董事長王雪紅創辦的信望愛基金會上、專門提供學生線上學習的平台「LearnMode學習吧」,也在今(2019)年,正式新增AI英語口說辨識功能。只要上網搜尋學習吧,點選「雙語教學功能體驗課」,就可以在網路上免費練習說英文,並有AI語音辨識系統評分,而除了英文單字、句子、短文練習外,也保有原先的中文唐詩朗讀練習,達到雙語教學。是除了臺式用語的語音辨識之外,另一個針對臺灣用戶提供服務的應用。
【總結】
語音辨識很可能是下一代日用科技產品的必備技術,以確保使用者在日常生活時,可以直覺的、無障礙的使用這些產品;而當日用科技產品的語音辨識發展成熟,則可能帶來全新的使用者習慣、改變產業動態。
因此無論國內外的科技業,都積極拓展語音辨識的技術。而雖然臺式用語的語音辨識起步較晚、導致語音操控在臺灣還沒有培養普遍的使用者習慣,但已有不少科技業者、研究者都已經對此推出實際應用,跟上語音辨識與操控的進展。
*註:資料優格將於近期發布「AI調查 - 語音助理專題報告」,敬請期待。
資料來源:
封面圖片:https://www.mobile01.com/topicdetail.php?f=18&t=5493673
內文資料:iThome / 中國時報 / yahoo新聞 / 聯合新聞網 / 學習吧 / OLAMI / RelaJet / 科技新報
AI助聽器!即時翻譯、追蹤身體狀況、過濾噪音
FIND研究員:陳文濤
AI已經落實到一些科技產品之上了,其中也包含了AI與聽戴式裝置的結合。專攻聽力設備的美國公司Starkey Hearing Technologies,推出了兼具配戴者動作偵測並兼具翻譯功能的助聽器;而臺灣新創公司「RelaJet洞見未來」,推出了擁有多人聲辨識技術,改良傳統助聽器的不舒適。
【Livio AI助聽器,兼具身體健康追縱與翻譯功能】
Starkey成立於1967年,參展今(2019)年的消費型電子展,推出與AI做結合的助聽器Livio AI。這款助聽器除了幫助收聽以外,還裝載了活動追蹤感應器,故其可以偵測使用者的活動狀況;另外,由於聽障者常常會有心血管疾病的併發狀況,因此Livio AI也裝載了心率感測器,以監聽配戴者的心血循環。而這兩個感測器所偵測到的數據,都可以連線至行動裝置的APP以計算使用者的健康狀況。
由於耳朵裡有幫助人平衡的部位,因此聽力受損的聽障者,摔跤風險機率是常人的三倍,而且較需要配戴助聽器的高齡客戶也較有摔跤的風險。因此透過活動感應器,若配戴者不慎摔跤,Livio AI可以即時偵測並透過配戴者的授意,直接傳訊息給指定的救護單位,或是由派戴者指定的傳訊對象,以確保配戴者得到好的照護避免更嚴重的身體或經濟損失。
除此之外,Livio AI還支援了27種語言的即時翻譯功能,它可以依使用者設定,在收聽到不同語言時將之轉為英文或是在聽到英文後將之轉換為不同語言,讓配戴者聽到其設定的語言。另外,為了更貼近較需要助聽器的老人市場的需求,針對老年人較不會使用Email或較不熟悉手機的操作,該感測器所專用的APP也結合語音辨識轉換為文字後,再連結通訊軟體傳訊的功能,讓老年使用者可以在不用離開此APP,也能以語音轉換為文字傳訊、省去手機操作障礙。
最後,搭配AI的Livio AI也有語音助理的功能。其可以連上網,讓使用者可以用語音查詢各地天氣狀況,而助聽器則會發出語音訊息以回覆問題。
【RelaJet多人聲分離,幫聽障者專注特定聲音】
本站在《跟上語音辨識!臺灣語音辨識應用近況》一文中,提到臺灣發展在地語言的語音辨識,除此之外,臺灣將語音辨識與聽戴式裝置結合的應用也有發展。去(2018)年剛成立的RelaJet洞見未來,與Starkey一樣,也帶著自己的助聽器產品進軍CES參展。創辦者陳柏儒本身是個聽障者,因此相當了解配戴助聽器時的困擾:許多傳統助聽器將所有接收到的聲音都放大,讓使用者即使配戴了助聽器,仍難以分辨欲聆聽對象的聲音,這跟聽力正常者可以自動忽略背景噪音、專注於單一對象的能力有所差距。
為此,RelaJet團隊提供解決方案:利用AI來辨識欲聆聽對象的聲音特徵,將其與其他聲音進行分離,並獨立放大該音軌,讓RelaJet配戴者得以依此專注於欲聆聽對象所發出的聲音。而且RelaJet分離聲音並放大的運算過程,將能在10毫秒之內完成,這已經達到一般助聽器放大聲音的標準,使人耳不會感受到延遲、而有不適的現象。
而由於美國食品藥品監督管理局(FDA)將於2020年開放「非處方助聽器」上路,不但大幅降低實驗及認證成本,有助於助聽器平價化、而且開放購買管道,可以避開原處方助聽器買賣的繁瑣程序;而RelaJet技術也預計將在今(2019)年第一季正式導入於客戶產品。未來預計要與全球語音資料庫進行整合,瞄準歐美語系、讓AI為其中不同語系的語音辨識做出校準;並瞄準在歐美市場占有95%市占率的六大品牌、預計將多人聲分離的技術導入其中。
【總結】
隨著科技進步,生活上的配戴式裝置產生了許多可能。除了無線藍牙耳機,讓使用者可以在用耳機收聽時,不會如以往一樣因為耳機線而造成活動不適。而AI與聽戴式裝置的結合,則是更進一步的拓展了其功能,包含Livio AI的即時翻譯、身體動態偵測與紀錄追縱或是RelaJet的多人聲辨識技術,使聽障者聽到更貼近他們需求的聲音。這種AI與終端裝置的結合發展,將逐步改善生活的便利性並可能進一步改變人類的生活習慣。
資料來源:
封面圖片:https://chinese.engadget.com/2018/08/28/livio-ai-hearing-aid/
內文資料:聯合新聞網 / 中國電子報 / medgadget / RelaJet / 科技新報
全球電動車概況:各國銷售、禁燃油車、車廠發展
環保意識的高漲,使得電動車的需求愈來越大。隨著許多國家已經明訂禁產燃油車的年份,各廠商也順應潮流推出電動車,包括哈雷、杜卡迪等重機大廠也都紛紛投入電動重機的生產。>
臺灣機車新戰局!電動機車的新三勢力
隨著環保擡頭、法條確立的情況下,電動車漸漸流行於全球,而臺灣也不例外。特別是在電動機車的領域上,在政府的補助推力下、市場漸漸看好,國內機車三巨頭、以及電動機車龍頭Gogoro都紛紛找人合作、加速研發,要在未來新售車輛的市場上站穩一席之地。>