跳到主要內容區

[訪談] AI 與文字處理

文字處理

   受訪人:資訊工程學系 蔡崇煒教授   
   組別:第 3 組   

   訪問組員:   
       
B051010015 黃詩宜   
       
B062040039 張致維   
       
B064011032 林志威
       
B066090002 石楷圻   

蔡崇煒老師作品
圖. 蔡崇煒教授親手繪製的作品
   關於 AI 與文字處理   

1. 對於初學者,老師認為我們該如何理解 AI 與文字處理的關係呢?文字處理有哪些面向?這個領域遇到最大的困境是什麼?  

AI 與文字處理的研究已經進行數十年,而文字處理主要可以分為兩個部分理解:一、網路關鍵字的搜尋結果與排序、二、語意分析。前半部意旨搜尋資料庫中與輸入之關鍵字相關的資料,以及透過演算法決定如何將每筆資料前後排序的過程。後者表示其判讀文字意涵的功能,發展至今已可以分析文章內容中特定詞彙的正面、負面意涵,進一步理解文章大意。這項技術也為應用於分析政治宣傳的內容,或是展現政治立場的文章,然而目前仍然無法完整分析文字背後所隱含的語意,如反諷等用法,因此還在努力完善這些功能,以求更精確的判斷。

2. AI 與文字處理的技術可以幫助閱讀論文作品嗎?  

雖然 AI 目前能夠輔助找出文章的分類標籤,找出一定數量的關鍵字,然而效果卻不好。由於許多時候是依文章中特定詞語出現的次數來判別其重要程度,而找出的這些詞彙往往不具特別意義,因此如何應用AI精確地幫助長篇文章的判讀,還續要更多的突破,但是這的確是於未來可以預見的技術。

3. 國外有 Grammarly 協助修正英文文法與詞彙,那老師認為中文的版本可行嗎?中文和英文最大的差別和困難點是?

中文相較於英文有更複雜的語法,一個詞彙往往具有多樣的意思,如「天」就可代表天氣、每天,天然等詞彙。除了每個字與不同字組合,同樣的兩個字組合順序調換,就會產生極大語意的差異,如「天上」、「上天」等。因此運用這項技術於中文語意分析,或是研發如 Grammarly 等軟體糾正中文文法是困難許多的。許多研究團隊已和語言學家合作,希望對於相關面向有所突破,才能做到精確的辨識。

4. 老師能否和我們淺談 Facebook DeepText 的相關概念? 

大略而言 DeepText 具有於 Messenger 打字聊天時,進行補字的基本功能,然而臉書發展 DeepText 的更深層目的應是幫助蒐集使用者的數據,透過掌握聊天內容,了解打字者所提及的主題、物品等,以精準提供相應的廣告。假使使用者輸入了某關鍵字,之後便可能於臉書看到相關的廣告。老師也說道:不須付費的事物常常就是要錢的事物,只是我們用隱私權或其他方式換取。

5. 由於老師的研究領域也包含物聯網(IoT),想請問物聯網和 AI 文字處理如何結合,成為新趨勢?市場前景和規模有多大呢?  

物聯網的部分研究來自於無線感測網路,最初的無線感測網路的許多應用是戰場資訊蒐集。
物聯網的提出主要是將各項設備連上網路,因此許多研究無線感測網路的學者就投入物聯網這個類似的領域,
進一步提供更貼近使用者需求的服務,近期更被應用至我們生活上的各式資訊設備與系統。

未來的這樣應用的發展方向非常廣泛,除了家電,甚至是智慧電表等都是相關範疇,只要能夠將這些裝置連上網路,廠商便能藉由傳遞回來的資訊集合成龐大的資訊系統,了解用戶消費、生活習慣等。以智慧電表為例,這項裝置使發電廠清楚掌握用戶何時會開啟冷氣、空氣清淨機,又或是家庭用戶的電量需求何時會是高峰等,進而降低電力傳送的耗損率,將電力精準地於適當的時間配送至需要的地方。然而,這也會造成一些個人隱私問題,譬如廠商便會了解客戶何時會外出等,對於個人的居家安全以及隱私都會有影響。

   關於老師   

1. .我們發現老師的興趣是繪畫,想請問老師從什麼時候愛上繪畫?  

老師從小時候就喜愛畫畫,即便現今生活相當忙碌,繪畫時間很少,但老師也鼓勵我們即便未來日漸忙碌、成家立業,也要保有一項可以自在投入的興趣,經營一個不為其它事務干擾的小天地。老師也和我們分享辦公室的畫作,以及每幅畫背後的小故事,封面頁所放的作品即是老師為於中山舉辦的 2020 IEEE Sensors Council Summer School 所畫。

2. 老師如何在研究和休閒之間分配時間和精力? 

老師分享道:目前他忙於研究、教學,於生活中扮演著不同的角色,每個角色都需要投注時間,而他透過善用零碎時間完成不同角色所賦予的任務。生活當中往往會有一些零碎破碎的時間,可能只有 10~15 分鐘,通常於這些時候,我們可能都會滑起手機,然而,如果能在這些破碎的時間內,找到一兩樣自己喜愛的事物,並且於這些破碎的時間內進行這些嗜好,或許就能讓人生變為較為充實。

 

瀏覽數: