新聞中心

EEPW首頁 > 高端訪談 > 學AI之路,從探索特征出發

學AI之路,從探索特征出發

作者:高煥堂時間:2019-10-29來源:電子產品世界收藏

  高煥堂 (臺灣VR產業聯盟主席,廈門VR/AR協會榮譽會長兼顧問)

本文引用地址:http://www.crmfjg.tw/article/201910/406449.htm

  摘?要:的基礎活動之一就是。本文通過舉例和比喻來領悟特征的含義,以及理解特征提取的方法和目的。而且,從人為的特征提取,開始思考由機器自動的途徑,邁向深度學習之路。

  1 從認識特征出發

  1.1 以狗和兔子為例

  據說古代有一位小公主(例如大清時代的格格),常常到荒郊野外去玩,攜帶一只狗去出行。為什么她要攜帶狗呢? 因為狗兒天生就最熟悉兔子的特征,而且兔子的特征也最吸引狗兒們,所以狗兒喜歡又擅長于探索(抓)兔子了。因此,很快就能帶回幾只兔子。

  話說有一天,小公主(格格)也想要幾只老鼠,她就攜帶著貓出行。因為貓兒天生就最熟悉老鼠的特征,包括老鼠的味道、長相、習性等。所以貓兒喜歡又擅長于探索(抓)老鼠。因此,也很快就帶回幾只老鼠。

  所以,聰明的格格會借助于熟悉兔子特征的狗兒去探索荒郊野外的兔子;也懂得借助于熟悉老鼠特征的貓兒去探索荒郊野外的老鼠。

  1.2 以公主和帥哥為例

  于此,茲拿“小公主(格格)找心儀的帥哥”來做比喻。現在,有一位小公主想要交男友、談戀愛了。小公主出去走走,驚動帥哥們,或請人介紹一些帥哥們。

  于是,小公主就來識別一下他們的人品、財富、學問等特征(Feature)。在小公主的心中,對于人品、財富、學問等自有她的衡量權重(Weight)的。然后,小公主將其心中的評比結果告訴了媽媽。小公主也依據一樣的評比模式,來評比每一位帥哥。此時,精明的媽媽可能會提出她的看法來教女兒,眼睛要雪亮一些。甚至,媽媽覺得這樣似乎還不放心,就派兩位丫鬟去幫忙識別一番。

  剛才的丫鬟們是經過學習,而學會幫忙去衡量帥哥們的各種特征值(如人品、財富、學問等),再告訴小公主,然后告訴了媽媽。到了今天,(人工智能)日益普及了,也可以通過(ML)來訓練AI的丫鬟們,甚至訓練AI的格格,來幫人類格格更精確地衡量帥哥們的特征值。

  2 特征范例1:玩具兔和玩具熊

  我喜歡電視劇里的格格的氣質,所以就拿格格與玩具來做比喻。例如,這格格有4只玩具兔和玩具熊 [1]

  所謂特征就是某種事物的特色,讓人們(或其他生物)很容易憑它區分出來。例如,兔子的特征就是:耳朵長長的、身體輕盈短小。而熊的特征則是:耳朵短短的、身體有些笨重。

  由于這位格格身邊有兩位丫鬟,格格就請丫鬟A去量一下這些玩具的耳朵長度,就可以得到“耳朵”特征值了。格格也請丫鬟B去量量這些玩具的體重,就可以得到“體重”特征值了(如圖1)。

微信截圖_20191111140417.png

  3 特征范例2:阿拉伯數字“2”和“7”

  此范例摘自《不編程,而學AI:Excel+TensorFlow》 [1] 。其中,有2個阿拉伯數字的字型,其可分解為3個筆畫的組成元素:X0、X1和X3。我們可以按如圖2來提取其特征值。

微信截圖_20191111140444.png

  此時格格找來3位丫鬟,并交待如圖3。

微信截圖_20191111140510.png

  于是,得到全部字型的特征值了,如圖3。

微信截圖_20191111140529.png

  4 特征范例3:局部感受野

  剛才的兩個范例,其感受野(Receptive field)都是整張圖片。在本范例里,則把它縮小一半(如圖4)。

微信截圖_20191111140821.png

  此時,格格對身旁的兩位丫鬟交代如圖5。

微信截圖_20191111140846.png

  于是,針對第1個字型,丫鬟A在上半部發現了橫線筆畫,所以得到特征值是1;同時也在下半部發現了橫線筆畫,所以得到特征值是1。丫鬟B在上半部發現了(反)斜線筆畫,所以得到特征值是1。同時,也在下半部發現了斜線筆畫,所以得到特征值是1。然后,把兩人提取的特征值,排成一列(Flatten),如圖6。

微信截圖_20191111140909.png

  接下來,繼續去測量第2個字型,提取了它的特征值。這時候,針對第2個字型,丫鬟A在上半部發現了橫線筆畫,所以得到特征值是1;但在下半部沒有發現到橫線筆畫,所以得到特征值是0。

  丫鬟B在上半部發現了(正)斜線筆畫,所以得到特征值是1。同時,也在下半部發現了斜線筆畫,所以得到特征值是1。所以得到特征值是1。然后,把兩人提取的特征值,排成一列(Flatten),就得到全部字型的特征值了,如圖7。

微信截圖_20191111140945.png

  5 特征范例4:阿拉伯數字“0”~“9”

  于此,基于剛才范例3的特征提取模式,把原來的兩個字型,擴大為“0”~“3”共4個字型,如圖8。

微信截圖_20191111141005.png

  此時,仍然由3位丫鬟分工去,如圖9。

微信截圖_20191111141022.png

  于是,針對第1個字型,丫鬟A在上半部沒有發現橫線筆畫,所以得到特征值是0;但在下半部則發現了橫線筆畫,所以得到特征值是1。丫鬟B在上半部沒有發現正斜線筆畫,所以得到特征值是0。但是在下半部發現了正斜線筆畫,所以得到特征值是1。丫鬟C在上半部沒有發現反斜線筆畫,所以得到特征值是0。但是在下半部發現了反斜線筆畫,所以得到特征值是1。然后,把3人提取的特征值,排成一列(Flatten),如圖10。

微信截圖_20191111141040.png

  依序下去,就可以得到全部字型的特征值了,如圖11。

微信截圖_20191111141059.png

  然后,繼續加以擴大為“0”~“9”共10個字型,如圖12。

微信截圖_20191111141117.png

  此時就可以得到全部字型的特征值了,如圖13。

微信截圖_20191111141136.png

  6 結束語

  在以上的范例里,是由人類(3位丫鬟們)去提取玩具或字型的特征值。這些丫鬟們愈有經驗、或愈訓練有素時,其提取特征的準確性會愈高。如果我們也能訓練AI機器來代替這些丫鬟,以便由AI機器來自動提取特征,那將是一件美好的事。這意味著,得到一個新觀念:AI的丫鬟們是可以訓練的,只要訓練AI去認識小小的特征,則一群AI的丫鬟將可以代替人類去復雜的情境(街景照片)中尋找特征值。

  參考文獻

  [1] 高煥堂.不編程,而學AI:Excel+TensorFlow.臺灣:廣悅文化事業有限公司,2018.

  本文來源于科技期刊《電子產品世界》2019年第11期第81頁,歡迎您寫論文時引用,并注明出處。



評論


相關推薦

技術專區

關閉
山西快乐扑克