我喜歡展示的是人工智能如何在我們周遭世界的隱藏結構上發揮作用。幾乎所有的事情都是可以量化的,因此可以用統計關係來描述 - 如果 X 則 Y。我們目前所看到的人工智能熱潮,是透過網際網路更容易取得(且可靠的)資料、運算能力提升,以及長達十年之久的聰明且有效率的資料分析演算法發展的結果。僅此而已。
2024 年 1 月 10 日
人工智慧與製錶 - 簡介
Marcus Siems @siemswatches
收藏家、作家、資料分析師
人工智慧與製錶:
- 簡介- ChatGPT 專訪- 社區展望-
人工智慧是我們生活中越來越受關注的現象。它越來越多地從抽象的專業領域進入我們的日常體驗和日常生活。在鐘錶界,我們也發現越來越多的相關報導(例如[這裡]、[這裡] 、 [ 這裡 ] 或[這裡])。所有這些發展通常都會引起熱烈討論......大概有兩個主要原因:
首先,看到製錶這樣一個傳統且歷史悠久的產業開始大規模使用 AI,在它看似不經任何改變地穿越時間數個世紀之後,我覺得很不真實。其次,因為我們 99.9% 的人 (包括我在內) 在 ChatGPT 之類的工具上輸入查詢時,其實並不知道發生了什麼事。
AI 生成的 (DeepAI) 人工智能在製錶業工作的圖像。
即使 人工智能是我們最先進的科技之一,但它也帶來了神祕的一面。大概就像人們第一次面對我們的世界完全由微型粒子組成,或是我們的大腦(也就是我們自己)是透過電子化學電路運作的這些發現時的感受一樣。我們首先必須相信個別科學家,然後才有機會了解整個社會。
然而,只要人工智能還停留在神話生物的領域,我們就無法評估新的鐘錶應用程式(無論是網站、設計或工具)是真正的新穎、潛在的實用,還是只是玩具。我們就像桃樂絲(Dorothy)一樣,跟著人工智慧的磚塊路,去找任何承諾我們想要的巫師。但請讓我們看看紅鞋!相反地,讓我們在這項工作中,嘗試更好地了解什麼是 人工智慧是什麼,以及它可以用來做什麼。
"Machine Learning Captcha" by Randall Munroe (xkcd).
1) 人工智慧 - 意義
我想很多令我們敬畏的力量已經在名字裡了。智慧可能是我們人類與自己關係最密切的特徵之一,也是我們認為有別於動物界其他動物的特徵之一[1]。這個詞的分量很重。但是,我們對這個詞的認同與人工智能研究和應用的實際成果可能會有很大的差異。
因為從實用的角度來看 人工智能所做的就是根據它所訓練的資料來預測結果(下文將詳細介紹)。換句話說,它是一種識別和量化模式的統計方法。僅此而已。從這個角度來看,它確實可以像人腦一樣運作。我們也會在周遭的世界中尋找模式,一旦找到了,我們就很難再看不到它們了。下面以大麥町犬為例:
黑白飛濺 - 您能找出大麥町犬嗎?照片來源 Michael Bach 資料庫.
當第一次看到這張圖片時,一切看起來都像是隨機的黑白斑塊。到了某個時刻,畫面會出現一些結構,例如背景中的樹木、道路和潛在的樹葉。狗(一隻大麥町犬)很難找到,但一旦你看到它,你就再也無法不看到它了。然而,那是您的大腦為黑色斑塊之間的空白區域安排了秩序...嚴格來說,根本就沒有狗。
這種模式識別 - 即使是在抽象層面上 - 也不是智慧,而是一種聯想。無論是點和狗之間的聯繫;太陽出山和溫暖的感覺;手錶市場和零售價格上升;人的身高和體重等等。因此,它可以被更好地理解為學習 - 或者用更常用的術語來表示用來產生人工智能的方法,即 機器學習.我覺得這種說法更能抓住精髓。不需要高度發達的生物(或機器)來建立聯想和學習......它只是兩個事物之間的統計關係。
和狗待在一起......即使是完全隨機的刺激也可以配對並聯繫起來。我們(希望)都從高中時就知道古典條件作用,而 Ivan Pavlov 在 1897 年就已經報告過這種統計學習的形式。照片來源 溝通理論.
2) 人工智慧 - 基本知識
機器如何「學習」? 人工智能[2]?我認為這可以歸結為三個主要成分和步驟:
- 訓練資料
- 預測變數
- 連接兩者的模型
這樣細分下來,就不像魔法了,對吧?不過,讓我們把這三種成份的意思說得更清楚一點,然後玩一個遊戲......我的手錶值多少錢?
如果您不僅在理論上對這個問題感興趣,我們也為您提供了..."為您的古董錶估價的 4 個技巧:初學者指南" - 一個關於啟發式方法的視頻,由 Felix Goldammer.
首先,預測......它可以對任何您想要描述的未知事物進行預測:下棋時該走哪一步、您面前的人是否生病了、對您的問題的正確回應是什麼、這款新手錶的設計會成功嗎?或者就像我們這裡的小例子一樣:我的手錶值多少錢?這裡唯一重要的是,您所問的語意問題可以有量化的答案(在此:以歐元為單位的價格)。
第二,要預測結果,您需要相關資訊。例如,一隻古董錶值多少錢取決於它的狀況、稀缺性、複雜性、品牌聲譽等等。重要的是,您不能接受任何類型的資訊......例如錶帶的顏色或設計師母親的娘家姓氏在此並不重要。
第三,輸入資訊與輸出預測之間的連結。這第三部分就是我們經典上稱為 機器學習因此也是人工智能的核心部分。此連結(或模型)需要在輸入資訊的基礎上進行訓練,在我們的例子中,輸入資訊包括數款手錶及其各自的已知價格。因此,我們可能會看到 平均來說- 狀況較好的腕錶價值較高。某些品牌較受歡迎,價格也較高。
當您問 復古風 估價腕錶時,什麼是最重要的:"狀況,狀況、 狀況!".照片來源 Esquire.
這是機器學習到的市場因素與手錶價格之間可量化互動的語義描述。對於 OpenAI 和 ChatGPT 或圖片產生 AI 來說,這是非常簡化的描述,但其核心也是如此*。但我們稍後會談到這些應用。
3) 人工智慧 - 不同的模式
現在讓我們快速進入中間部分 - 機器學習模型及其假設。有許多方法可以從一組資訊中推斷出結果。最簡單的就是單調(有時是線性)的關係,舉例來說:狀況越好的手錶價格越高:
圖 1. (玩具-)範例情境,其中 機器學習 可應用演算法。彩色點代表單一腕錶,虛線代表演算法的預測。根據狀況逐步預測價格(左),並根據情感依戀和每塊腕錶的佩戴時間(右)預測保留/出售腕錶的邊界。描述的資料是虛構的,僅用於輔助上下文。
圖中的虛線描述了模型預測。例如,它可能是 1 對 1 的線性關係,價格 = 條件 * 常數。也許在線性關係之外還有一些影響,而我們的關係是相當指數化的 - 如果您稍微增加上端的條件,就會大幅增加價格...這種價格與條件之間的確切關係是可以在過程中學習到的...從機器**...
4) 人工智慧 - 現代演算法
我剛才介紹的這些簡單方法都有百年歷史了,是我們現代人工智能經驗的基礎。最早的大規模應用機器學習是在第一次世界大戰期間......Charles Spearman 引進了因子分析來簡化大量的心理問題和任務,並定義了--有趣的是--智力的一般參數[3]。這個首次量化的智力參數被用來評估英國士兵,並在他們的軍隊中尋找超越古老但仍然盛行的貴族制度的合適軍官。
您可以找到"人工智慧簡史" 涵蓋 BootstrapLabs 過去 70 年的主要開發成果 這裡.
20 世紀 70 年代和 80 年代,使用這些方法稍作修改的應用程式被引入 - 人工神經網路****。在這裡,輸入物件的所有特徵都會經過加權(模型)來預測反應。舉例來說,我們有一隻手錶,它有幾個特徵 - 尺寸、年齡、材質、狀態、品牌等。- 我們將這些特徵組合起來稱為一個層。透過對這些特徵進行加權,我們可以(在優化的世界中)估計出它的最佳銷售價格。因此,這是上述線性估算的延伸。
圖 2.單層人工神經網路架構示意圖。此架構只是為了描繪一種直覺,底部的「層名」是記憶輔助,而不是約束或實際的建模結果。
這個非常簡單的「架構」能夠將輸入(一隻手錶)與輸出(其價格)相關聯...同樣地,這種關係是經過成千上萬只已知價格的手錶學習後,才能應用於預測資料庫中尚未出現的手錶價格。此外,它總是會包含一些誤差,也就是未知的參數,例如拍賣競投人的情緒。
現在想像一下,您並非只有一層直接提供輸出,而是這一層將其資訊饋給另一個「更深」的層。更深的一層定義了特徵之間的關係,之後的另一層定義了特徵之間的關係,之後的另一層定義了特徵之間的關係......每一層都透過前一層的特徵關係來總結和抽象其輸入...
圖 3. 具有數個「隱藏」層的人工神經網路架構示意圖。此架構圖僅為描繪直覺,底部的「層名」僅為記憶輔助,並非限制條件或實際建模結果。
您也可以從語言的角度來思考每層和每個抽象 (大型語言模型).第一層描述字母,第二層是字母之間的關係,因此是「音節」。第三層是音節 -> 單字之間的關係,第四層是單字 -> 詞組或句子,然後是段落和抽象意義*4。這些抽象概念 - 也可以從演算法中學習而不受限制 - 是這些「深度神經網路」相較於下列領域的所有技術的主要優勢 人工智慧的主要優勢。
對於人工智慧的深層結構,2010 年 Christopher Nolan 電影《Inception》的情節是一個很好的比喻。再往下的每一層就像是夢境中的另一個夢...每做一個夢都會變得更荒誕、更超現實。照片是 Christopher Nolan 本人手繪的電影劇情結構。
當然,這些不同層次的標籤純粹是示意性的。字詞、句子和段落是我們可以從日常經驗中掌握的實體。但是,統計模型會建立非常抽象的表達,而不會遵循我們受限的理解。儘管如此,這些深層次的抽象正是我們能夠與 ChatGPT 及類似演算法進行對話的原因[4]。這表示演算法不需要曾經看過特定的段落、句子或問題,就能理解其意義,因為它可以從其他文字片段中找到元關係。
然而,您可以想像,要達到這一點,您需要大量的處理能力和文字資料,才能讓演算法學習和運作。例如ChatGPT 3.5(免費版) 已經在數千個 GPU 上使用書面文字、書籍和網站訓練了好幾個星期甚至幾個月,最後還整合了數千個人類操作者的回饋。
5) 人工智慧 - 結論其本質
因此,我想大家現在都鬆了一口氣,因為我們已經完成了這一章相當緊張的方法論。然而,我希望我能傳達 人工智慧和 機器學習1) 並非新事物;2) 其核心是「簡單」的預測模型;3) 並非機器人霸主賜予我們的神奇工具,藉由提供書籍摘要和產生寵物的蒸汽朋克圖像來分散我們的注意力。
由 AI 產生的影像 (DeepAI),「幾個手錶齒輪系與電腦電路一起工作」。
更寧願 人工智能人工智能的工作原理是我們周遭世界的隱藏和潛在結構。幾乎所有的事情都是可以量化的,因此可以用統計關係來描述 - 如果 X 則 Y。我們目前所看到的人工智能熱潮,是透過網際網路更容易取得資料、運算能力提升,以及數十年來巧妙且有效率的資料分析演算法發展的結果。僅此而已。
在下一部分中,我想詳細討論現代人工智能在我們所愛的鐘錶世界中能做什麼、不能做什麼。為了幫助這一主要是推測性的討論,我也訪問了幾位鐘錶領域的專家,他們過去都與科技界有一些重疊。這一定會很有趣!
* 對於過度簡化,我深表歉意。
** 透過巧妙的分析方法,但不完全是智慧[1]
*** 碳和矽大腦之間有幾個經驗上的差異 - 但我們先不談這個。ANN 可能(充其量)被稱為生物功能的簡化模型。
*4您也可以從視覺/影像處理的角度來思考類似的抽象層次。第一層是限制在某個位置的光/暗邊緣,下一層可以是角度,再下一層是更多更複雜的形狀,可以在場景的任何地方找到,最後一層是物件的身分,甚至可以獨立於呈現角度等等。
參考與建議閱讀
[1][建議]On Intelligence; Jeff Hawkins & Sandra Blakeslee, St. Martins Griffin Publishing, New York;
[2][推薦科幻]Foundation Trilogy(1942-53); Isaac Asimov, Gnome Press;
[3] The proof and measurement of association between two things(1904); Charles Spearman, Am.J. Psychol;
[4][推薦]《最人性化的人類 -人工智慧教我們如何活著》;Brian Christian (2011),主播;
文字和圖形的所有權利均歸作者所有。
1 評論
Merci pour l'effort et la qualité d'analyse.
發表評論