第1949章 成精(1 / 2)

 都市種田 / 都市 2202 字 2023-05-04

特德姜講了一個堪比他寫的科幻小說般的故事。

“這個事情我是從一個計算機科學家朋友大衛·克里賽爾那裡聽到的,他接到鍀國一家建築公司的求助,說他們公司的施樂複印機出現了一些奇怪的問題。當他們在複印一個房子的平面圖時,副本和原件之間總是會存在微小但無法忽視的差異。原件中,每棟房子的三個房間都有個矩形來說明它們的面積,房間分別是14.13平方米、21.11平方米和17.42平方米。然而在複印件中,所有三個房間都被標記成14.13平方米。”

劉玉琨聽過這個故事,露出神秘的微笑。

李睿和妲露拉卻覺得不可思議,複印機不就是應該把原件原原本本的複印下來嗎,為什麼複印件會和原件之間出現如此奇怪的差異呢?

如果不是內部程序出了問題,就只能是複印機成精了?

特德姜繼續道:“那家公司對複印機進行了全方位的檢查,沒有發現任何問題,最後只能求助於大衛。大衛去看了一下,發現這是一臺採用了數字掃描文檔然後打印生成圖像文件的現代複印機,而在掃描和打印的過程之間,複印機內部程序會把每個數字圖像文件進行壓縮,問題就出現在壓縮環節中。”

“我們都知道,壓縮分為兩種,一種是無損壓縮,另外一種是有損壓縮。無損壓縮恢復的文件和原始文件相同,而有損壓縮恢復的文件只是原始文件的近似值。這臺施樂複印機使用了一種被稱為jbig2的有損壓縮格式,是一種專為黑白圖像而設計的,非常節省空間的技術格式,複印機會識別圖像中看起來相似的區域,並將所有這類區域存儲成一份副本。當文件被解壓時,複印機會重複使用該副本來重建映像。結果就是,複印機判斷出指定房間面積的標籤非常相似,所以它只需要存儲其中那個14.13平方米的房間,並且在打印時,對所有三個房間都重複使用這一個標籤。”

“原來如此。”李睿和妲露拉明白了。

看來不是複印機成精了,還是內部程序的設計有問題。

看上去,一臺複印機疑似成精的故事和人工智能之間沒什麼直接聯繫,複印機內部採用的壓縮技術,才是這個故事的關鍵。

特德姜繼續道:“大衛把這個問題指出來,並且聯繫了施樂的工程師,想必他們很快就會通過補丁來解決這個BUG,而我則從這個故事中,發散想到了其他的問題。我們一直認為複印機只是完整的複製原件,但在數字時代,它卻採用了一種微妙而模糊的方式來解決複製問題,它製造的副本看起來準確,實際上並不準確。我們正在研究的人工智能,是不是也可以採用類似的方式來發展呢?”

“發展不準確的複製?”妲露拉驚訝的問道。

特德姜笑了:“當然不是。”

他頓了頓解釋道:“據我所知,微軟谷歌還有其他一些公司正在研究語言模型,希望人類和機器能夠通過某種方式進行溝通和對話,這就需要為機器準備極為龐大的數據庫,最好是能夠把整個萬維網儲存下來供機器調用。”

開局同學會上中獎兩億五千萬最新線上免費閱讀