壓縮即智能一一從知識到智慧的實現(xiàn)（20260524）

G.HUANG9605

壓縮即智能一一從知識到智慧的實現(xiàn)黃國營 壓縮即智能。 學(xué)習(xí)即壓縮，理解即壓縮，認(rèn)知即壓縮，語言即壓縮。 壓縮，本質(zhì)是以簡馭繁地構(gòu)建模式，并實現(xiàn)有效的模式遷移。 我們用10篇左右系列文章來討論“壓縮”和“解壓”，從AI構(gòu)建的視角，重新審視人類認(rèn)知形成、運作、發(fā)展的全過程。 我們傳統(tǒng)和現(xiàn)行教育的基本操作主流，就是教師在課堂上向?qū)W生傳授知識，老師講，學(xué)生記。學(xué)習(xí)優(yōu)劣的考核，就是看你記住了多少。人們已經(jīng)初步認(rèn)識到，這種“灌輸-記憶型”的模式，除了在學(xué)生腦子里堆砌大量虛假和無用的知識，結(jié)果往往是缺乏智慧，缺乏行動力，缺乏創(chuàng)新能力。 教育是什么？愛因斯坦說：“當(dāng)學(xué)生把學(xué)校教給他的所有東西都忘掉以后，剩下的就是教育。”這是愛因斯坦引用心理學(xué)家斯金納在《新科學(xué)家》雜志上發(fā)表的說法。這些“剩下的”，會是些什么東西呢？這些東西又是“怎樣剩下”的呢？ 愛因斯坦還曾說：“我從來不記書上已經(jīng)有的東西，我的記憶是用來記書本上還沒有的東西。”那么，“書本上沒有的東西”又是些什么呢？ 知識長期不用是會忘記的，但是能力卻可以沉淀下來；灌輸想法是很容易忘記的，但是教育的熏陶卻可以長久沉淀下來。我們剩下的內(nèi)容越多，那么就說明教育是越有效果的，如果什么都沒有剩下的話，那么這種教育就是無效的教育。 即便是某些“學(xué)富五車”的學(xué)者教授，也可能被人們稱為只是“會行走的書柜”。 知識和智慧不是一回事，那么它們是什么關(guān)系，如何實現(xiàn)躍升呢？ 近年AI爆發(fā)，人們通過對AI的構(gòu)建和使用，窺測其黑箱運作過程，深受啟發(fā)，領(lǐng)悟到很重要的一點：“壓縮即智能”。 壓縮即智能。理解即壓縮，學(xué)習(xí)即壓縮，壓縮即建模，壓縮才能實現(xiàn)知識遷移……AI科技人員越來越多談?wù)摰健按笳Z言模型”從知識到智慧的湧現(xiàn)。 Google DeepMind 明確提出"壓縮即智能"的理念。這一概念建立在算法信息論基礎(chǔ)上，從香農(nóng)信息熵到柯爾莫哥洛夫復(fù)雜度，再到Hutter的壓縮競賽形成了完整的理論鏈條。 最近，香港科技大學(xué)與騰訊聯(lián)合團(tuán)隊發(fā)表論文《Compression Represents Intelligence Linearly》，通過實證研究證明壓縮效率與智能之間的線性關(guān)系。 用最少的符號解釋最多的現(xiàn)象，用最短的程序還原全部信息，用最少的參數(shù)做最好的預(yù)測。這就是"壓縮即智能"的數(shù)學(xué)實質(zhì)。 智能的本質(zhì)就是壓縮和預(yù)測。更好的壓縮代表更深層的理解，更大的預(yù)測能力是壓縮的自然結(jié)果。真正的"壓縮"指的是用最短的程序描述世界，這是智能的必要條件之一，但不是充分條件。 學(xué)習(xí)就是壓縮——從數(shù)據(jù)中提取規(guī)律，就是找到數(shù)據(jù)的最短描述。 草蛇灰線，伏脈千里： 1949年Claude Shannon的“信息熵——最小編碼比特數(shù)即信息量”； 1960年代的Kolmogorov / Solomonoff / Chaitin的“算法信息論——最短程序長度即復(fù)雜度”； 2006年Marcus Hutter的“壓縮維基百科競賽——壓縮率越高越智能”； 2023年DeepMind的"Language Modeling Is Compression——語言建模與數(shù)據(jù)壓縮數(shù)學(xué)等價”； 到2024年Ilya Sutskever的“壓縮實現(xiàn)無監(jiān)督學(xué)習(xí)是 OpenAI 兩大 founding ideas 之一”； 這條線幾十年的收斂點是：最小化描述長度 = 最大化預(yù)測能力 = 最大化泛化能力。 “最大泛化能力”，即孔子所說的“舉一反三”?？鬃釉凇墩撜Z·述而》中說：“舉一隅，不以三隅反，則不復(fù)也”?？鬃咏o學(xué)生講了一個墻角（一隅）的情況，如果學(xué)生不能靈活推想到另外三個墻角（三隅），孔子就不愿再教了。這體現(xiàn)了孔子的啟發(fā)式教學(xué)，強(qiáng)調(diào)學(xué)生要主動思考，不能死記硬背，老師只點撥關(guān)鍵點，剩下的靠學(xué)生自己領(lǐng)悟，由此及彼，由表及里。??這種“自己領(lǐng)悟”，就是從已知到未知的類推遷移。 “舉一反三”，就是聯(lián)想、類推，人類的認(rèn)知就是通過隱喻而形成展開的鏈網(wǎng)，中間就是無數(shù)跳躍式的遷移，觸類而旁通，所以無論藝術(shù)家還是科學(xué)家，都要能富于想象力，能天馬行空，實行跨躍式的躍遷。想象力比邏輯力更重要。 知識遷移的前提，是要有無數(shù)的起始模式。世界無限廣大而深邃，人腦無法全數(shù)把握。人們自身的感知器官種類和性能都是有限的，但即便如此，卻與其他生命不同，有較強(qiáng)的能力將無限的、連續(xù)的外部世界，經(jīng)過壓縮，成為有限的、離散的模型，并以此為基礎(chǔ)，認(rèn)知和把握世界，對環(huán)境作出適配反饋。 你以為你每天面對的是紛繁復(fù)雜的世界本身，其實不是。你面對的，是大腦已經(jīng)替你處理過的一份“壓縮版世界”，它刪掉了大部分細(xì)節(jié)，過濾了大部分噪音，只留下少數(shù)你來得及、有能力注意、感知、記住、處理的信息。 你每時每刻眼、耳、鼻、身等感知器官接受到外部世界的信號多得嚇人，但你大腦這口鍋無法有足夠的空間和時間容納加工，只有通過標(biāo)簽化、組塊化、敘事化三種操作使之大大簡化。這三種簡化操作都是建立某種關(guān)系，實際上是一種關(guān)聯(lián)化的折疊，因而也是一種理解。的謂“理解”，就是把世界壓縮到自己能處理的程度。這種認(rèn)知的預(yù)處理和處理，就是一種壓縮。 標(biāo)簽化就是把無數(shù)相似的事物進(jìn)行概括抽象，分類歸類，加以標(biāo)簽，簡化以便于大腦運算加工。原始人住房旁邊的每一棵樹、每一座山都是個別的，都有各自的名稱。樹有無數(shù)，山有很多，對認(rèn)知這顯然是不經(jīng)濟(jì)的負(fù)荷，難以把握。于是在進(jìn)化中人們概括出“樹”和“山”的概念及相應(yīng)詞語，以大大簡化紛繁的世界。 組塊化是把大量零件組成更大的部件，這種組合在經(jīng)驗中逐步固化，成為進(jìn)一步認(rèn)知壓縮的便捷的備用材料。使用時不必再從零件層層組裝，而是沉淀有大量已經(jīng)組裝好的備用部件，可以順手拈來一步到位，這種折疊大大降低了認(rèn)知的復(fù)雜度，提升了認(rèn)知的效率。 敘事化是對已有認(rèn)知材料根據(jù)因果關(guān)系進(jìn)行系聯(lián)，沉淀固化成許多事件的原型。世上有無數(shù)男人與女人相愛的故事，有無數(shù)戰(zhàn)爭與和平的故事，都可根據(jù)其關(guān)鍵要素之間的關(guān)系和變化，壓縮為最簡單的模板，而這些模式在不同情況中又可演化為千變?nèi)f化的故事，與我們的真實世界相匹配。敘事化正是無盡物態(tài)變化和世情變化的壓縮。 把無限的世界，壓縮為有限的概念和判斷，把浩如煙海的天量語言、圖像、視頻數(shù)據(jù)壓縮為有限的知識模式，再把龐大的知識庫壓縮為認(rèn)知的更高級的模板。其間有無層級和側(cè)面，反映了我們認(rèn)知的深度和廣度。 壓縮后的穩(wěn)定結(jié)構(gòu)叫“圖式”，“圖式”是長期記憶中對一類對象、情境或關(guān)系的結(jié)構(gòu)化知識組織?！皥D式”是一套可重復(fù)調(diào)用的認(rèn)知模板?！皥D式”把高頻出現(xiàn)的復(fù)雜關(guān)系直接打包。以后遇到類似情境，不必從零開始，而是直接調(diào)用現(xiàn)成模板。 上面說的“啟發(fā)式”、“舉一反三”，就是就是相近圖式的快速調(diào)用。固化的經(jīng)驗在認(rèn)知過程中快速的調(diào)用是低成本的方式。效率由此產(chǎn)生，跨域亦由此實現(xiàn)。 這些不同層級不同類型的模板的構(gòu)建和折疊，就是壓縮。壓縮就是一個抓住關(guān)鍵特征數(shù)據(jù)，舍棄大量低相關(guān)度的數(shù)據(jù)，形成特定模式的過程。傅立葉變換便是最常用而強(qiáng)大的數(shù)學(xué)工具。 ? 總之，所謂“智能”，無論是人類智能還是機(jī)器智能，都是指這樣一種能力，可從大量數(shù)據(jù)中，概括抽象出某些簡單模式，能有效地遷移適用于類似的對象和情景；這種概括抽象過程，就是一個建模過程，同時略去大量無關(guān)效用的數(shù)據(jù)。這個壓縮過程，在大規(guī)模減縮數(shù)據(jù)的同時，保留了原來信息的有效結(jié)構(gòu)與功能，而有效性的判斷，與壓縮的目標(biāo)及接受端有關(guān)。

久草资源站色婷婷,妹子干综合,九九国内精品偷拍视频,欧美1区2区,理论av优区,热热色麻豆,精品久久无码,成人免费黄色电影网站,99在线一区二区三区

壓縮即智能一一從知識到智慧的實現(xiàn)（20260524）

G.HUANG9605