久草资源站色婷婷,妹子干综合,九九国内精品偷拍视频,欧美1区2区,理论av优区,热热色麻豆,精品久久无码,成人免费黄色电影网站,99在线一区二区三区

世界文字傳奇史話5-36丨漢字與電腦大碰撞

葉老師

<p class="ql-block"><b style="font-size:22px;">第五篇 中國(guó)漢字傳奇</b></p><h1><b style="font-size:22px;">第三十六章 漢字與電腦大碰撞</b></h1> 1981年8月12日,美國(guó)IBM公司在紐約市對(duì)外宣布:IBM PC個(gè)人電腦橫空出世。著名的《時(shí)代》周刊在介紹本年度“新聞人物”時(shí)滿懷激情地寫(xiě)到:“在一年的新聞里,這個(gè)最吸引人的話題,它代表著一種進(jìn)程,一種持續(xù)發(fā)展并被廣泛接受和歡迎的進(jìn)程。這就是為什么《時(shí)代》在風(fēng)云激蕩的當(dāng)今世界中選擇了這么一位新聞人物,但這完全不是一個(gè)人物,而是一臺(tái)機(jī)器”。它昭示著人類社會(huì)從此跨進(jìn)了個(gè)人電腦的新時(shí)代。 <h5 style="text-align: center;">IBM PC個(gè)人電腦</h5> 對(duì)于字母文字(例如英語(yǔ))世界而言,個(gè)人電腦的作用首推“換筆”——字母還是那26個(gè),鍵盤還是那個(gè)QWERTY,用英文打字機(jī)打字改換成電腦打字不費(fèi)吹灰之力。至少在西方發(fā)達(dá)國(guó)家,當(dāng)絕大多數(shù)家庭或個(gè)人都擁有PC機(jī)之后,在“個(gè)人電腦”與“個(gè)人打字機(jī)”或者“個(gè)人的鋼筆”之間不再存在天塹般的差距,第三次書(shū)寫(xiě)革命大“換筆”已經(jīng)初現(xiàn)端倪。然而,對(duì)于中國(guó)漢字世界而言,要想用個(gè)人電腦“換筆”,與中文打字機(jī)的命運(yùn)一樣,又必須突破那個(gè)橫亙?cè)诔汕先f(wàn)計(jì)的漢字與QWERTY鍵盤之間的巨大障礙,從而引發(fā)了漢字與電腦歷史性的“大碰撞”。能否突破漢字進(jìn)入個(gè)人電腦的桎梏,關(guān)系到漢字在信息時(shí)代的生死存亡,以至于語(yǔ)言文字學(xué)家周有光先生激奮地呼吁:“我們已經(jīng)丟掉了一個(gè)機(jī)械打字機(jī)的時(shí)代,我們絕不能再丟掉一個(gè)電子打字機(jī)的時(shí)代?!? <h5 style="text-align: center;">字母文字世界的女孩用電腦打字</h5> 巨大障礙的一端是海量的漢字。古代《說(shuō)文解字》收錄的漢字只有9000多個(gè),而如今最全的《中華大辭典》收錄了10萬(wàn)多個(gè)漢字。為了壓縮漢字的巨大體量,文字工作者們進(jìn)行了大量的“漢字查頻統(tǒng)計(jì)”,即從各種漢字文獻(xiàn)里,查找每個(gè)漢字的使用次數(shù)。1977年,中國(guó)最大的一次漢字查頻統(tǒng)計(jì),在國(guó)家統(tǒng)計(jì)局的指揮下整整進(jìn)行了兩年,一共統(tǒng)計(jì)了86本書(shū)籍、104本期刊和7075篇文章,總字?jǐn)?shù)達(dá)到2000多萬(wàn)字,內(nèi)容涉及工業(yè)、農(nóng)業(yè)、軍事、政治、科技、文學(xué)、醫(yī)藥、教育等等方面,包羅萬(wàn)象。查頻結(jié)果表明,最常用的漢字共有6347個(gè)。1980年,中國(guó)頒布了第一個(gè)漢字信息處理方面的國(guó)家標(biāo)準(zhǔn),明確規(guī)定基本的漢字為6763個(gè)。到2022年,教育部正式發(fā)布的《通用規(guī)范漢字表》共收字三級(jí)8105個(gè)字。其中,一級(jí)字表為常用字集,收字3500個(gè),可以作為義務(wù)教育階段的識(shí)字標(biāo)準(zhǔn)。二級(jí)字表收字3000個(gè),常用度僅次于一級(jí)字。一、二級(jí)字表合計(jì)6500字,主要滿足出版印刷、信息處理和社會(huì)生活一般用字需要。就這樣,進(jìn)入電腦的漢字被壓縮到了6500個(gè)字。 <h5 style="text-align: center;">《通用規(guī)范漢字表》(局部)</h5> 漢字的字頻指每個(gè)漢字使用的頻繁程度,即它可能出現(xiàn)的頻率。字頻的統(tǒng)計(jì)表明,對(duì)于普通中國(guó)人而言,認(rèn)識(shí)600個(gè)常用字就可以覆蓋80%的語(yǔ)言資料;認(rèn)識(shí)960字可以覆蓋90%的語(yǔ)料;哪怕你只認(rèn)得3000字,就能夠當(dāng)作家,依據(jù)就是3000字的字頻信息覆蓋了99%的中文語(yǔ)料。這里還有一個(gè)有趣的現(xiàn)象。5萬(wàn)漢字中有為數(shù)不到100個(gè)字,它們的使用頻率占總頻率三分之一強(qiáng),人們似乎特別喜愛(ài)這些字。 <h5 style="text-align: center;">漢字高頻字順序表</h5> 巨大障礙的另一端是那個(gè)QWERTY鍵盤,即如何用僅有幾十個(gè)鍵位的鍵盤來(lái)輸入6500個(gè)漢字。目前可行的方法就是編碼輸入。1990年頒布的中國(guó)國(guó)家標(biāo)準(zhǔn)里專門列出一個(gè)詞條,用嚴(yán)格的科學(xué)術(shù)語(yǔ)將“編碼”定義為:“按一定的規(guī)則對(duì)指定的漢字集內(nèi)的元素編制相應(yīng)的代碼”。這里所說(shuō)的“指定的漢字集”,目前指的就是那6500個(gè)漢字;所謂“一定的規(guī)則”,即按照某種簡(jiǎn)潔、方便且容易記憶的方法,以數(shù)字或字母作為漢字的代碼,把漢字“壓縮”到QWERTY鍵盤來(lái)輸入。 <h5 style="text-align: center;">QWERTY電腦鍵盤</h5> 1976年底,海峽對(duì)岸的朱邦復(fù)首次發(fā)表中文形意編碼,以中國(guó)造字祖先的名字命名為“倉(cāng)頡輸入法”。 出生于1937年湖北的朱邦復(fù),遭遇過(guò)時(shí)代變遷的動(dòng)亂。他從臺(tái)灣農(nóng)學(xué)院農(nóng)藝系畢業(yè)后便去服了兵役,退役后卻只身前往了巴西墾荒。接下來(lái)的時(shí)光,他當(dāng)過(guò)領(lǐng)班、餐廳服務(wù)員和攝影師,直到在巴西一家出版公司的工作經(jīng)歷,才徹底改變了自己的人生軌跡。 <h5 style="text-align: center;">朱邦復(fù)研究中文計(jì)算機(jī)</h5> 1972年的某天,朱邦復(fù)看到編輯部正在處理一份葡萄牙文的小說(shuō),20萬(wàn)字的文稿兩小時(shí)之內(nèi)便輸入了電腦印刷成書(shū)。這件事激勵(lì)了他萌生了如何把中文也輸入電腦的大膽想法。朱邦復(fù)將自己埋首在各類字典中,把字典里的字一個(gè)個(gè)剪下來(lái),剪了幾十本字典,把所有的漢字編卡,然而把卡片排列組合了幾千次,最后訂出了一套編碼表,記憶口訣為“日月金木水火土,人心手足口耳目,王石山蟲(chóng)魚(yú)犬馬,衣言絲草竹”,這便是倉(cāng)頡輸入法的雛形,命名為“中文形意檢字法”。直到八十年代初期,在臺(tái)灣某高校計(jì)算機(jī)中心的支持下,朱邦復(fù)成功完成了12000字的中文文件的輸入。又過(guò)了幾年,他終于以倉(cāng)頡輸入法為基礎(chǔ)發(fā)明了中文字形產(chǎn)生器,造出了中文終端電腦。 <h5 style="text-align: center;">朱邦復(fù)的倉(cāng)頡輸入法鍵盤,1976年底</h5> 1978年,中國(guó)上海的支秉彝在《自然雜志》上正式介紹了他的“見(jiàn)字識(shí)碼”系統(tǒng)。 支秉彝是江蘇泰州人。1934年,先后就學(xué)于浙江大學(xué)、德國(guó)萊比錫大學(xué),獲自然科學(xué)博士,曾在德國(guó)藍(lán)點(diǎn)無(wú)線電廠任工程師。1945年支秉彝購(gòu)置了一批精密標(biāo)準(zhǔn)儀器欣然回國(guó),擔(dān)任中央工業(yè)試驗(yàn)所電子試驗(yàn)室主任。上海解放后,他創(chuàng)辦了黃河理エ儀器廠。1964年,他調(diào)上海電工儀器研究所任總エ程師。 <p class="ql-block">支秉彝漢字編碼的發(fā)明是在那個(gè)特殊年代。當(dāng)他被誣為“反動(dòng)學(xué)術(shù)權(quán)威”被關(guān)押的某天,他看到隔離室墻上“坦白從寬,抗拒從嚴(yán)”八個(gè)大字,驟然間萌發(fā)了一個(gè)研究想法:能不能把漢字編成一種有規(guī)律的代碼,用以替代打電報(bào)的老辦法,進(jìn)而讓漢字同西文一樣直接進(jìn)入計(jì)算機(jī)。支秉彝憑早年在德國(guó)任教漢語(yǔ)的根基,潛心思考,以26個(gè)拉丁字母逐個(gè)試著編碼漢字。在燈光昏暗的隔離室,支秉彝利用茶杯蓋子編碼寫(xiě)字,幾十個(gè)漢字編滿后抹了再編。他沒(méi)有字典,沒(méi)有參考資料,也沒(méi)有任何人可以探討和交流,憑借的只是頑強(qiáng)的意志和超人的記憶力……。</p> <h5 style="text-align: center;">隔離室里的支秉彝研究編碼(AI繪圖)</h5> <p class="ql-block">1969年9月,支秉彝從隔離室放出來(lái)監(jiān)督勞動(dòng),他仍堅(jiān)持著漢字編碼研究。他打破單一分解漢字字形的方式,綜合分析漢字字音、字形、筆劃和拼音之間的關(guān)系,以4個(gè)字母表示一個(gè)漢字,規(guī)則簡(jiǎn)單,易于掌握。如“路”字,可拆成口、止、文、口四部分,取部首拼音讀音的第一個(gè)字母,即組成“路”的代碼KZWK 。以一本《新華字典》作伴侶,支秉彝把字典上的8500字如此都編上了碼,毎個(gè)字填寫(xiě)一張卡片,從中探索和解決重復(fù)碼的規(guī)律。就這樣,支秉彝終于發(fā)明了“見(jiàn)字識(shí)碼”的編碼系統(tǒng),也被稱為“支碼”系統(tǒng)。</p><p class="ql-block">整整六年過(guò)去,當(dāng)黎明又重新來(lái)臨的時(shí)候,當(dāng)知識(shí)又重新找回它的價(jià)值的時(shí)候,我們的儀器儀表專家額頭上已爬滿了皺紋,甚至只能夠坐著輪椅來(lái)發(fā)表自己的論文。他終于看到自己含辛茹苦研究出的“神秘符號(hào)”取得了兩項(xiàng)中國(guó)第一:中國(guó)報(bào)紙第一次報(bào)道的漢字編碼,中國(guó)大陸第一個(gè)漢字信息處理系統(tǒng)。1977年,上海市電話局“114”服務(wù)臺(tái)按照“支碼”,成功地把用戶單位名稱的漢字儲(chǔ)存在計(jì)算機(jī)內(nèi),話務(wù)員根據(jù)用戶要求,按下字鍵,通過(guò)電腦自動(dòng)地回答所查到的電話號(hào)碼。</p> <h5 style="text-align: center;">漢字編碼研究的開(kāi)拓者支秉彝院士</h5> 朱邦復(fù)和支秉彝的研究開(kāi)創(chuàng)了漢字編碼研究的先河。他們分別創(chuàng)造的編碼方法還不夠簡(jiǎn)便,不太實(shí)用。但是,他們的發(fā)明卻引來(lái)了中國(guó)漢字編碼的逐鹿中原,形成了歷史上罕見(jiàn)的漢字編碼競(jìng)爭(zhēng)熱潮。
龙州县| 钟山县| 全南县| 安庆市| 九寨沟县| 临汾市| 五河县| 盘锦市| 无锡市| 常州市| 黔江区| 万州区| 金乡县| 虞城县| 辽阳市| 巫山县| 收藏| 钟山县| 东海县| 九龙县| 巴彦县| 扶沟县| 望都县| 上饶县| 化州市| 独山县| 五台县| 神池县| 宁晋县| 南开区| 娱乐| 朝阳市| 密山市| 翁牛特旗| 马鞍山市| 金乡县| 哈巴河县| 竹溪县| 错那县| 翁牛特旗| 宁远县|