手機站首頁散文詩歌雜文隨筆日記小小說

散文網(wǎng) » 科技 »學習 » 中文編程的路該怎么走?

中文編程的路該怎么走?

2022-05-19 12:55 作者:全民編程是有意義 0人讀過 | 我要投稿

中文編程的路該怎么走?

說起來,我關注程序和編程,是從小學時姑姑家買了電腦,我把玩后開始感興趣的,

然后是初中畢業(yè),想找到一條生存路,開始研究程序世界,但遇上了互聯(lián)網(wǎng)鋪開和娛樂至上年代,

后面讀了個大專學軟件工程,但屁用沒有,老師完全不教編程相關,竟然還教毛概,大數(shù),大語等半點關系都沒有的,

還要考試,我那會兒就開始反思中國的教育是不是出問題了,

之后,自然地,畢業(yè)即失業(yè),一直打散工,直到16年開始關注中文編程,一直找了這么多年,

尋覓過很多道路,其中也遇到過一些道友,發(fā)現(xiàn)都無法精準命中中文編程的痛點,即中文編程的出路在哪里,

時至今日,中文編程尚處于萌芽狀態(tài),從吳濤的易語言到現(xiàn)在,可以看出,中文編程既沒有PL理論,也沒有建立出什么實際的程序生態(tài)和編程生態(tài),更別提基于共識起草標準了,所以中文編程這個事業(yè),還是一事無成的零蛋,

程序的本質就是,從零憑空構造一套系統(tǒng),看起來脫離實際,其實它緊密圍繞世界的實際邏輯建立,即策略、模式匹配、算法等概念描述的一個抽象對象,

我觀中文編程的現(xiàn)狀,得出一些膚淺的分析結論;

它從上到下(頂?shù)降?,或從下到上,都行不通,因為這些已經(jīng)是西方軟件工程建立了半個多世紀的壁壘,

其體系和生態(tài)已經(jīng)非常龐大繁雜,所以現(xiàn)在入程序行業(yè)的人,一般都是加入他們,

這些人秉持的理念是打不過就加入,而非獨立自主搞自己的,畢竟像倪光南和吳濤這樣有骨梁的在一個群體里始終是少數(shù),

所謂從上到下,就是從應用層到指令系統(tǒng),應用層就是生態(tài),生態(tài)每天都在產生海量的庫,

無論是漢化它還是使用它(這個使用是指生產者實施者)都是南轅北轍,只會疲于奔命地跟著西方的屁股跑,

而從下到上,看似簡單,實則壁壘高到難以想象,西方人在最基本的東西里穿插了技術墻,

比如指令系統(tǒng),就是指令集,我用的是x86,我想找到指令的機器碼,我發(fā)現(xiàn)它根本沒有固定的0101構成的機器指令,

因為它是CISC,所以它的指令是動態(tài)編碼的,我想做一個x86的匯編器,我需要看懂它的說明書,

還要會一門靜態(tài)編譯性語言,而這兩樣對一個非專業(yè)的普通人來說就像天書,

其說明書,要看英文是基本的,其技術性的詞匯和描述,和帶有文法陷阱(俚語,慣用口語)的句子和縮寫,

是壁壘和技術墻的雙重壓制,而靜態(tài)編譯性的語言一樣有這個問題,更別提破解靜態(tài)編譯語言的編譯器,

比登天還難,這一系列就像三體里的質子,從最基本的規(guī)則中鎖死我們在這個領域的發(fā)展,

擬人比喻就是,削掉你的頭和四肢和五臟六腑,只留十個手指和血管連著,讓你只用手指為西方的軟件工程生態(tài)添磚加瓦,

通過血管輸送養(yǎng)分供養(yǎng)西方程序生態(tài),現(xiàn)在加入的那幫人就在干這個事,并且他們還有優(yōu)越感,

當然,現(xiàn)在有開源的RISC-V可供選擇,它有固定的0101機器指令,寫匯編器應該沒那么難了,

但我沒有基于它的CPU和整機,所以我無從下手,

經(jīng)過上述分析,和平日里的反思,我找到的路就是虛擬機這條路,

虛擬機指語言虛擬機,不局限于某種指令系統(tǒng)和處理器架構,也不局限于某個操作系統(tǒng),

因為它是一臺虛擬的機器,是對圖靈機或馮氏結構的虛擬化,用軟件和程序來模擬,

當前只有這條路可走,它能破解從上到下還是從下到上的問題,jvm字節(jié)碼和llvm中間碼就是這種產物,

我以前沒注意到這條路的可行性,但現(xiàn)在我發(fā)現(xiàn)虛擬化才是中文編程真正可以實現(xiàn)和走的路,

有人要說龍芯,但龍芯的指令系統(tǒng)和處理器架構,一是繼承自西方體系的指令集和設計理論,二是為了接西方體系的軌,

而非真正的獨立自主,它沒有真正意義上的從零的匯編器和編譯器,大家可以去看它的官方文檔,

龍芯的目的還是為了供養(yǎng)西方軟件生態(tài),因為他們想從西方生態(tài)里分一杯羹,所以龍芯從源頭的路就是歪的,

所以中文編程想要擁有自己的硬件生態(tài)體系,那就必須要完全從零設計指令系統(tǒng),和由此而生的PL理論和匯編標準,

以及,適應這套指令系統(tǒng)的電路,IC生態(tài),等等,

當然,我們現(xiàn)在熱衷中文編程的道友,不奢望硬件生態(tài),因為那實在可望不可即,

所以我們只能搞搞中文編程的軟件生態(tài)體系,通過語言虛擬機來構造中文漢字程序生態(tài)這個上層建筑,

經(jīng)過這么多年的熱衷探索,中文編碼標準在馮氏結構里是一個全面性被打壓的問題,

馮氏結構有5大部件,分別是[運算器、存儲器、控制器、輸入、輸出],這不單單是硬件電路使用了這些概念,

馮氏結構是一種理論,它在軟件和程序里也是可以應用的,編程語言的功能清單里,不但包含了基于5大概念構造的功能,

比如數(shù)組,變量,流程控制. 還有基于這基本概念構造的復合功能,比如結構體,函數(shù).

還有文件系統(tǒng)也有5大概念的本質,輸入法也一樣,例子太多不列舉,

如果光是尋覓編程語言的編碼,其實是南轅北轍,真正應該研究的是馮氏結構概念實例化后的編碼和指令系統(tǒng)的字符編碼,

方能深入破解中文編程編碼標準的根源,

中文字符編碼不單單只局限于輸入和輸出,大家明白吧,

基于上述分析,若要搞中文編程的語言虛擬機,第一步是設計基于中文漢字的指令系統(tǒng),

用漢化的方式寫虛擬機是基本要求,即標識符就得是中文漢字,設計虛擬機所用的馮氏結構概念得用中文漢字編碼,

這樣就可以從源頭用中文漢字封裝馮氏結構概念為基本編程組件,

那么用這樣的語言虛擬機建立的上層建筑,比如匯編器,PL理論,編譯器,輸入法等等基礎設施,才能完全是基于中文漢字的,

也就不會遇到編碼問題,

說一個歧視性的問題,UTF8是對Unicode的再編碼,當它編碼漢字的時候,大多是用2-3個字節(jié)來存儲漢字的,

每個字節(jié)8位二進制(一個字節(jié)),也就是說存儲一個漢字要有16位-24位二進制,大家考慮下,16位甚至24位二進制可以代表多少個狀態(tài)了?

常用漢字3000-5000個,也就是說最多只需5000個狀態(tài),所以要存儲漢字12位-16位是完全夠了,

甚至康熙字典都能全部存儲下來,而UTF8是為了適應拉丁字母的排位而設計的,字母在UTF8碼表里享有第一優(yōu)先級,

字母大多是用8位二進制編碼的(一個字節(jié)),所以UTF8編碼算法是未滿256個狀態(tài)之前存儲字母,超過256個狀態(tài)的字符,

就用16位甚至24位二進制來編碼存儲,故意增高非拉丁字符的存儲成本,讓非歐羅巴文明的種族覺得自己使用的文字低人一等,

而UTF8是現(xiàn)在軟件程序互聯(lián)網(wǎng)打印機反正就是信息傳輸、存儲、處理的事實標準,

大家仔細想吧,為啥不是UTF16流行或干脆Unicode本身流行?為啥非得定義8位二進制 = 一個字節(jié)?一切都是為了西方優(yōu)先.

要搞中文編程,其實首先應該解決中文編碼的問題,然而卻沒有任何人反思這一點,

當然,UTF8也是可以用,就是成本和代價高了億點,自然就由大家來全體承擔了,

還有一個,PL理論不是非得用龍書虎書鯨書那一套編譯理論,并且,除了圖靈機以外還有一大把計算理論,

但是當你打開搜索編譯器相關的時候,出來的幾乎全都是"詞法分析""語法分析""代碼生成"那一套,為啥?

因為被降維打擊了呀,因為"加入他們"的那部分人在十多年前就開始帶節(jié)奏了,典型的比如輪子哥,

中文編程的生路難走至極,但走出來就可以日月?lián)Q,

生態(tài)的問題不是一個人能解決的,打破封印需要破解者,而非歸順者,

標簽：

中文編程的路該怎么走?的評論 (共條)

愛情散文傷感散文哲理散文優(yōu)美生活隨筆親情唯美句子傷感的句子現(xiàn)代詩歌空間日志經(jīng)典語句愛情句子作文大全

五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

中文編程的路該怎么走?

中文編程的路該怎么走?的評論 (共條)

你可能也喜歡這些文章

最新發(fā)布的文章

五月天青色头像情侣网名,国产亚洲av片在线观看18女人,黑人巨茎大战俄罗斯美女,扒下她的小内裤打屁股

中文編程的路該怎么走?

本文作者的其他文章

中文編程的路該怎么走?的評論 (共 條)

你可能也喜歡這些文章

最新發(fā)布的文章

中文編程的路該怎么走?的評論 (共條)