與很多人的認知相反,文字並不是凝固在歷史中的死物,相反,隨著歷史的滄桑和時間的流逝,會創造出一些新的詞語,一些詞語會逐漸演變成我們今天看到的樣子,有些詞語會隨著自身文明的消亡而消失在歷史的洪流中。
一種書面語言的消亡可能有很多原因,其實由於人類文明初期不斷的戰爭和紛爭,消亡的文字不計其數,比如古埃及文字、美索不達公尺亞楔形文字、線性文字A和線性文字B、美國文字(Meso-American Glyphs)等, 這些文字已不再使用,只有少數文字從古至今倖存下來,例如漢字。
現在的問題是,如果我們遇到乙個不屬於當今任何已知語言系統的文字,我們如何破譯這些奇怪符號背後的含義
1.當遇到未知的文字時,寫作方向和數學系統往往是第乙個突破的。
首先,根據人們的日常寫作習慣,並不是一篇文字的每一行都會滿滿的,只要你確定那邊有空白,你基本上就可以確定這種文字是朝哪個方向寫的。
解釋:如果我們以漢字寫的段落為例,如果左邊留空,我們一般可以判斷這種文字是從右到左寫的,其他情況以此類推。 還有牛犁文字,甚至古埃及、瑪雅文字隨心所欲,都只有在有大量的文字資料後才能判斷。
其次,數字系統也相對容易破譯,與注釋的抽象文字相比,數字直觀且相對容易識別。 (破譯數字系統意味著知道使用了未知文字的數字符號。什麼樣的攜帶系統可能是人類一般有十個手指,所以十進位是最常見的進位系統。
當然,凡事都有例外,比如瑪雅人使用十進位系統;現代最具代表性的是法語,因為它是十進位、十六進製、二十進位、六十進位等的混合體,而且由於法國數字系統的複雜性,關於用法語聽寫數字的笑話經常在網際網絡上流傳)。
第三步是確定未知文字是表意文字還是拼音文字。
執行此操作的最簡單方法是使用數字字元。 一般來說,更多(習慣性地超過 100 個字元)是表意文字;字元越少,它們的語音就越多,例如英語中有 26 個,阿拉伯語中有 28 個,俄語中有 33 個,希伯來語中有 22 個,原因很簡單,這些字元足以滿足人類的日常需求。
還有一種拼音書寫是用符號來表示音節字元,一般有40到90個字元,如波斯語為60個符號,日語為50個平假名(平假名和片假名可以看作是同一音節的兩組)。
要確定文字是否被成功破譯,就是能夠使用推斷的規則來流利地閱讀新文字。
前三步只是破譯工作長征的第一步,就像我們學習英語的時候,雖然我們知道英語是從左到右書寫的,但並沒有為實際的閱讀工作提供切實可行的解決方案。
其次,未知文字本身必須具備一些條件,以便我們更容易破譯:
1.這種文字所代表的語言最好有說相同或密切相關語言的後代:科普特語是古埃及語言的直系後裔,在現代仍在使用,這是乙個典型的例子。 漢字是甲骨文的直系後裔,至今還活著,而且更加特殊。
2.這種文字最好存在於多語種文獻中,文字語言還“活著”:這在大多數古代文字裂縫中最有用,比如羅塞塔石碑就是例子,失傳的西夏文字有漢字西夏字比對詞典的遺跡,效果事半功倍, 而楔形文字是古波斯文字和古希臘文字的存在,波斯語也是“活的”——滿足條件1。
3、最好有大量的文字可以取樣研究,詞語可以比較:線性字元B就是乙個例子,當然,線性B所代表的語言還活在古希臘語的後裔中。 雖然現存的瑪雅文字手稿只有三份,但石碑銘文數十萬,文字樣本足夠,瑪雅語至今仍被數千萬人使用——符合條件1。
如果某部文字不滿足以上三個條件,那麼除非出現奇蹟,否則智商再高也沒用:比如復活節島上神秘的“朗朗朗格文字”,說當地語言的原住民幾乎不見了,世界上只有二十幾塊木板銘文, 而且沒有多語種文字......這種寫法可能真的死了......
3.只要滿足以上條件之一,還是有希望破解這個未知文字的。 但接下來的工作會比較複雜,不能一概而論,簡單來說,就是找到這種未知語言的近親,用該語言近親的字元,找到發音相似的單詞,乙個接乙個。 例如,埃及象形文字的後裔是科普特語,雖然瑪雅文字不可讀,但瑪雅人的後裔一直使用瑪雅預言。
同時,如果這個未知文字有與已知文字的參考文字,那就是一把鑰匙在手,大大加快了破譯的步伐,比如羅塞塔石碑、西夏文字和漢字比對詞典......
當然,最好是有大量未知的文字存在,而且越多越好,這樣人們就可以分析文字的規則。
美索不達公尺亞平原文明並不是每一種語言都能被破譯的,比如古代印度河文明留下的郵票文字,不僅文字的符號完全不為人知,而且有記載的語言似乎從未出現在這個星球上。