어떤 해독되지 않은 문자 체계가 가장 큰 텍스트 말뭉치를 가지고 있습니까?

어떤 해독되지 않은 문자 체계가 가장 큰 텍스트 말뭉치를 가지고 있습니까?

수십 개의 고대 문자 체계가 아직 해독되지 않았습니다. 내 질문은 다음과 같습니다. 그 중 알려진 비문 수가 가장 많은 것은 어느 것입니까? (따라서 미래의 해독에 가장 접근하기 쉬울 수 있지만, ~ 아니다 내 질문의 일부)?

예를 들어, 비문이 알려지지 않은 문자 체계로 되어 있는 파이스토스 원판에는 총 241개의 기호만 있으며 해당 문자 체계의 다른 표본은 알려져 있지 않습니다.

다른 한편으로, 19세기 초에 각각 수백만 개의 토큰으로 구성된 수천 개의 비문이 알려진 아카드 설형 문자와 이집트 상형 문자가 여전히 해독되지 않았습니다(물론 그 이후로 둘 다 해독되었습니다).


그것은 매우 흥미로운 질문이며, 결과는 텍스트를 해독할 때뿐만 아니라 새로운 비문이 발견될 때도 발전합니다.

따라서 1973년 이전에 크레타 섬 밖에서 단 하나의 서판이 발견되었지만 귀하의 질문에 대한 답은 선형 A라고 말하고 싶습니다. 총 7362-7396개의 부호가 있는 1427개의 선형 A 문서가 있습니다.

선형 A는 미노아 문명의 종교적인 글입니다. 이것은 알파벳이 도착할 때까지 사용된 가장 오래된 그리스어 문자 형태인 Linear B의 기원으로 믿어집니다. 선형 B와의 주요 차이점은

  • 선형 A는 해독되지 않고 선형 B는 해독됩니다.
  • 선형 A가 선형 B와 비슷하게 발음되면 그리스어가 아닐 가능성이 높으며 실제로 다른 기원(아마도 셈어)을 가진 언어일 수 있습니다.

이전에 주어진 Mayan과 달리 Linear A는 완전히 해독되지 않은 반면 Maya 스크립트는 많은 비문이 미스터리로 남아 있음에도 불구하고 실제로 해독된다는 점을 고려하여 이 답변을 드립니다.

물론 선형 A는 고대 그리스에서 많은 검색이 이루어졌기 때문에(예를 들어 이집트에서도 마찬가지) 질문에 답할 수 있다는 점을 명심해야 합니다. 결국 훨씬 더 큰 말뭉치를 찾을 수 있습니다. 나는 당신이 가장 큰 것에 대해 질문한 것을 알고 있습니다. 모두 다 아는 가장 큰 텍스트 모음을 가지고 있는 스크립트를 연구하는 것보다 실제로 더 많은 비문을 찾는 것이 신비한 스크립트 언어를 해독할 가능성이 더 크다는 것을 말하려는 것뿐입니다.


아마도 마야의 글과 비문은 가장 역사적으로 중요한 해독되지 않은 가장 큰 글일 것입니다.

또한 고대 이집트의 상형 문자가 잘 이해되고 있다고 성급하게 가정하지 마십시오. 상형 문자의 많은 "번역", 특히 왕의 무덤에서 발견되는 것은 매우 추측적이며, 우리는 그들이 말하는 내용을 정말로 확신할 수 없습니다.


어떤 해독되지 않은 문자 체계가 가장 큰 텍스트 말뭉치를 가지고 있습니까? - 역사

복잡성은 아마도 학생들이 직면하는 고대 문자 체계의 가장 중요한 특성일 것입니다. 복잡성 문제는 글쓰기 자체에 대한 이해뿐만 아니라 초기 글쓰기 시스템이 사회의 문해 수준, 글을 쓸 수 있는 사람들의 사회적 지위, 그리고 최근에는 그 쓰기 시스템의 해독.

사람은 썩어가고 그의 시체는 흙이요
그의 모든 친척이 죽었습니다.
그러나 책은 그를 기억하게 한다.
리포터의 입을 통해.
잘 지은 집보다 책이 낫고,
서쪽의 무덤 예배당보다
견고한 저택보다 낫고,
사원의 스텔라보다! 10

고대 문자 체계의 유연성.

국제 관계 및 무역의 링구아 프랑카

문화 간 상호 작용에는 의사 소통이 필요하므로 항상 언어와 쓰기에 어느 정도 의존해 왔습니다. 역사의 여러 시점에서 개별 언어가 이러한 상호 작용을 지배했으며, 이러한 사실이 "lingua franca"라는 구문을 발생시켰습니다. 18 구어의 매체인 쓰기는 이러한 상호작용의 역사에서 덜 유명하지만 비슷하게 중요한 역할을 했습니다. 언어적 의사소통은 다양한 계층과 문해력 수준의 사람들 간의 문화 간 상호 작용에 분명히 중요했지만 일부 상호 작용은 글쓰기의 도움 없이는 자신 있게 착수할 수 없었습니다. 상인들은 경제 거래에 대한 구체적인 세부 사항을 기록해야 했습니다. 공무원은 승려가 신성한 텍스트를 복사하고 보존하는 데 필요한 조약의 다양한 요소를 기록해야 했으며 이러한 모든 작업은 서면에 의존했습니다.

고대 문자의 해독

고대 서기관의 세계를 지배했던 많은 문자 체계는 현대보다 오래 전에 사용하지 않게 되었습니다. 고대 언어는 죽고 그 결과 이를 전달하기 위해 개발된 문자 체계는 버려졌습니다. 고대 문자 체계의 이야기에서 가장 흥미로운 측면 중 하나는 이러한 잃어버린 문자 체계가 어떻게 복구되었는지입니다. 이 이야기를 이해하는 열쇠는 이러한 쓰기 시스템이 암호 해독자에게 제기하는 중대한 도전을 인식하는 것입니다.

많은 경우에 복호화자에게 여러 스크립트 및 언어(일부는 알려져 있고 일부는 알려지지 않음)로 된 텍스트를 제공하는 이중 언어 또는 삼중 언어 텍스트의 가용성은 알려지지 않은 쓰기 시스템의 해독에 중요했습니다. Rosetta Stone은 아마도 가장 친숙한 예일 것입니다. 그것은 13세의 파라오 프톨레마이오스 5세를 찬양하는 비문을 포함하고 있으며, 동일한 비문이 두 가지 버전의 이집트어(하나는 상형 문자로, 다른 하나는 민중으로, 스크립트의 단순화된 형태)와 그리스어로 제공됩니다. 그리스어 비문의 마지막 줄과 그것이 밝혀진 다른 비문의 내용은 다음과 같이 번역됩니다. 그리고 영생하는 왕의 형상 옆에 있는 삼위의 사원." 36 학자들이 이렇게 운이 좋은 경우는 드물지만, 로제타 스톤을 연구하는 사람들은 비문에 있는 텍스트 사이의 언급된 관계 때문에 이 스톤이 상형 문자의 신비를 풀 수 있다는 약속을 지켰다는 것을 이 라인에서 알았습니다.

결론

글쓰기는 인류 역사의 최근 발전이다. 구석기 시대에 발전한 죽은 자의 매장, 예술의 창조, 불의 통제와 사용과 같은 많은 독특한 인간 행동은 인류 역사에 훨씬 더 깊은 뿌리를 두고 있습니다. 농업과 좌식 생활 방식은 더 최근의 발전이지만 여전히 약 10000년에서 12000년 전에 시작된 신석기 시대에 위치할 수 있습니다. 대조적으로, 가장 오래된 형태의 문자는 서아시아와 이집트에서 불과 5,000년 전에 시작된 훨씬 더 최근의 것입니다. 세계의 다른 지역에서 글쓰기의 발전은 훨씬 더 최근에 일어났습니다. 따라서 글쓰기는 진화론적 용어로 아주 최근에 나타난 새로운 인간 행동입니다.

전기 메모: David Burzillo는 매사추세츠 주 웨스턴에 있는 리버스 학교에서 세계사를 가르칩니다.

노트

저자는 동료인 Cathy Favreau, Jennie Jacoby, Jack Jarzavek 및 Ben Leeming이 제공한 의견에 감사하게 생각합니다.

1 처음에 학생들에게 언어와 쓰기는 동일하지 않으며 인류 역사에서 다른 시기에 발전했음을 분명히 해야 합니다. 이 기사의 뒷부분에서 논의할 상형 문자와 설형 문자는 다양한 언어에 사용되는 쓰기 시스템이지만 그 자체가 언어는 아닙니다.

2 인간이 언제 비언어적 의사소통을 시작했는지 말할 수는 없지만, 인간 집단은 집단 환경에서 사냥하고 생존하기 위해 역사상 아주 초기에 이 능력이 분명히 필요했습니다. 연설은 보다 최근에 개발된 것입니다. 현재의 증거에 따르면 인간은 약 5만 년 전에 신체적으로 말을 할 수 있었습니다. 쓰기가 처음 사용된 것은 약 5천 년 전입니다.

3 U.S. 나머지 12.8%는 스페인어가 가정에서 사용되는 기본 언어입니다. 미국 인구 조사국, "표 2. 주별 5~17세 인구의 언어 사용, 영어 능력 및 언어적 고립도: 2000," 언어 사용 및 영어 능력 요약표: 2000 , http://www.census.gov/population/www/cen2000/phc-t20.html (2003년 11월 25일 접속).

4 언어학자들은 음소를 언어에서 구별되는 소리의 가장 작은 단위로 정의합니다. 그들은 형태소를 하나 이상의 음소로 구성된 가장 작은 의미 있는 말 단위로 정의합니다.

5 학자들은 고대 사회에서 문해력 수준에 가치를 부여하는 것이 어렵다는 것을 인정했지만, 고대 문자 체계의 복잡성 자체를 문해력이 침투할 수 있는 범위에 제한을 두는 것으로 반드시 간주하지는 않았습니다. 사회. Herman Vanstiphout에 따르면 "어쨌든 쓰기 체계의 상대적 복잡성은 문맹 퇴치의 확산과 거의 또는 전혀 관련이 없을 것입니다. 일본은 다른 산업 거인과 비교할 때 문해력이 가장 높습니다. 문해력은 복잡한 대본보다 국가의 정치적, 사회적 우선순위에 훨씬 더 많이 의존한다는 것을 증명합니다."("고대 서아시아의 기억과 문해력", 고대 근동의 문명, 권. 4, 에드. Jack M. Sasson [뉴욕: Charles Scribner's Sons, 1995], 2188-89). 필사 훈련에 대한 논의는 C. B. F. Walker의 3장을 참조하십시오. 과거 읽기: 설형 문자 (Berkeley: University of California Press, 1989) Samuel Noah Kramer의 1장, 역사는 수메르에서 시작된다 (Garden City: Anchor Doubleday, 1959) A. Leo Oppenheim의 5장, 고대 메소포타미아: 죽은 문명의 초상 (Chicago: University of Chicago Press, 1977) 및 H. W. F. Saggs의 5장, 그리스와 로마 이전의 문명 (New Haven: Yale University Press, 1989).

6 Saggs는 우르 III 왕 Shulgi의 이야기를 들려줍니다. 그는 그의 서기관들에게 자신의 찬송가를 가수들이 연주할 수 있도록 읽어 달라고 지시했습니다(그리스와 로마 이전의 문명, 104-105). J. Nicholas Postgate는 알파벳이 도입되기 전에 "문해력은 확실히 고대 바빌로니아 시대에 절정에 이르렀습니다 ... 그것이 수행한 다양한 역할과 읽고 쓸 수 있는 사람들의 수 모두에서… "(초기 메소포타미아: 역사의 여명기의 사회와 경제 [런던: Routledge, 1994], 69). Barry J. Kemp는 고왕국 이집트가 "왕에게서 파생된 권위를 휘두르는 문맹자, 그들에게 종속된 자(문지기, 군인, 채석장 등), 문맹 농민"의 세 부류로 나눴다고 썼습니다. 왕국, 중왕국 및 제2중기 씨. 2686-1552 BC", 고대 이집트: 사회사, 에드. Bruce G. Trigger, Barry J. Kemp, David O'Connor 및 Alan Lloyd [Cambridge: Cambridge University Press, 1996], 81).

7 이 문서들은 서기관들이 직접 작성한 것이므로 분명히 상당한 편향이 있음을 주목해야 합니다.

8 미리암 리히트하임, 고대 이집트 문학, 권. 2(Berkeley: University of California Press, 1976), 170.

9 Kramer 참조, 역사는 수메르에서 시작된다, 1-16, 교육과 서기관에 대한 수메르의 관점에 대한 자료.

10 리히트하임, 고대 이집트 문학, 177. 이집트 서기관에 대한 추가적인 주요 출처는 James B. Pritchard, ed., 구약과 관련된 근동 텍스트 (Princeton, NJ: Princeton University Press, 1969), 431-34.

11 우리가 글의 기원을 이해하는 방식은 농업 발전에 관한 유사한 문제를 다루는 방식과 유사합니다. 사용 가능한 증거에 따르면 농업은 세계 최소 7개 지역에서 독립적으로 발명되어 그 지역에서 확산되었습니다. 이 일곱 지역 각각에서 특정한 동물과 작물의 조합이 길들여졌습니다. 브루스 스미스 참조, 농업의 출현 (뉴욕: Scientific American 도서관, 1995). C. C. Lamberg-Karlovsky 및 Jeremy Sabloff, 고대 문명: 근동과 메소아메리카 (Prospect Heights, Ill.: Waveland Press, 1995), 60. 문자와 관련하여 아시리아 학자들은 이집트 문자의 발달에 대한 메소포타미아의 영향이라는 생각을 지지하는 경향이 있었습니다. 이집트에서 글쓰기의 발전. Henri Frankfort 참조, 근동 문명의 탄생 (뉴욕: Doubleday Anchor, 1956), 129-32 Saggs, 그리스와 로마 이전의 문명, 72 및 포스트게이트, 초기 메소포타미아, 56. Lamberg-Karlovsky와 Sabloff는 "글쓰기는 평행 진화의 수렴의 결과로 두 영역에서 독립적으로 진화했을 수 있다"는 입장을 취합니다(고대 문명, 134). 상형 문자와 설형 문자의 관계에 대한 논쟁에 대한 간략한 요약은 Trigger, Kemp, O'Connor 및 Lloyd에서 찾을 수 있습니다. 고대 이집트, 37-38.

12 역사가들은 일반적으로 수메르어와 이집트어가 거의 동시에 개발된 것으로 간주해 왔으며, 수메르어에는 약간의 우위가 있습니다. 최근 이집트에서 발견된 사실로 인해 많은 사람들이 이것을 다시 방문하게 되었으며, 일부 이집트 학자들은 상형 문자가 설형 문자보다 앞선다고 제안했습니다. 최근 몇 년 동안이 주제에 대해 언론에 많이 등장했습니다. 존 노블 윌포드(John Noble Wilford), "왕의 조각은 역사를 다시 쓸 수 있다", 뉴욕 타임즈, 2002년 4월 16일 Elizabeth J. Himelfarb, "이집트에서 발견된 최초의 알파벳", 고고학, 2000년 1월/2월, 21 Larkin Mitchell, "가장 초기 이집트 상형 문자", 고고학, 1999년 3월/4월, 28-29일 및 Vijay Joshi, "고대 서판은 이집트인이 처음으로 글을 썼을 수 있음을 보여줍니다." 보스턴 글로브, 1998년 12월 18일.

13 셈어족에는 동부 셈어와 서부 셈어의 두 가지 주요 분파가 있습니다. 아카드어는 바빌론과 아시리아의 아카드 방언도 포함하는 동 셈족 가족의 일부로 간주됩니다. 서부 셈어 지부는 히브리어와 아랍어를 포함하여 일부 학생들에게 친숙할 수 있는 더 많은 언어를 포함합니다.

14 존 킹 페어뱅크, 중국: 새로운 역사 (Cambridge, Mass.: Harvard University Press, 1994), 42-43.

15 조슈아 포겔(Joshua Fogel)은 한국어에 대해 “문화적으로 여러 면에서 선진화된 한국인들이 중국어를 받아들인 지 천 년이 훨씬 넘은 15세기까지 한글을 개발하지 않았다는 사실 자체가 많은 것을 말해준다. 그들의 삶에서 중국어 문자의 영예로운 장소"("중국어 세계", in 서양사와 세계사의 아시아, 에드. Ainslee Embree 및 Carol Gluck [Armonk, N.Y.: M. E. Sharpe, 1997], 684). Fogel은 또한 동아시아를 통합하는 데 도움이 된 연결인 한자의 채택의 결과로 각 국가에 들어온 종교적, 문화적, 정치적 사상과 제도의 중요성에 대해 논의합니다.

16 Edwin Reischauer는 일본이 대본 개혁을 시작하기 전의 상황을 다음과 같이 설명했습니다. 쓰기 시스템"(일본인 [Cambridge, MA: Belknap Press, 1977], 47).

17 여기에 인용된 예 외에도 그리스인이 페니키아 알파벳을 차용한 것을 포함하여 더 친숙한 예가 더 있습니다. 또한 라틴 알파벳은 아마도 에트루리아인을 통해 그리스에서 차용되었을 것입니다.

18 "lingua franca"라는 문구의 첫 번째 용법에 따르면, 옥스포드 고대 영어 사전, John Dryden의 작품입니다. 제공된 다른 예는 두 지중해 상황에서 모두 제공됩니다.

19 Mel Gibson의 영화에 대한 최근의 홍보를 감안할 때 그리스도의 열정, 많은 학생들이 아람어의 존재에 대해 알고 있을 것입니다. 이 언어는 서아시아의 공용어로서 아카드어를 대체했으며 나중에 아랍어로 대체되었습니다.

20 Amarna 텍스트에 대한 간략한 개요를 보려면 Barbara Ross, "Correspondence in Clay," 아람코월드, 1999년 11월/12월, 30-35.

21 Shlomo, Izre'el, "가나안에서 온 아마르나 편지", Sasson, 고대 근동의 문명., 권. 4, 2412.

22 마리 기록 보관소의 네 글자와 아마르나 서신의 28 글자가 Pritchard에서 재생산됩니다. 구약과 관련된 고대 근동 문헌.

23 새그, 그리스와 로마 이전의 문명, 182.

24 새그, 그리스와 로마 이전의 문명, 184.

25 Ross, "찰흙으로 된 서신", 31-32쪽.

26 C. W. Ceram, 신, 무덤, 학자: 고고학의 이야기 (뉴욕: Bantam Books, 1972). 원래 1949년에 쓰여졌지만 이 책은 재발행되어 고등학생이 쉽게 읽을 수 있습니다. Ceram은 설형 문자와 상형 문자의 해독을 자세히 설명합니다.

27 선형 B에 대해서는 John Chadwick 참조, 선형 B의 해독 (런던: Cambridge University Press, 1990) 및 Andrew Robinson, 선형 B를 해독한 남자: 마이클 벤트리스의 이야기 (런던: Thames와 Hudson, 2002). 마야인의 경우 Michael Coe를 참조하십시오. 마야 코드 깨기 (London: Thames and Hudson, 1999) 및 "정신의 승리: Yuri Knorosov가 먼 레닌그라드에서 마야 상형 문자 코드를 해독한 방법", 고고학, 1991년 9월/10월, 33-44 및 David Roberts, "고대 마야의 해독,"대서양, 1991년 9월, 87-100.

28 앤드류 로빈슨 참조, 잃어버린 언어: 해독되지 않은 세계 문자의 수수께끼 (뉴욕: McGraw Hill, 2002). Robinson은 Meroitic, Linear A, Etruscan, Proto-Elamite 및 Rongorongo의 해독되지 않은 스크립트에 대한 현재 생각에 대해 장을 할애합니다.

29 사무엘 노아 크레이머, 수메르인: 그들의 역사, 문화 및 성격 (시카고: 시카고 대학 출판부, 1963), 19-26.

30 마이클 코 참조, 마야 (런던: Thames와 Hudson, 1999).

31 Peter Daniels, "고대 근동 문자 해독", Sasson, 고대 근동의 문명, 권. 1, 82.

32 앗수르와 관련하여 다니엘스는 다음과 같이 보고한다. "수메르어의 해석은 수십 년에 걸친 작업임이 입증되었으며, 그 기간 동안 그것이 실제 언어인지 앗수르 사제들이 신성한 것을 숨기기 위해 고안한 암호인지에 대해 심각한 논쟁이 일어났다. 신비"("고대 근동 문자 해독", 86쪽). Coe는 리처드 롱(Richard Long)과 폴 셸하스(Paul Schellhas)와 같은 20세기 중반 마야주의자들의 유사한 태도를 인용하며, 이들은 마야 상형 문자가 언어를 나타낸다는 것을 의심했습니다.마야 코드를 깨고, 137-44).

33 모리스 포프, 고고학적 해독 이야기: 이집트 상형문자에서 선형 B까지 (뉴욕: Charles Scribner's Sons, 1977), 186.

34 교황 참조, 고고학 해독 이야기, 그리고 코, 마야 코드 깨기.

35 코 참조, 마야 코드 깨기, 43-44, 해독과 관련된 이 문제 및 기타 일반적인 문제에 대한 멋진 요약을 참조하세요. 에 대한 Robinson의 소개도 참조하십시오. 잃어버린 언어, 특히 40-43 및 채드윅, 선형 B의 해독, 41-43.

36 Stephen Quirke와 Carol Andrews, Rosetta Stone: 소개 및 번역이 포함된 팩스 도면 (런던: 대영 박물관 간행물, 1988).

37 Rawlinson의 필사본은 지면에서 약 340피트 높이의 암벽 측면에 비문이 작성되었기 때문에 상당한 위험을 수반했습니다. University of Michigan의 George Cameron은 비문을 연구하고 1948년에 이 비문을 라텍스 주형으로 만들었습니다. 그의 연구와 그의 연구에서 얻은 많은 클로즈업 사진은 George Cameron의 "Darius Carved History on Ageless Rock"에서 찾을 수 있습니다. 지리적 국가, 1950년 12월, 825-44.

38 교황, 고고학적 해독 이야기, 162. Ugaritic 및 Linear B의 해독은 이 패턴을 따르지 않았습니다.

39 알려지지 않은 문자 체계에서 개별 단어를 식별하는 것은 그 뒤에 있는 언어 번역에서 중요한 단계가 될 수 있지만 항상 해독이 뒤따를 것이라고 보장하지는 않습니다. 에트루리아어가 이 사실의 좋은 예입니다. 에트루리아 알파벳은 그리스 알파벳과 관련이 있기 때문에 많은 개인 이름을 포함하여 에트루리아 단어를 읽을 수 있습니다. 그러나 사용 가능한 텍스트 유형, 대부분 장례식 및 사용 가능한 텍스트의 길이로 인해 학자들은 단어에 대한 매우 기본적인 이해 수준에서 전체 언어에 대한 이해로 이동할 수 없었습니다.

40 교황, 고고학적 해독 이야기, 189.

41 Pope는 이 방법에 대해 "그러나 선형 B 해독을 독특하게 만들고 세계의 상상력을 사로잡은 것은 Kober에 의해 시작되고 Ventris에 의해 크게 확장된 추상적 음성 격자였습니다. 그 효과는 음절 기호의 사용을 보다 밀접하게 정의하는 것이었습니다. 'sign'이라는 말 대신 NS 음절'을 나타내는 것은 'sign'이라고 말할 수 있게 되었습니다. NS 기호로 표시되는 음절과 하나의 요소를 공유하는 음절을 나타냅니다. 와이.' 그래서 쓰기 규칙이 더 정확하게 알려졌고, 이는 대상 영역의 작음과 부정확성을 보완했습니다."(고고학적 해독 이야기, 188).

42 예제는 기사 끝에 있는 제안된 웹 사이트를 참조하십시오.

43 적어도 하나의 경우, 미케네인의 경우, 기존 문서 모음은 전적으로 관리에 초점이 맞춰져 있습니다. 대부분의 학생들은 아마도 호머와 그의 일리아드 그리고 오디세이 Myceneans와 함께 Linear B는 Homer의 그리스어가 아니며 Homer의 작품은 Mycenean 문학의 예가 아님을 학생들에게 상기시키는 것이 가치가 있을 것입니다.

44 예를 들어, Paul Halsall은 많은 역사적 기간 및 주제와 관련된 다운로드 가능한 기본 소스 문서가 있는 우수한 웹사이트를 다수 보유하고 있습니다. 그의 고대사 자료집 주소는 http://www.fordham.edu/halsall Ancient/asbook.html입니다.

45 크라머 참조, 역사는 수메르에서 시작된다. 1-16.

46 Pope는 Thomas Young이 Champollion을 매우 질투했고 둘 다 그의 방법에 비판적이었고 그의 아이디어에 대한 공로를 인정했음을 분명히 합니다.고고학적 해독 이야기, 66-68, 84). 이것은 확실히 부분적으로 Champollion이 Young이 주장한 돌파구에 대한 공로를 인정받았기 때문에 부분적으로는 개인적인 측면이 있었습니다. 그러나 나폴레옹 전쟁과 아시아에서의 영불 경쟁이 뒤따랐을 때 Young이 느꼈던 질투의 일부가 영국인이 아니라 프랑스인이 해독에 책임이 있다는 사실에서 비롯된 것이었다면 나는 놀라지 않을 것입니다.

추천 읽을거리

세람, C.W. 신, 무덤, 학자: 고고학 이야기. New York: Bantam Books, 1972. 상형 문자와 설형 문자 해독에 대한 섹션은 고등학생이 매우 쉽게 접근할 수 있습니다.

채드윅, 존. 선형 B의 해독. Cambridge: Cambridge University Press, 2002. Michael Ventris와 함께 일한 Chadwick은 일반 독자를 위해 이 간략한 설명을 작성했습니다.

채드윅, 존. 과거 읽기: 선형 B 및 관련 스크립트. Berkeley: University of California Press, 1997. 과거 읽기 시리즈의 각 권에는 훌륭한 설명과 삽화와 함께 해당 주제에 대한 대략 60페이지의 설문 조사가 포함되어 있습니다. 이 시리즈의 다른 권에 대해서는 아래 Davies와 Walker를 참조하십시오.

코, 마이클. 마야 코드 깨기. London: Thames and Hudson, 1999. 마야 문자 해독의 뛰어난 역사.

데이비스, W.V. 과거 읽기: 이집트 상형 문자. 버클리: 캘리포니아 대학 출판부, 1987.

Erman, Adolf ed. 고대 이집트인: 그들의 저술 자료집. 뉴욕:

Harper Torchbooks, 1966. New Kingdom Egypt의 교육에 대한 일부 주요 자료를 포함합니다.

프리드리히, 요하네스. 멸종된 언어. New York: Philosophical Library, 1957. 해독 및 고대 스크립트에 대한 매우 읽기 쉬운 처리. 이 책은 저자가 Ventris의 작업에 대해 들었을 때 출판되었으므로 Linear B에 대한 부록이 추가되었습니다.

오펜하임, A. 레오. 고대 메소포타미아: 죽은 문명의 초상. Chicago: University of Chicago Press, 1977. 쓰기 및 필사기에 대한 좋은 섹션이 포함되어 있습니다.

교황, 모리스. 해독 이야기: 이집트 상형문자에서 선형 B까지. New York: Charles Scribner's Sons, 1975. Coe는 이것을 "해독에 관한 최고의 일반 책"이라고 부릅니다.

포스트게이트, J. 니콜라스. 고대 메소포타미아: 역사의 여명기의 사회와 경제. 런던: Routledge, 1995년. 메소포타미아에서 글쓰기의 진화에 관한 섹션.

로빈슨, 앤드류. 잃어버린 언어: 해독되지 않은 세계 문자의 수수께끼. New York: McGraw Hill, 2002. Robinson은 쓰기와 언어에 관한 많은 책을 저술했습니다. 그는 또한 2002년 Michael Ventris의 전기를 출판했습니다.

삭스, H.W. NS. 그리스와 로마 이전의 문명. New Haven: Yale, 1989. 쓰기 및 교육에 관한 장.

Sasson, Jack ed. 고대 근동의 문명. 1-4권. New York: Charles Scribner's Sons, 1995. 1권에는 Peter Daniels의 해독에 대한 섹션이 포함되어 있습니다. 4권에는 Denise Schmandt-Bessarat, D.O. Edzard, John Huehnegard, Edward Wente 및 Laurie Pearce. 이 참고 자료에서 많은 귀중한 기사를 찾을 수 있습니다.

폰 소덴, 볼프람. 고대 동양: 고대 근동 연구 소개. Grand Rapids: William B. Erdmans, 1994. 쓰기 및 쓰기 시스템 장.

워커, CBF. 과거 읽기: 설형 문자. 버클리: 캘리포니아 대학 출판부, 1989.


은나라의 예언자 뼈와 미래 쓰기

고대 기원 기사에서 이전에 보고된 바와 같이 갑골은 고대 중국의 상나라(기원전 1600-1046년)와의 연관성으로 가장 잘 알려진 일종의 유물입니다. 이러한 유물을 점술 목적으로 사용하여 갑골을 '갑골'이라 부르게 되었다. 갑골은 상나라 사람들이 가지고 있는 믿음에 대한 정보를 제공하는 것 외에도 고대 중국 문헌의 가장 오래된 주요 본문을 형성하기 때문에 중요합니다.

갑골을 만드는 데 사용된 주요 동물 뼈는 견갑골 또는 견갑골이었습니다. 고고 학적 기록에 따르면 이 동물의 견갑골로 만든 많은 양의 갑골이 나왔기 때문에 황소가 선호되는 동물인 것 같습니다. 그럼에도 불구하고 사슴, 양, 돼지의 견갑골로 만든 갑골도 발견되었습니다. 두 번째 재료는 플라스트론(거북의 거의 평평한 밑면)이 사용되었습니다. 갑각(거북의 볼록한 등껍질)은 곡면에 쓰기가 훨씬 더 어렵기 때문에 갑골을 만드는 데 적합하지 않았습니다.

갑골의 비문은 1899년 베이징의 학자이자 골동품 수집가인 Wang Yirong에 의해 처음 발견되었지만, 안양 농민 그룹은 교수보다 훨씬 앞서 유물을 발굴했습니다. 20세기 동안 수천 개의 갑골이 발견되었습니다. 갑골에 대한 다양한 연구는 중국 문자가 시간이 지남에 따라 발전한 방식을 보여주고 상나라의 점술 관행에 빛을 비추었습니다.

갑골의 도움으로 미래를 점치는 과정은 일반적으로 고객이 묻는 질문으로 시작됩니다. 이러한 질문에는 기상, 농업 및 군사 문제를 포함한 다양한 주제가 포함되었습니다. 그런 다음 점쟁이는 날카로운 도구를 사용하여 뼈/껍질에 질문을 쓴 다음 구멍/구멍을 뚫습니다. 그런 다음 갑골은 균열이 생길 때까지 강한 열에 노출됩니다. 마지막으로, 이 균열은 점쟁이가 고객을 위해 해석했습니다.


데이터 소스 및 방법

이 작업에서 언급된 기호는 여러 저자(Mahadevan, 1977 Parpola, 1986, 1994 Wells, 1998), CISI(Joshi and Parpola, 1987 Parpola et al., 2010 Shah and Parpola, 1991) 및 ICIT 데이터 세트를 참조합니다. 우리가 집중하는 데이터 세트는 두 가지 방식으로 선별 및 검증되었습니다. 첫째, 손으로(다른 저자 및 CSI의 서명 목록 사용), 둘째, ICIT 데이터베이스를 리소스로 사용합니다. 해당 인장의 각 기호는 MongoDB 데이터베이스에 저장되었습니다. 대칭/비대칭 기호에 초점을 맞춘 기호는 인장 및 유사한 인장의 다른 기호와의 관계에 초점을 맞출 수 있는 주요 필드였습니다. 각 인장에 대해 다음 속성이 저장되었습니다. CSI ID, 기호 번호, 위치, 인장의 기타 기호, 인장 길이, 여러 줄 인장인지 여부를 나타내는 플래그. 각 인장은 앞서 언급한 속성을 가진 문서로 저장됩니다. 기존 데이터베이스와 달리 MongoDB 데이터베이스는 기호에 대해 여러 개의 상관 관계를 생성할 수 있으며 분석도 더 쉽습니다. 이 작업에 나열된 각 빈도는 데이터 세트를 쿼리하여 쉽게 표로 만들 수 있습니다. 이 데이터베이스 설정은 향후 동물 기호가 있는 물개를 추가로 분석하기 위해 확장될 수 있습니다.


고대 문명과 초기 저술

문자는 근동, 중국, 인더스 계곡, 중앙아메리카와 같은 다양한 지역에서 독립적으로 진화했습니다. 각 지역에서 출현한 문자 체계는 서로 다르며 서로 영향을 미치지 않았습니다. 알려진 최초의 문자 체계는 기원전 3,100년으로 거슬러 올라가는 메소포타미아의 설형 문자입니다.

글쓰기는 왜 발명되었을까? 아마도 그 답은 첫 번째로 쓰여진 메시지에서 찾을 수 있을 것입니다. 글이 독자적으로 발전한 대부분의 장소에서 가장 오래된 문서는 레이블과 목록 또는 통치자의 이름으로 남아 있습니다. 일반적으로 일부는 이러한 문서를 생성한 사회에서 다른 사회보다 훨씬 부유했으며 권력은 소그룹의 손에 집중되었습니다. 따라서 이 그룹의 구성원이 둘 다에 대한 통제를 유지하기 위해 상품과 사람의 분배를 조직해야 했기 때문에 문자가 발명된 것으로 추정됩니다.

많은 사회에서 글쓰기는 다른 목적으로도 발명되었습니다. 예를 들어, 고대 메소포타미아 계약 및 기타 상업 문서에는 서신, 법률, 종교 의식, 심지어 문학 작품까지 기록되었습니다. 반면에 중앙아메리카에서는 오랫동안 군주제와 관련된 기념물에 글을 쓰는 것이 제한되었습니다. 쓰기가 소수의 지배적인 그룹에 국한된 이 사회에서는 실제로 읽고 쓸 수 있는 사람이 거의 없었습니다.

로고그래픽 쓰기

작동 방식에 따라 문자 체계는 문자, 음절 또는 알파벳으로 분류됩니다. 경우에 따라 일부 시스템에서는 이 중 하나 이상을 동시에 사용합니다. 예를 들어 고대 이집트인들은 세 가지 체계를 동시에 사용했습니다. 로고그래픽 쓰기 시스템에서 각 기호는 단어를 나타냅니다. 이러한 시스템의 대부분에서 문법적 한정자는 기본 기호에 추가되며, 이는 단어의 복합 또는 복수 형태와 같은 의미 또는 문법적 변화를 나타내는 특수 기호입니다. 이 쓰기 시스템의 가장 명백한 어려움은 모든 단어를 표현하는 데 필요한 엄청난 수의 기호입니다. 중국어 쓰기 시스템은 약 50,000자를 사용하지만 일반적으로 모든 문자가 사용되는 것은 아닙니다. 이것은 중국 제국에서 읽고 쓸 수 있는 사람이 거의 없다는 것이 놀라운 일이 아닌 이유를 설명합니다. 현대에도 중국어 타자기를 만드는 데 수십 년이 걸렸습니다.

음절 쓰기

음절 쓰기 시스템은 기호를 사용하여 음절을 나타냅니다. 근동의 아시리아와 바빌로니아 설형 문자, 고전 이전 그리스의 두 문자 체계, 일본 가나, 중앙 아메리카의 고대 마야 문자와 같은 많은 초기 문자 체계는 음절이었습니다.

바빌론의 설형 문자는 음절 문자가 어떻게 사용되고 발전되었는지를 보여주는 좋은 예입니다. It first developed from Sumerian logographic writing, and both were written by imprinting wedge-shaped marks on wet clay tablets. They would put syllabic signs one after the other to form words.

Cuneiform syllabic writing was used for a long time in the ancient Near East, where it was in use between the years 3,100 and 100 BC. It was used to write other languages as well as Akkadian, such as Hittite and Elamite.

Babylonian cuneiform has around 600 symbols, although many of them are used for their different syllabic values.

Alphabetic Writing

Most modern languages use alphabetic writing systems where each symbol represents a basic sound. Spanish and most modern European languages are written with alphabets that come from the Latin alphabet. The great advantage of alphabetical systems is that far fewer symbols need to be learned than in logographic or syllabic systems, as most alphabets feature fewer than 30 characters.

It’s rather ironic, but it’s possible that the invention of the first alphabet was inspired by the ancient Egyptian script, one of the most complex writing systems ever invented. Egyptian hieroglyphs combined logographic, syllabic, and alphabetic symbols. In the middle of the second millennium BC, communities living in the Sinai Peninsula discovered that all of the sounds of their language could be expressed using a small number of alphabetic symbols.

It’s likely that the alphabetic systems descended from the original Sinai script were widely used throughout the Levant until 1150 BC. However, as this type of script was mostly written on perishable materials like parchment and papyrus, very few original materials remain. However, papyrus has been preserved in Egypt due to of the dryness of the desert and the absence of bacteria.

The earliest examples of alphabetic writing, which date from 1450 to 1150 BC, were found at the site of the ancient Canaanite city of Ugarit. A writing system consisting of 30 cuneiform symbols was invented to write in Ugaritic. Ugaritic written documents were engraved on clay tablets that are almost indestructible when baked. However, the few remaining documents suggest that the inhabitants of Ugarit were more accustomed to the usual Semitic alphabetic writing tradition of writing on perishable materials.

A very late, and particularly special, example of a surviving original Semitic parchment is the so-called Dead Sea Scrolls. Dating from about 100 BC to 68 AD, these mysterious religious texts written in Aramaic and Hebrew were found between 1947 and 1956 in clay pots in an Israeli desert cave. It’s easier to trace the evolution of the Levantine alphabets used in Semitic languages like Phoenician, Hebrew, and Aramaic after 1200 BC, as there are a few inscriptions carved in stone.

These alphabetic scripts differ from how modern European alphabetic writing is used in two important respects. Firstly, in Semitic writing texts are normally written right to left, instead of left to right. Secondly, vowel sounds and diphthongs in languages that use Semitic scripts (a, e, i, o, u, o, ai, oo, etc.) are not written, and only consonants are recorded (b, k, d, f, g, etc.).

It seems that the writing of vowel sounds occurred by accident, and it wasn’t some sort of brilliant invention. The Greeks were aware of the Levantine alphabets by having established regular contact with the Phoenicians and other peoples of the region between 950 and 850 BC, when they both, among others, established markets throughout the Mediterranean. Some letters that represent consonants in the Semitic sense sounded like vowels to the Greeks.

The Greeks also took their alphabet to Italy, where it was adapted for use in Etruscan, Latin, and other languages. The Roman Empire helped to spread their alphabet throughout much of Western Europe, although the Greek alphabet was still used in the Eastern Empire. By the time the Western Roman Empire fell in the 5th century, it was already a Christian empire. Writing (in Latin) had become essential in ecclesiastical administration. Both the Latin writing system and Christianity survived the empire that gave birth to them. During the early medieval period, the Latin alphabet was adapted to transcribe various languages, such as Gothic, Old Irish, French and Old English. Meanwhile, in the East, the Greek Orthodox Church expanded to the north, Russia and the Balkans, taking the Greek alphabet with them. It’s said that two Orthodox clerics, St. Cyril and St. Methodius, adapted the Greek alphabet to write Slavic languages. This is why the alphabet currently used in Russia, Bulgaria and other parts of Eastern Europe is called Cyrillic, in honor of St. Cyril. In this way, the Semitic, Greek, and Latin alphabets served as the basis of most of the alphabets currently used in modern Europe, the Middle East, and the Indian subcontinent.


내용물

Human communication was initiated with the origin of speech approximately 500,000 BCE [ 인용 필요 ] . Symbols were developed about 30,000 years ago. The imperfection of speech, which nonetheless allowed easier dissemination of ideas and eventually resulted in the creation of new forms of communications, improving both the range at which people could communicate and the longevity of the information. All of those inventions were based on the key concept of the symbol.

The oldest known symbols created for the purpose of communication were cave paintings, a form of rock art, dating to the Upper Paleolithic age. The oldest known cave painting is located within Chauvet Cave, dated to around 30,000 BC. [1] These paintings contained increasing amounts of information: people may have created the first calendar as far back as 15,000 years ago. [2] The connection between drawing and writing is further shown by linguistics: in Ancient Egypt and Ancient Greece the concepts and words of drawing and writing were one and the same (Egyptian: 's-sh', Greek: 'graphein'). [삼]

The next advancement in the history of communications came with the production of petroglyphs, carvings into a rock surface. It took about 20,000 years for homo sapiens to move from the first cave paintings to the first petroglyphs, which are dated to approximately the Neolithic and late Upper Paleolithic boundary, about 10,000 to 12,000 years ago.

It is possible that Homo sapiens (humans) of that time used some other forms of communication, often for mnemonic purposes - specially arranged stones, symbols carved in wood or earth, quipu-like ropes, tattoos, but little other than the most durable carved stones has survived to modern times and we can only speculate about their existence based on our observation of still existing 'hunter-gatherer' cultures such as those of Africa or Oceania. [4]

A pictogram (pictograph) is a symbol representing a concept, object, activity, place or event by illustration. Pictography is a form of proto-writing whereby ideas are transmitted through drawing. Pictographs were the next step in the evolution of communication: the most important difference between petroglyphs and pictograms is that petroglyphs are simply showing an event, but pictograms are telling a story about the event, thus they can for example be ordered chronologically.

Pictograms were used by various ancient cultures all over the world since around 9000 BC, when tokens marked with simple pictures began to be used to label basic farm produce, and become increasingly popular around 6000–5000 BC.

They were the basis of cuneiform [5] and hieroglyphs, and began to develop into logographic writing systems around 5000 BC.

Pictograms, in turn, evolved into ideograms, graphical symbols that represent an idea. Their ancestors, the pictograms, could represent only something resembling their form: therefore a pictogram of a circle could represent a sun, but not concepts like 'heat', 'light', 'day' or 'Great God of the Sun'. Ideograms, on the other hand, could convey more abstract concepts, so that for example an ideogram of

Because some ideas are universal, many different cultures developed similar ideograms. For example, an eye with a tear means 'sadness' in Native American ideograms in California, as it does for the Aztecs, the early Chinese and the Egyptians. [ 인용 필요 ]

Early scripts Edit

The oldest-known forms of writing were primarily logographic in nature, based on pictographic and ideographic elements. Most writing systems can be broadly divided into three categories: logographic, syllabic 그리고 alphabetic (또는 segmental) however, all three may be found in any given writing system in varying proportions, often making it difficult to categorise a system uniquely.

The invention of the first writing systems is roughly contemporary with the beginning of the Bronze Age in the late Neolithic of the late 4000 BC. The first writing system is generally believed to have been invented in pre-historic Sumer and developed by the late 3000's BC into cuneiform. Egyptian hieroglyphs, and the undeciphered Proto-Elamite writing system and Indus Valley script also date to this era, though a few scholars have questioned the Indus Valley script's status as a writing system.

The original Sumerian writing system was derived from a system of clay tokens used to represent commodities. By the end of the 4th millennium BC, this had evolved into a method of keeping accounts, using a round-shaped stylus impressed into soft clay at different angles for recording numbers. This was gradually augmented with pictographic writing using a sharp stylus to indicate what was being counted. Round-stylus and sharp-stylus writing was gradually replaced about 2700–2000 BC by writing using a wedge-shaped stylus (hence the term cuneiform), at first only for logograms, but developed to include phonetic elements by the 2800 BC. About 2600 BC cuneiform began to represent syllables of spoken Sumerian language.

Finally, cuneiform writing became a general purpose writing system for logograms, syllables, and numbers. By the 26th century BC, this script had been adapted to another Mesopotamian language, Akkadian, and from there to others such as Hurrian, and Hittite. Scripts similar in appearance to this writing system include those for Ugaritic and Old Persian.

The Chinese script may have originated independently of the Middle Eastern scripts, around the 16th century BC (early Shang Dynasty), out of a late neolithic Chinese system of proto-writing dating back to c. 기원전 6000년. The pre-Columbian writing systems of the Americas, including Olmec and Mayan, are also generally believed to have had independent origins.

Alphabet Edit

The first pure alphabets (properly, "abjads", mapping single symbols to single phonemes, but not necessarily each phoneme to a symbol) emerged around 2000 BC in Ancient Egypt, but by then alphabetic principles had already been incorporated into Egyptian hieroglyphs for a millennium (see Middle Bronze Age alphabets).

By 2700 BC, Egyptian writing had a set of some 22 hieroglyphs to represent syllables that begin with a single consonant of their language, plus a vowel (or no vowel) to be supplied by the native speaker. These glyphs were used as pronunciation guides for logograms, to write grammatical inflections, and, later, to transcribe loan words and foreign names.

However, although seemingly alphabetic in nature, the original Egyptian uniliterals were not a system and were never used by themselves to encode Egyptian speech. In the Middle Bronze Age an apparently "alphabetic" system is thought by some to have been developed in central Egypt around 1700 BC for or by Semitic workers, but we cannot read these early writings and their exact nature remains open to interpretation.

Over the next five centuries this Semitic "alphabet" (really a syllabary like Phoenician writing) seems to have spread north. All subsequent alphabets around the world [ 인용 필요 ] with the sole exception of Korean Hangul have either descended from it, or been inspired by one of its descendants.

Scholars agree that there is a relationship between the West-Semitic alphabet and the creation of the Greek alphabet. There is debate between scholars regarding the earliest uses of the Greek alphabet because of the changes that were made to create the Greek alphabet. [6]

The Greek alphabet had the following characteristics:

  1. The Greek lettering we know of today traces back to the eighth century B.C.
  2. Early Greek scripts used the twenty-two West-Semitic letters, and included five supplementary letters.
  3. Early Greek was not uniform in structure, and had many local variations.
  4. The Greek lettering was written using a lapidary style of writing.
  5. Greek was written in a boustrophedon style.

Scholars believe that at one point in time, early Greek scripts were very close to the West-Semitic alphabet. Over time, the changes that were made to the Greek alphabet were introduced as a result of the need for the Greeks to find a better way to express their spoken language in a more accurate way. [6]

Storytelling Edit

Verbal communication is one of the earliest forms of human communication, the oral tradition of storytelling has dated back to various times in history. The development of communication in its oral form can be categorized based on certain historical periods. The complexity of oral communication has always been reflective based on the circumstance of the time period. Verbal communication was never bound to one specific area, instead, it had and continues to be a globally shared tradition of communication. [7] People communicated through song, poems, and chants, as some examples. People would gather in groups and pass down stories, myths, and history. Oral poets from Indo-European regions were known as "weavers of words" for their mastery over the spoken word and ability to tell stories. [8] Nomadic people also had oral traditions that they used to tell stories of the history of their people to pass them on to the next generation.

Nomadic tribes have been the torch bearers of oral storytelling. Nomads of Arabia are one example of the many nomadic tribes that have continued through history to use oral storytelling as a tool to tell their histories and the story of their people. Due to the nature of nomadic life, these individuals were often left without architecture and possessions to call their own, and often left little to no traces of themselves. [9] The richness of the nomadic life and culture is preserved by early Muslim scholars who collect the poems and stories that are handed down from generation to generation. Poems created by these Arabic nomads are passed down by specialists known as sha'ir. These individuals spread the stories and histories of these nomadic tribes, and often in times of war, would strengthen morale within members of given tribes through these stories. [ 인용 필요 ]

In its natural form, oral communication was, and has continued to be, one of the best ways for humans to spread their message, history, and traditions to the world. [ 인용 필요 ]

Timeline of writing technology Edit

  • 30,000 BC – In ice-age Europe, people mark ivory, bone, and stone with patterns to keep track of time, using a lunar calendar. [10]
  • 14,000 BC – In what is now Mezhirich, Ukraine, the first known artifact with a map on it is made using bone. [10]
  • Prior to 3500 BC – Communication was carried out through paintings of indigenous tribes. – The Sumerians develop cuneiform writing and the Egyptians develop hieroglyphic writing.
  • 16th century BC – The Phoenicians develop an alphabet.
  • 105 – Tsai Lun invents paper.
  • 7th century – Hindu-Malayan empires write legal documents on copper plate scrolls, and write other documents on more perishable media.
  • 751 – Paper is introduced to the Muslim world after the Battle of Talas.
  • 1250 – The quill is used for writing. [10]
  • 1305 – The Chinese develop wooden blockmovable type printing.
  • 1450 – Johannes Gutenberg invents a printing press with metal movable type.
  • 1844 – Charles Fenerty produces paper from a wood pulp, eliminating rag paper which was in limited supply.
  • 1849 – Associated Press organizes Nova Scotiapony express to carry latest European news for New York newspapers.
  • 1958 – Chester Carlson presents the first photocopier suitable for office use.

The history of telecommunication - the transmission of signals over a distance for the purpose of communication - began thousands of years ago with the use of smoke signals and drums in Africa, America and parts of Asia. In the 1790s the first fixed semaphore systems emerged in Europe however it was not until the 1830s that electrical telecommunication systems started to appear.


Which undeciphered writing system has the largest corpus of text? - 역사

Ancient History relies on disciplines such as Epigraphy, the study of ancient inscribed texts, for evidence of the recorded past. However, these texts, “inscriptions”, are often damaged over the centuries, and illegible parts of the text must be restored by specialists, known as epigraphists. This work presents PYTHIA, the first ancient text restoration model that recovers missing characters from a damaged text input using deep neural networks. Its architecture is carefully designed to handle longterm context information, and deal efficiently with missing or corrupted character and word representations. To train it, we wrote a nontrivial pipeline to convert PHI, the largest digital corpus of ancient Greek inscriptions, to machine actionable text, which we call PHI-ML. On PHI-ML, PYTHIA’s predictions achieve a 30.1% character error rate, compared to the 57.3% of human epigraphists. Moreover, in 73.5% of cases the ground-truth sequence was among the Top-20 hypotheses of PYTHIA, which effectively demonstrates the impact of this assistive method on the field of digital epigraphy, and sets the state-of-the-art in ancient text restoration.

Authors' Notes

Historians rely on different sources to reconstruct the thought, society and history of past civilisations. Many of these sources are text-based – whether written on scrolls or carved into stone, the preserved records of the past help shed light on ancient societies. However, these records of our ancient cultural heritage are often incomplete: due to deliberate destruction, or erosion and fragmentation over time. This is the case for inscriptions: texts written on a durable surface (such as stone, ceramic, metal) by individuals, groups and institutions of the past, and which are the focus of the discipline called epigraphy . Thousands of inscriptions have survived to our day but the majority have suffered damage over the centuries, and parts of the text are illegible or lost (Figure 1). The reconstruction ("restoration") of these documents is complex and time consuming, but necessary for a deeper understanding of civilisations past.

One of the issues with discerning meaning from incomplete fragments of text is that there are often multiple possible solutions. In many word games and puzzles, players guess letters to complete a word or phrase – the more letters that are specified, the more constrained the possible solutions become. But unlike these games, where players have to guess a phrase in isolation, historians restoring a text can estimate the likelihood of different possible solutions based on other context clues in the inscription – such as grammatical and linguistic considerations, layout and shape, textual parallels, and historical context. Now, by using machine learning trained on ancient texts, we’ve built a system that can furnish a more complete and systematically ranked list of possible solutions, which we hope will augment historians’ understanding of a text.

Figure 1: Damaged inscription: a decree of the Athenian Assembly relating to the management of the Acropolis (dating 485/4 BCE). IG I3 4B. (CC BY-SA 3.0, WikiMedia)

Pythia

Pythia – which takes its name from the woman who delivered the god Apollo's oracular responses at the Greek sanctuary of Delphi – is the first ancient text restoration model that recovers missing characters from a damaged text input using deep neural networks. Bringing together the disciplines of ancient history and deep learning, the present work offers a fully automated aid to the text restoration task, providing ancient historians with multiple textual restorations, as well as the confidence level for each hypothesis.

Pythia takes a sequence of damaged text as input, and is trained to predict character sequences comprising hypothesised restorations of ancient Greek inscriptions (texts written in the Greek alphabet dating between the seventh century BCE and the fifth century CE). The architecture works at both the character- and word-level, thereby effectively handling long-term context information, and dealing efficiently with incomplete word representations (Figure 2). This makes it applicable to all disciplines dealing with ancient texts ( philology , papyrology , codicology ) and applies to any language (ancient or modern).

Figure 2: Pythia processing the phrase μηδέν ἄγαν ( Mēdèn ágan ) "nothing in excess," a fabled maxim inscribed on Apollo’s temple in Delphi. The letters "γα" are the characters to be predicted, and are annotated with ‘?’. Since ἄ??ν is not a complete word, its embedding is treated as unknown (‘unk’). The decoder outputs correctly "γα".

Experimental evaluation

To train Pythia, we wrote a non-trivial pipeline to convert the largest digital corpus of ancient Greek inscriptions ( PHI Greek Inscriptions ) to machine actionable text, which we call PHI-ML. As shown in Table 1, Pythia’s predictions on PHI-ML achieve a 30.1% character error rate, compared to the 57.3% of evaluated human ancient historians (specifically, these were PhD students from Oxford). Moreover, in 73.5% of cases the ground-truth sequence was among the Top-20 hypotheses of Pythia, which effectively demonstrates the impact of this assistive method on the field of digital epigraphy, and sets the state-of-the-art in ancient text restoration.

Table 1: Pythia's Predictive performance of on PHI-ML.

The importance of context

To evaluate Pythia’s receptiveness to context information and visualise the attention weights at each decoding step, we experimented with the modified lines of an inscription from the city of Pergamon (in modern-day Turkey)*. In the text of Figure 3, the last word is a Greek personal name ending in -ου. We set ἀπολλοδώρου ("Apollodorou") as the personal name, and hid its first 9 characters. This name was specifically chosen because it already appeared within the input text. Pythia attended to the contextually-relevant parts of the text - specifically, ἀπολλοδώρου. The sequence ἀπολλοδώρ was predicted correctly. As a litmus test, we substituted ἀπολλοδώρου in the input text with another personal name of the same length: ἀρτεμιδώρου ("Artemidorou"). The predicted sequence changed accordingly to ἀρτεμιδώρ, thereby illustrating the importance of context in the prediction process.

Figure 3: Visualisation of the attention weights for the decoding of the first 4 missing characters. To aid visualisation, the weights within the area of the characters to be predicted (‘?’) are in green, and in blue for the rest of the text the magnitude of the weights is represented by the colour intensity. The ground-truth text ἀπολλοδώρ appears in the input text, and Pythia attends to the relevant parts of the sequence.

Future research

The combination of machine learning and epigraphy has the potential to impact meaningfully the study of inscribed texts, and widen the scope of the historian’s work. For this reason, we have open-sourced an online Python notebook, Pythia, and PHI-ML’s processing pipeline at https://github.com/sommerschield/ancient-text-restoration , collaborating with scholars at the University of Oxford . By so doing, we hope to aid future research and inspire further interdisciplinary work.

*Specifically, lines b.8- c.5 of the inscription MDAI(A) 32 (1907) 428, 275.


The Story of India’s Many Scripts

While India’s scripts are ancient, technology and modernity are changing their usage patterns.

Only a few years ago, things did not seem to be going well for India’s various alphabets, often known as the Indic or Brahmic scripts after the historical Iron Age script that is the ancestor of modern South and Southeast Asian writing systems. Digitalization and the widespread proliferation of Roman-alphabet keyboards in India meant that Indian users would often transcribe Indian languages using ad hoc Romanizations on the internet and via text.

Yet today, one can’t follow the Indian Twittersphere or Indian content on social media and the rest of the internet without noticing the recent proliferation of Indic script material, particularly Devanagari (the script used for Hindi, Marathi, and Nepali). Technology and innovation helped this process along, and instead of shrinking the sphere of Indic script usage, they allow Indic scripts to be used more broadly, especially at the popular level. The use of Unicode, and the spread of Indic script transliteration and typing interfaces on Google, and on phones—which is how most Indians access the Internet—have all made it much easier to publish online in Indic scripts. Many phones and computers in India are not specifically designed with Indic script keyboards and instead use the Roman alphabet keyboards common in the West. Transliteration software renders this moot. The increased use of Indic-language scripts has also lead to newer and more artistic fonts for Indian languages.

In short, this is a golden age for Indic language script usage, due to technology and increased literacy. This is despite both the proliferation of English-language education in India, and the shoddy quality of public schools in that country. The very nature of modernity, with its mass communication, advertisements, social platforms, and the spread of information and entertainment to everyone with a smartphone, means that everyone will eventually gain and utilize basic literacy, even if by osmosis and not formal education. And most of this literacy in India will be in local languages. This will be the first time in India’s recorded history that its scripts are being used so widely.

India has a long history of writing. While India has been a literate culture for millennia, it has also greatly valued oral knowledge. The ancient Hindu scriptures, the Vedas, the oldest of which dated to around 1500 BCE were memorized verbatim for at least a thousand years, if not more, before being committed to writing. The oldest writing found in the subcontinent is the as yet undeciphered script of the Indus Valley Civilization (IVC), which seems to have been somewhat logo-syllabic in nature. The script fell out of use by 1500 BCE.

The Indus Valley Script. Source: Wikimedia Commons

The linguistic landscape of the subcontinent changed dramatically during the 2nd millennium BCE, so that is is impossible to determine if there is a connection between the IVC script and the next clearly attested script in India, the Brahmi script found in the inscriptions of the Mauryan Emperor Ashoka (ruled 268-232 BCE), especially since they probably represented vastly different, unrelated languages.

The sudden appearance of the Brahmi writing system is one of the great mysteries of writing in India, as there is no evidence of inscriptions beforehand. Another script, the (extinct, childless) Kharosthi of northwest Pakistan and Afghanistan seems to be clearly derived from the imperial Aramaic script used by the Persians who ruled over parts of the Indus Valley for two centuries until the arrival of Alexander the Great. It is unclear if the fully developed Brahmi script was invented by the Mauryan Empire as a result of exposure to Aramaic, but this seems unlikely, particularly since there were advanced states in the Ganges valley and a corpus of Vedic literature dating from before the Mauryan period.

Diplomat Brief

Weekly Newsletter

Get briefed on the story of the week, and developing stories to watch across the Asia-Pacific.

It is more likely that pre-Mauryan inscriptions may still be discovered, and in fact, some Brahmi inscriptions have been found in Tamil Nadu and Sri Lanka dating to the 6th century BCE. Is it possible then, that writing spread from the south to the north, countervening the traditional notion that the Indic scripts originate in the Ganges valley? This may quite possibly be the case, especially since the coasts of southern India were more exposed to foreign trade from the Middle East than northern India, and scripts from traders could have been brought to India this way (the same way the Phoenicians brought their script to Greece). This long gestation period and overland route from southern to northern India may explain why the Brahmi script, even if it is vaguely derived from Middle Eastern alphabets, is so different and nativized, especially relative to the more obviously Middle Eastern-inspired Kharosthi.

The Possible Evolution of Brahmi from Middle Eastern Scripts. Source: Wikimedia Commons

Once the Brahmi script was spread throughout India by the subcontinent-wide Mauryan Empire, it was used by the subcontinent’s elites.However, unlike imperial China with its unified central government and bureaucratic exam system, and Christian and Muslim societies that were united by a written scripture, oral culture and regional differences in India led to the Brahmi script differentiating and evolving into different scripts in various regions of India, a phenomenon that was already occurring by the end of the Maruyan period in the 2nd century BCE. This phenomenon—each literary language having a particular and unique script—is not actually that unique to India, as the various languages of the ancient Near East and Mediterranean also evolved their own scripts from a common source.

The increased need for quicker, daily writing, versus use for monumental inscriptions may have led to the predominance of cursive styles that evolved into India’s modern scripts. Various other factors may have been at play, such as the material used for writing: in South India, scripts became more rounded, as a result of writing on palm leaves, while in North India, cloth and birch bark allowed for more angular lines, and indeed the major division amongst Brahmic scripts is between the southern Indian/Southeast Asian scripts and the northern Indian and Tibetan scripts.

The Differentiation of Brahmi Letter Shapes. Source: Wikimedia Commons

Regional linguistic differences also helped Indic writing proliferate into many scripts in both South and Southeast Asia. It became prestigious for every major language to have its own script, though what evolved into today’s Devanagari (which began to emerge by the 7th century CE) script retained a special prestige due to its close association with Sanskrit. It is unclear if the evolution of Indic scripts into new forms would have ever stopped had it not been for the standardization process that is necessary for a print-oriented mass modern society. Relatively recently, for example, Devanagari spawned new, regional variations such as the Gujarati script, indicating that there was no real “final form” in the evolution of letter shapes in Indic writing. This seems to have remained the case, even when Indic-script users were exposed to the more unchanging Roman and Arabic alphabets.

The Evolution of Letter Shapes. Source: Wikimedia Commons

The change in letter forms leading to new scripts was probably so slow, generation by generation, that the process did not necessarily involve conscious change from one script to another, but a slow evolution of differences in letter formation as texts were copied throughout the ages. A similar development occurred in medieval Europe with the Latin script, but the development of the printing press, and Renaissance ideas about how the Latin script ought to look like led to a typographical convergence.

Brahmi and Devanagari found together on a pillar. Source: Wikimedia Commons

The evolution of Brahmi into so many scripts over time in India does however raise the question of what individuals and scribes thought about the changes upon becoming aware—and they were aware, as inscriptions in multiple different Indian scripts have been found together, like Kannada with Devanagari—of the fact that their contemporary writing systems were divergent in separate regions, and were also vastly different from the forms found in inscriptions and ancient documents. While 19th century scribes of Indian scripts were unable to tell the British what was written on ancient pillars from the Mauryan Era (the British deciphered Brahmi in 1837), this inability to read ancient forms of writing does not always seem to be the case. In fact, there have been examples of Mauryan, Gupta, and early Nagari inscriptions found together, with each subsequent script alluding to the content of what was written before it in a predecessor script.

But that fact that this knowledge was lost over time and that Indian scripts differentiated into so many forms does seem to indicate that literacy was not widespread and was limited to pockets of individuals, a trend which probably accelerated due to the eclipse of a pan-Indian literary culture after the 12th century. Before the emergence of a modern, mass culture throughout India, writing styles and scripts were particular to regions, and even castes, with scribes and merchants often utilizing their own scripts, which were usually simpler forms of the more formal monumental alphabets used for official or religious purposes.

However, modern trends such as the emergence of a politically unified, subcontinent-wide state in India, new scholarship, and technology seem to be reversed the differentiation that has characterized Indian scripts for past 2,000 years. The literacy of hundred of millions of people in native scripts makes it unlikely that the shapes of letters used by millions of people everyday for communication will change anytime soon, as that would lead to confusion and a lack of communication. The standardization and use of some scripts for mass print and online have also led to the decline of caste and trade based scripts, as well as many local variations. Many hitherto unwritten modern languages are now written in established scripts, usually the script most prevalent in that particular state of India’s, instead of evolving a new script for the language.

While India’s scripts are ancient, technology and modernity are changing their usage patterns, and are in fact allowing them to thrive as never before in standardized and widely used forms, as more people gain literacy and access to the internet.


Get around [ edit ]

While Corpus Christi is ostensibly laid out in a classic city-block style, the adaptation of that system to the local geography can make navigation a little confusing. Nevertheless, there are several main roads that traverse nearly the entire city, and these can be used to orient yourself if you find yourself lost.

By car [ edit ]

Most visitors and locals travel around Corpus Christi in cars. Most likely, a rental or personal car is the best way for you to see the city.

The main routes one needs to know to get around efficiently in Corpus Christi are I-37, South Padre Island Drive (TX-358), NS Crosstown Expressway (TX-286), 그리고 Ocean Drive/Shoreline Boulevard (Ocean Drive is an extension of Shoreline Blvd. for about seven miles along Corpus Christi Bay).

I-37 brings you into town from the west and ends on Shoreline Drive downtown on the Bayfront.

Shoreline Blvd. is a section of about four miles in downtown Corpus Christi along the bay. It begins in the area of the Art Museum of South Texas and leads south, becoming Ocean Drive. Following Ocean Drive takes one through the most scenic part of the city and to its end at the Naval Air Station and Texas A&M.

South Padre Island Drive does not go to South Padre Island (a frequent mistake made by visitors), but is better thought of as the southern section of Padre Island Drive. It is a section of 358 running from I-37 down the southern side of the city from northwest to southeast and ending on Padre Island at Padre Island National Seashore. Along it is the main shopping and dining area for the city. Locals will invariably refer to South Padre Island Drive as S.P.I.D., with the letters always pronounced separately. Visitors should remember that there will not be signs reading SPID. Instead, many read NAS-CCAD (for Naval Air Station and Corpus Christi Army Depot) or TX-358.

Connecting the northern end of S.P.I.D. to the downtown area near where I-37 ends is the Crosstown Expressway.

NS Harbor Bridge takes drivers over the ship channel from downtown to Corpus Christi Beach, a popular destination for tourists.

By public transit [ edit ]

Corpus Christi has a small trolley service (actually buses poorly disguised as trolleys) and a citywide bus service. Both are run by the Corpus Christi Regional Transit Authority, and schedules can be found at their website [11].

There is no Metro, subway, or any other form of a city rail service.

Car rental services can be found at the airport or along S.P.I.D.

Corpus Christi has a marina, for those few lucky enough to travel by water.


Epi-Olmec script

One of the most important Olmec finds was the discovery of an inscribed slab found under the waters of the Acula River near the village of La Mojarra in 1986 in the Mexican state of Veracruz. Dubbed Stela 1 of La Mojarra, this monument was inscribed with 465 glyphs arranged in 21 columns, and the image of a ruler. The writing on it is nothing like any other writing system in Mesoamerica, such as Maya, Zapotec, Mixtec, or Aztec, although like the Maya it also used the Long Count.

However, Stela 1 of La Mojarra is not the only example of its writing system. Most of the monuments that bear glyphs in the same (or similar) writing system are also found near the Isthmus of Tehuantepec, the thin stretch of land that separates the majority of Mexico from its south-eastern states and from Central America, although none has texts as long as the Stela. The famous Tuxtla Statuette, a hand-length nephrite figurine of an almost comedic man dressed in a duck's outfit, bears a Long Count date of 162 CE as well as non-calendric glyphs. Other famous inscriptions include Stela C of Tres Zapotes, with a Long Count date of 32 BCE, and Stela 1 of Chiapa de Corzo (located in Chiapas, Mexico), with an incomplete date conjectured to be 36 BCE. In the site of Cerro de las Mesas, Veracruz, highly erroded monuments also bear Long Count dates, but from the early Classic period at around 450 CE, as well as a large stone version of the Tuxtla Statuette devoid of any text.

Scholars have given this script many names, epi-Olmec was chosen since it is more common in scientific literature. Some have called this script the "La Mojarra script" after the location where the Stela was found. Another name, also based on a geographical name, is the "Isthmian Script", named after the Isthmus of Tehuantepec. You would find all three names used in publications, and websites. Yet another name is the "Tuxtla Script", named after the Tuxtla Statuette as well as the Tuxtla Mountains near which many of the texts have been found.

Left side image of La Mojarra Stela 1, showing a person identified as "Harvester Mountain Lord". Inscriptions in the Isthmian or Epi-Olmec script on the right side of La Mojarra Stela 1

The Epi-Olmec script turned out to be structurally similar to the Maya. It is logophonetic, meaning that one set of the signs, the phonograms, have phonetic values, while the other glyphs, called logograms, represents morpheme. A morpheme is a word or part of a word that cannot be broken further into smaller units with relevant meaning. For instance, the English word beautiful can be broken down into beauty and -ful, neither of which can be broken down further. Beauty is a morpheme because it is a word. Furthermore, -ful carries the meaning of "a lot of", and can also be used with other words, like bountiful, faithful, and others. Hence it is not a unique derivation of beauty, but a morpheme in its own right.

In a logophonetic system, both logograms and phonograms are used. Frequently logograms make up the root of a word whereas phonograms spell out the prefixes and suffixes that modify the root.

The vowel u ("u" with a line through the middle) is a strange vowel. It is a central high vowel, meaning that it's like the common vowel [i] but the position of the peak of the tongue is halfway between the throat and the teeth. You can check out Phonetics for details on how to pronounce it.

All phonograms in the Epi-Olmec script represent syllables. So we call the set of phonograms the syllabary:

The Epi-Olmec culture was a cultural area in the central region of the present-day Mexican state of Veracruz, concentrated in the Papaloapan River basin, a culture that existed during the Late Formative period, from roughly 300 BCE to roughly 250 CE. Epi-Olmec was a successor culture to the Olmec, hence the prefix "epi-" or "post-". Although Epi-Olmec did not attain the far-reaching achievements of that earlier culture, it did realize, with its sophisticated calendrics and writing system, a level of cultural complexity unknown to the Olmecs.