Georgian
 Web Typography

 

KKKKKKKKKKKKKKKKKKKKK

    

Unicode, ISO 10646 და ქართული კომპიუტერული დამწერლობის სტანდარტიზება

Unicode encoded Georgian document

 

დანართები

  1. პრობლემის ჭრილები

  2. სტანდარტები, რომლებშიც ასახულია ქართული

  3. ზოგი არაკლასიფიცირებული პრობლემა

  4. Georgian script - Production First Software

  5. Georgian - Windows 98 and Windows 2000

  6. Monotype ქართულზე

  7. "სტანდარტის" შესახებ გიორგი ალხაზიშვილი


დანართი 1 - პრობლემის ჭრილები

პრობლემის გასათვალისწინებელი ჭრილების იერარქიული ჩამონათვალი:

  • ქართული დამწერლობა ზოგადად

    • თანამედროვე (ლიტერატურული) ქართული დამწერლობა

    • ძველქართული, ხუცური დამწერლობები (ნუსხური და მთავრული)

    • ქართული დიალექტებისა და ქართველური ენების დამწერლობა

    • იბერიულ-კავკასიური ენების დამწერლობა

  • ქართული დამწერლობის სიმბოლოები

    • ლიტერატურული ქართულის სიმბოლოები

      • ასოები

      • ციფრები (არაბული და რომაული)

      • პუნქტუაციის ნიშნები

      • სპეციფიური სასტამბო ნიშნები და სიმბოლოები (ბრჭალები და ა.შ.)

      • სხვადასხვა სიმბოლოები (ნომერი, ფულის ნიშანი...)

      • ასოების ინვარიანტები

    • ძველქართული დამწერლობის სიმბოლოები

      • ასოები

      • პუნქტუაციის ნიშნები

      • სიმბოლოები

  • ქართული დამწერლობის კომპიუტერული გამოყენება

    • სახელმწიფო

    • მეცნიერება და განათლება

    • მასობრივი კომუნიკაციები (პრესა, ინტერნეტი...)

    • მეურნეობა და სხვა

...

დამწერლობის სტანდარტიზების იერარქია
 

  • Basic set (პრაქტიკული გამოყენების 99,99%) -

  • თანამედროვე ქართული

  • Extended set -

  • ძველქართული

  • დიალექტები და ქართველური ენები

  • სიმბოლოები

  • ქართული კომპიუტერული დამწერლობის სატანდარტიზების სფეროები (და პასუხისმგებლობის დონეები)

    • საერთაშორისო

    • შიგასახელმწიფოებრივი

    • უწყებრივი და ა.შ.

    მაგალითები (სხვა ენებიდან):

    • ძველი და ახალი დამწერლობის ასახვის

    • დიალექტების ასახვის

    ...


    დანართი 2 - სტანდარტები, რომლებშიც ასახულია ქართული

    სტანდარტები და სხვა ნორმატივები, რომლებშიც ასახულია ქართული

    (ამოკრეფილია სხვადასხვა წყაროებიდან)

    Unicode
    *
    ISO/IEC 10646 - The Extended European Subset includes, exhaustively, the collections of ISO/IEC 10646-1 characters containing the Latin, Greek, Cyrillic, Armenian, and Georgian scripts
    *
    10586 DIS Georgian coded character set for bibliographic information interchange
    *
    ISO 3166, Microsoft, and Macintosh Country Codes:
    Country+ISO Code2+ISO Code3+ISO CodeN+Win Code+Mac Name+ Mac Code=GEORGIA+GE+GEO+268
    *
    24 Character entity references in HTML 4.0 --- Character entity references for ISO 8859-1 characters ----<!ENTITY middot CDATA "&#183;" -- middle dot = Georgian comma
    *
    AulUnicodeRange:
    Bit+Description=26+Basic Georgian;27+Georgian Extended
    *
    ISO 639:1988 (E/F):
    ka+Georgian
    *
    ISO CD 639/2 Draft dated 10/15/92:
    lang iso639-2+"geo/kat";iso639-1+"ka"
    *
    International Organization for Standardization (ISO) 639 language codes:
    ka+Georgian
    *
    MARC 3-CHARACTER LANGUAGE CODES:
    geo+Georgian
    *
    Language Codes ISO 639:
    Microsoft and Macintosh Language+ISO Code+Win Code+Mac Name+Mac Code;
    Georgian+ka+0+langGeorgian+52+0
    *
    Macintosh platform-specific encoding IDs (script manager codes), (platform ID=1):
    Code+Script;23+Georgian
    *
    NISO Z39.53 Language Codes:
    Code+Language;GEO+Georgian
    *****

    Microsoft
    *
    The SORTIDFROMLCID macro retrieves a sort identifier from a locale identifier
    SORT_GEORGIAN_MODERN Georgian Modern order.
    SORT_GEORGIAN_TRADITIONAL Georgian Traditional order.

    ! აქ ჩანს, რომ მაიკროსოფტმი ესმით ქართულის ორი რიგის არსებობა: თანამედროვესი (ილიასეულის) და ძველის !
    *
    Windows NT 5.0 and later: The ANSI version of GetLocaleInfo will fail for the following LCIDs: the Indic languages, Armenian, and Georgian, because these locales are Unicode only.
    ! აქედან ჩანს, რომ ქართული ენის იდენტიფიცირება-განსაზღვა მოხდება მხოლოდ Unicode-ს ქართული ბლოკის მიხედვით !
    *
    The Office9.adm template contains policy settings that are common to all of the Microsoft Office 2000 applications. The following policies are available in the Office9.adm template.
     

    USER SETTINGS

    Microsoft Office 2000
    Language settings
            User Interface
                Display menus and dialog boxes in
                Display help in
            Enabled Languages
                Show controls and enable editing for
                    Afrikaans...
                    Georgian
                    Vietnamese...

    *
    Which of the Windows 2000 locales do not have codepage support?
    These 16 locales do not have codepages, and are supported in Windows 2000 solely through Unicode:

    Armenian (Armenia)
    Georgian (Georgia)
    Hindi (India)
    Bengali (India)
    Punjabi (India)
    Gujarati (India)
    Oriya (India)
    Tamil (India)
    Telugu (India)
    Kannada (India)
    Malayam (India)
    Assamese (India)
    Marathi (India)
    Sanskrit (India)
    Konkani (India)
    Nepali (India)

    *
    Language Identifiers
    0x37 LANG_GEORGIAN Georgian
    0x0437 Georgian
    *
    This document describes technologies available in the Internet Explorer 5 Beta.
    typedef enum tag SCRIPTCONTF{ sidGeorgian, } SCRIPTCONTF;
    sidGeorgian Identifier for Georgian script.
    *****

    Web Fonts. W3C Working Draft 21-July-1997. Range of Unicode characters: Block+Add+Block name+Unicode range 26+4+Georgian+U+10A0-10EF; 27+8+Georgian Extended+U+10F0-10FF ??


    AulUnicodeRange:
    Bit+Description;26+Basic Georgian;27+Georgian Extended

    ***

    Java, Windows NT, AIX, NetWare 4.0, QuickDraw GX, which are Unicode Standard compliant


    დანართი 3 - ზოგი არაკლასიფიცირებული პრობლემა

    აქ გამოვყოფთ ასეთ საკითხებსა და განსახილველ ტერმინოლოგიას:
     

    • თანამედროვე ლიტერატურული ქართულის დამწერლობის დამკვიდრების იტორია, ბრძოლა მე-19-ე საუკუნის მეორე ნახევარს -- ილია, აკაკი, იაკობ გოგებაშვილი, "ივერია", "ქართველთა შორის წერა-კითხვის გამავრცელებელი საზოგადოება"...;

    • ქართული დამწერლობის სრულყოფისათვის ბრძოლა საბჭოთა პერიოდში - აკაკი შანიძე, არნოლდ ჩიქობავა, კონსტანტინე გამსახურდია, პაატა გუგუშვილი (ნაშრომები ჟურნალისტიკის, ქართული წიგნისა და კრძოდ სასტამბო შრიფტების შესახებ)...;

    • ქართული დამწერლობა ფართო გაგებით - არა მხოლოდ თანამედროვე ლიტერატურული ქართულის ასოები, არამედ ძველქართულისაც და დიალექტებისაც;

    • ორი ქართული დამწერლობა -- თანამედროვე (მხედრულზე დაფუძნებული ლიტერატურული ქართული) და ძველი-ხუცური; "დიდი" და "პატარა" ასოების ორი რიგი (მაგალითისათვის, MacCampus-ის ფონტი "ფარნავაზი"):

    • ქართული სასტამბო მეურნეობის სრული ასახვა კომპიუტერულ ფონტებში (ციფრები, სასვენი ნიშნები, რომაული ციფრები, ასოთა ინვარიანტები და ა.შ).


    დანართი 4 - ფაქტოგრაფია (ამონაკრები)
    ...


    დანართი 5 - Georgian script - Production First Software  

    "...
    Georgian script See references under Asomtavruli, Khutsuri, Nuskhuri, and Mkhedruli for descriptions of Georgian alphabets

    Asomtavruli A secular incriptional unicameral alphabet of Georgian. Some Production First Software fonts have Asomtavruli encoded as UPPERCASE in the Georgian block.

    Khutsuri Another name for the ecclesiastical alphabet of Georgian. Khutsuri uses both UPPERCASE and lowercase glyphs. Most Production First Software fonts have at least the UPPERCASE letterforms, but a few have both.

    Nuskha-Khutsuri See Khutsuri.

    Nuskhuri Another name for the Khutsuri alphabet of Georgian.

    Mkhedruli Another name for the modern or secular inscriptional alphabet of Georgian. Mkhedruli is a unicameral alphabet. Some Production First Software fonts have Mkhedruli encoded as both UPPERCASE and lowercase, some only as lowercase, and some present as variant glyphs.

    Unicameral alphabet An alphabet having only one case. Examples include Single Alphabet Uncial (mixed upper and lowercase); Arabic, Burmese, Georgian, Hebrew, Indic, Tibetan, and Thai alphabets (caseless). For definitions of all cases, see case.

    Case A property of certain alphabets and scripts whereby at least one letterform has more than one variant form; and a property of characters, letterforms and character glyphs. The only alphabets and scripts which include character glyphs having more than one case classification are: Armenian, Cyrillic, Georgian, Greek, and Roman... There are five classification of case: UPPERCASE, Titlecase, lowercase, mixed, and caseless... Considering a digraph 'DZ' (which occurs in Eastern European languages), the UPPERCASE would be 'DZ', the lowercase would be 'dz', and the Titlecase, used where the first letterform only is to be capitalized, would be 'Dz'... The mixed classification applies to alphabets which are comprised of a mixture of UPPERCASE and lowercase letterforms, each letter only having one case form rather than two. An example of this is a Single Alphabet Uncial typeface. The caseless classification applies to letterforms which have only a single case, but which are incorporated in alphabets or scripts which have the property of case... Character glyphs which are usually considered caseless include such symbols as mathematical operators, monetary units, numerals, and punctuation... Numerals normally are caseless...

    Unicode A fixed-width, double-byte (16 bit) encoding standard covering many language alphabets and scripts. It is identical to the first (basic multilingual) plane (65,536 characters) of the more extensive 4-byte ISO/IEC/10646 character encoding standard. Also included are widely used utility characters (dingbat and pi characters) and presentation forms for several alphabets and scripts... A font which encompasses the entire Unicode character collection could service most currently spoken languages.

    Unicode was originally developed, through the Unicode Consortium, by a number of companies including, but not limited to: Apple Computer, Inc., Digital Equipment Corporation, Hewlett-Packard Company, IBM Corporation, Microsoft Corporation, NeXT Software, Inc., Novell, Inc., Research Libraries Group, Silicon Graphics, Inc., Spyglass, Inc., Sun Microsystems Inc., Sybase, Inc., and Xerox Corporation. The development timetable of the Unicode standard has been as follows: 1991 - Unicode 1.0; 1993 - Unicode 1.1 (Unification of ISO 10646 and Unicode was achieved with this version); 1996 - Unicode 2.0; 1997 - Unicode 2.1... The first commercially-available Unicode font was designed and produced by Production First Software in late 1991 and used in commercial graphics work starting then...

    ISO 10646 (ISO/IEC/10646.x) A 4-byte, 32-bit, font character set and encoding standard divided into 32,768 « planes, » each of which permits 65,536 characters (for a total of 2,147,483,648 characters). It was developed prior to Unicode, and Unicode currently is identical to the first plane, which is called the «Basic Multilingual Plane.» The higher planes will probably be used mostly for alphabets or scripts no longer in use or perhaps non-alphabetic symbols (architectural, scientific, etc.). Planes 1-14 will be used for characters assigned in the future. Planes 15 and 16 will be reserved as Private Use Zones. The remaining planes have not yet been reserved. ISO10646 consists of two forms: a full 4-byte 32-bit encoding with 128 groups of 256 planes of 65,536 characters, called UCS-4 (Universal Character Set, 4-byte); and a 2-byte 16 bit encoding of plane 0 (the first plane) identical to Unicode, called UCS-2 (Universal Character Set, 2-byte)...

    ISO/DIS/10586 Encoding standard for Georgian script...

    ..."


    დანართი 6 - Georgian - Windows 98 and Windows 2000 Design a Single Unicode App that Runs on Both Windows 98 and Windows 2000

    F. Avery Bishop

    F. Avery Bishop works in the Windows Operating System division International group at Microsoft as an evangelist for international software development.

    "...
    Windows 2000 is planned to include support for new scripts through Unicode only, new multilingual user interface APIs, a multilanguage version of Windows 2000 Professional, and the ability to give Arabic and Hebrew apps a right-to-left orientation on any variation of Windows 2000.
    ...
    The most obvious reason to use Unicode is its ability to represent multiple languages without tedious switches in character encoding. As you'll see in the sample code, this Unicode benefit is most evident in applications supporting multilingual user interfaces. Another important motivation is that all new script support on Windows NT will be based on Unicode only—there will be no new ANSI code page support except in rare circumstances. The first scripts that are planned to fall under this strategy in Windows 2000 will be Indic (Devanagari and Tamil) as well as Armenian and Georgian.
    ..."


    დანართი 7 - Monotype ქართულზე - Georgian

    "...Mxedruli, the script for Modern Georgian, consists of 33 letters, and is written from left to right... While all letters of the Georgian alphabet sit on a baseline, some also have ascenders, descenders, or both. Georgian has no feature corresponding to the distinction of upper and lower case. In a special 'headline' style, all parts of each letter are made to sit on the baseline, in some cases resulting in a change of proportions in the letterform..."

    "...Taking its entire history into consideration, the Georgian alphabet has changed very little. This stability is in large part due to the good design of the alphabet: each letter corresponds to a unique phoneme, and each phoneme is written by one letter only. Besides the various dialects of the Georgian language, Georgian script was at one time used to write Abkhaz and other languages of the Caucasus." Copyright ©1997 Monotype Typography. All rights reserved. Revised: 13 January, 1999 "
     


    დანართი 8 -
    აი რას გვწერს ე.წ. "სტანდარტის" შესახებ თბილისური GSS ფირმის პროგრამისტი გიორგი ალხაზიშვილი.
    9 Mar 1999 [Giorgi Alhazishvili <gio@gss-ltd.com>]

    "...agmovchndi sorosis fondis mier shekrebil 'mrgval magidaze', romelic midzgvnili iko scored "qartuli komputershi" temas. mandve sheiqmna samushao jgupi. mas daevala gaerkvia mdgomareoba da shemoetavazebina 8 bitiani standartis proeqti."

    -- როგორც აქედან ჩანს სახელმწიფო(!) სტანდარტის შექმნის საკითხი დაისვა, მის შემმუშავებელთა წრე განისაზღვრა, და "დავალება" გაიცა - ამით კი საკითხის ბედი პრაქტიკულად გადაწყდა -- კერძო უცხოური ფონდის დონეზე -- უცნაურია? ვფიქრობთ არა. ნიშანდობლივია.

    ამავე სტილში გაგრძელდა მუშაობა შემდგომაც -- "...shemdeg es proeqti daegzavna organizaciebs, magram mat didi kuradgeba ar miuqceviat, da bolos gaformda rogorc standarti."

    --- ე.ი. "სამუშაო ჯგუფის" პროექტი შესაბამისი დარგების სამეცნიერო ინსტიტუტებისა და საუნივერსიტეტო სამეცნიერო საბჭოების განხილვისა და ოფიციალური დასკვნა-დასტურის გარეშე "გაფორმდა"(!) როგორც "სახელმწიფო სტანდარტი". ვიცინოთ თუ ვიტიროთ?


    Monday, April 19, 1999, mod -- Jun. 26, 1999