Tài liệu Từ điển Việt - Nhật (Chuyên ngành: Công nghệ phần mềm): ... Ebook Từ điển Việt - Nhật (Chuyên ngành: Công nghệ phần mềm)
76 trang |
Chia sẻ: huyen82 | Lượt xem: 1651 | Lượt tải: 0
Tóm tắt tài liệu Từ điển Việt - Nhật (Chuyên ngành: Công nghệ phần mềm), để xem tài liệu hoàn chỉnh bạn click vào nút DOWNLOAD ở trên
MUÏC LUÏC
-----&-----
NOÄI DUNG TRANG
PHAÀN 0: MÔÛ ÑAÀU 3
PHAÀN 1: TOÅNG QUAN
I. Khaùi quaùt 4
II. Phaïm vi söû duïng 4
III. Ngöôøi söû duïng 4
IV. Nhieäm vuï 4
PHAÀN 2 : QUAÙ TRÌNH PHAÙT TRIEÅN VAØ ÑAËC ÑIEÅM CUÛA NHAÄT NGÖÕ.
Söï du nhaäp chöõ Haùn vaøo Nhaät Baûn 6
Hoaøn caûnh ra ñôøi heä chöõ Kana 7
Quaù trình phaùt trieån cuûa heä chöõ Kana 9
Ñaëc ñieåm cuûa heä chöõ Kana 11
Chöõ Hiragana 11
Nguoàn goác chöõ Hiragana 11
Phaïm vi söû duïng 12
Baûng kyù töï Hiragana 13
AÂm höõu thanh 13
AÛo aâm 14
Nguyeân aâm 14
Xuùc aâm 15
Chöõ Katakana 15
Nguoàn goác hình thaønh chöõ Katakana 15
Phaïm vi söû duïng 16
Caùch vieát chöõ Katakana 18
Vieäc kyù aâm caùc töø vay möôïn töø tieáng nöôùc ngoaøi 19
Caùc kieåu chöõ khaùc trong Nhaät Ngöõ. 20
Caùc daáu caâu trong Nhaät ngöõ. 20
PHAÀN 3 : NHAÄT NGÖÕ TRONG TIN HOÏC
Quaù trình phaùt trieån font chöõ 2 byte. 21
Boä kí töï tieáng Nhaät 21
ASCII vaø Katakana 22
7 bit JIS 23
8 bit JIS 23
Söï phaùt trieån cuûa boä kí töï Kanji 24
Boä kyù töï 2 byte (DBCS) 25
Söï chuyeån ñoåi giöõa SBCS vaø DBCS 26
Shift JIS and JIS 26
Unicode vaø ISO 106-46 27
Caùc phaàn meàm hoã trôï vieäc nhaäp chöõ Kana vaø Kanji 28
IME (Input Method Editor) 29
TwinBridge 35
Keát luaän 41
PHAÀN 4 : TÌM HIEÅU CAÙC COÂNG CUÏ HOÃ TRÔÏ CHO PHAÙT AÂM
Tìm hieåu veà Microftsoft Agent 40
Microsoft Agent laø gì ? 40
Caáu hình yeâu caàu. 41
Caøi ñaët Microsoft Agent 41
Laäp trình vôùi Microsoft Agent . 42
Cöûa soå caùc leänh phaùt aâm (Voice Commands Window). 43
Cöûa soå caùc chöùc naêng hoã trôï cho ñoái töôïng (Advanced Character Options Window). 44
Ví duï veà MS Agent 45
.Keát luaän 47
Tìm hieåu veà coâng cuï Microsoft Linguistic Information Sound Editing 47
Caøi ñaët trình soaïn thaûo aâm thanh 47
Taïo môùi moät taäp tin aâm thanh 48
Taïo thoâng tin cho ngoân ngöõ 48
Löu taäp tin aâm thanh 49
Söû duïng Editor cho Speech Engine khaùc. 50
Keát luaät 51
PHAÀN 5 : TÌM HIEÅU MOÄT SOÁ TÖØ ÑIEÅN ÑAÕ COÙ.
Töø ñieån EDICT 52
Töø ñieån JEDICT 54
Töø ñieån Babylon 57
Keát luaän 60
PHAÀN 6 : XAÂY DÖÏNG ÖÙNG DUÏNG MINH HOÏA TÖØ ÑIEÅN VIEÄT NHAÄT
Yeâu caàu chung 61
Phaân tích yeâu caàu 61
Löïa choïn DBMS vaø ngoân ngöõ laäp trình 61
Caùc yeâu caàu cuûa ñeà taøi vaø caùch giaûi quyeát 63
Thoâng tin caàn löu tröõ 64
Caùc coâng cuï, phaàn meàm caøi ñaët cho chöông trình 64
Caùc löu ñoà
Löu ñoà tìm kieám 65
Löu ñoà phaùt aâm 66
Caùc giao dieän
Maøn hình chính 67
Maøn hình ñieàu chænh gioïng noùi 68
Maøn hình tra cöùu kyù töï Kanji 69
Baøn phím nhaäp caùc kyù töï tieáng Vieät 69
PHAÀN 7 : TOÅNG KEÁT
KEÁT LUAÄN 70
HÖÔÙNG PHAÙT TRIEÅN 70
TAØI LIEÄU THAM KHAÛO 72
Hieän nay quan heä giöõa nöôùc ta vaø Nhaät Baûn caøng luùc caøng saâu saéc, caøng phaùt trieån maïnh, nhaát laø veà coâng ngheä thoâng tin.
Vieät Nam coi Nhaät Baûn laø moät trong ba nöôùc coù quan heä ngoaïi giao song phöông ñaày ñuû nhaát (cuøng vôùi Laøo vaø Campuchia), ñoàng thôøi laø ñoái taùc laøm aên tin caäy vaø oån ñònh nhaát. Hieän nay, taát caû ñaûng phaùi chính trò cuûa Nhaät ñeàu thoáng nhaát hôïp taùc vôùi Vieät Nam.
Vaø Nhaät Baûn ñaùnh giaù Vieät Nam laø moät trong naêm nöôùc coù tieàm naêng hôïp taùc lôùn, cuøng vôùi Trung Quoác, AÁn Ñoä, Haøn Quoác vaø Philippines.
Treân trang Web VnExpress ngaøy thöù 4 16/4/2003, theo Chuû tòch Hieäp hoäi phaàn meàm VN (VINASA) Tröông Gia Bình nhaïân ñònh Nhaät Baûn laø thò tröôøng tieàm naêng cuûa phaàn meàm Vieät Nam vaø ñaõ phaùt bieåu caùc coâng ty Nhaät Baûn ñeàu coù keá hoaïch sang Vieät Nam ñeå hôïp taùc phaùt trieån phaàn meàm. VINASA ñaõ ñeà nghò vôùi Ban chæ ñaïo 58 veà vieäc ñöa tieáng Nhaät vaøo chöông trình hoïc chính thöùc ñeå ñaøo taïo laäp trình vieân ôû caùc tröôøng ñaïi hoïc vaø cao ñaúng taïi Vieät Nam.
Vì theá vieäc hoïc tieáng Nhaät caøng luùc caøng phoå bieán, maëc duø chöõ Nhaät raát phöùc taïp nhöng theo soá lieäu gaàn ñaây cuûa Boä giaùo duïc Nhaät Baûn thì soá ngöôøi hoïc tieáng Nhaät treân theá giôùi öôùc khoaûng 2,5 trieäu ngöôøi vaø ngaøy caøng taêng, ñaëc bieät laø ôû Trung Quoác, Trieàu Tieân vaø caùc nöôùc Asean.
Do ñoù vieäc xaây döïng vaø phaùt trieån moät töø ñieån Vieät-Nhaät (Nhaät-Vieät) laø ñieàu voâ cuøng caàn thieát. Tuy nhieân treân theá giôùi hieän nay coù raát nhieàu töø ñieån tin hoïc ñang ñöôïc söû duïng roäng raõi, nhöng haàu heát caùc loaïi töø ñieån ñeàu laø töø ñieån töø tieáng Anh sang moät ngoân ngöõ khaùc vaø ngöôïc laïi. Vaø töø ñieån tieáng Vieät sang ngoân ngöõ khaùc haàu nhö raát ít, treân thò tröôøng haàu nhö chæ coù töø ñieån MTD2002 cuûa Laïc Vieät Computing Corp. laø daønh cho tieáng Vieät, coøn töø ñieån tin hoïc töø Vieät sang Nhaät haàu nhö khoâng coù.
Do ñoù vôùi ñeà taøi töø ñieån Vieät-Nhaät naøy coù theå giuùp cho ngöôøi Vieät Nam hoïc, söû duïng tieáng Nhaät deã daøng tra cöùu, vaø ñoàng thôøi cuõng giuùp cho ngöôøi Nhaät tra cöùu töø trong quaù trình hoïc, duøng tieáng Vieät Nam.
Khaùi quaùt
Phaàn meàm töø ñieån Vieät Nhaät laø moät phaàn meàm daïng deã tra cöùu cung caáp töø ñieån töø Vieät sang Nhaät.
Muïc ñích cuûa phaàn meàm naøy laø:
Xaây döïng moät töø ñieån nhoû goïn, deã daøng tra cöùu, giuùp ngöôøi söû duïng tìm ñöôïc töø mong muoán.
Phaùt aâm caùc töø tieáng Nhaät.
Phaïm vi söû duïng
Chöông trình seõ ñöôïc söû duïng cho caùc thö vieän, tröôøng hoïc, taïi nhaø.
Ngöôøi söû duïng
Chöông trình seõ ñöôïc söû duïng cho caùc ñoái töôïng coù nhu caàu tìm kieám, tra cöùu töø trong quaù trình hoïc taäp, nghieân cöùu tieáng Nhaät nhö hoïc sinh, sinh vieân, du hoïc sinh vaø giaùo vieân giaûng daïy tieáng Nhaät.
Nhieäm vuï
Tìm hieåu veà Nhaät ngöõ.
Tìm hieåu veà font chöõ tieáng Nhaät.
Tìm hieåu veà Unicode tieáng Nhaät.
Tìm hieåu caùc phöông phaùp phaùt aâm.
Xaây döïng öùng duïng minh hoïa töø ñieån Vieät-Nhaät nhoû goïn, deã daøng tra cöùu, vaø phaùt aâm caùc töø tieáng Nhaät.
Söï du nhaäp chöõ Haùn vaøo Nhaät Baûn
Nhaät Baûn cuõng nhö Vieät Nam, Trieàu Tieân ñeàu naèm trong khoái chòu aûnh höôûng saâu naëng cuûa neàn vaên minh Trung Quoác. Daáu hieäu roõ reät nhaát chính laø söï vay möôïn heä vaên töï Haùn - loaïi hình vaên töï vuoâng cuûa Trung Quoác - ñeå söû duïng ôû nöôùc mình. Ñieåm chung nöõa cuûa caû ba nöôùc naøy laø sau moät thôøi gian vay möôïn chöõ Haùn, moãi nöôùc ñeàu töï taïo cho mình loaïi vaên töï rieâng treân cô sôû nhöõng chöõ Haùn theo nhöõng yeâu caàu rieâng phuø hôïp vôùi ñaëc tröng ngoân ngöõ cuûa nöôùc mình. ÔÛ Nhaät ñoù laø heä chöõ Kana.
Tröôùc khi chöõ Haùn du nhaäp vaøo Nhaät thì ôû Nhaät Baûn khoâng coù chöõ vieát. Coù giaû thuyeát cho raèng töø raát xa xöa ôû Nhaät Baûn ñaõ coù moät loaïi chöõ vieát goïi laø Kamidomaji maø theo thaàn thoaïi thì loaïi chöõ naøy coù töø thôøi vua Shinbu. Nhöng giaû thuyeát naøy coù veû khoâng hôïp lyù vì neáu Nhaät ñaõ coù chöõ vieát roài thì taïi sao phaûi caát coâng ñi tìm chöõ vieát khaùc.
Taøi lieäu ñaàu tieân chöùng minh söï toàn taïi cuûa chöõ vieát taïi Nhaät laø moät vaên baûn vieát naêm 417 nhöng phaûi ñeán cuoái theá kyû thöù VI ñaàu theá kyû thöù VII môùi thöïc söï coù theå noùi coù chöõ vieát. Khoaûng theá kyû thöù V, nhöõng ngöôøi Nhaät Baûn vöôït bieån sang löu hoïc ôû Trung Quoác hoï ñaõ bò choaùng ngôïp bôûi söï kyø dieäu cuûa loaïi hình vaên töï vuoâng ghi yù vaø ñaõ nghó ñeán vieäc möôïn chöõ Haùn ñeå ghi tieáng Nhaät. Nhöng giöõ vai troø quan troïng nhaát ñoái vôùi vieäc ñöa Haùn töï vaøo Nhaät laïi laø moät soá ngöôøi thuoäc baùn ñaûo Trieàu Tieân.
Trieàu Tieân laø nôi vay möôïn vaø söû duïng Haùn töï sôùm hôn Nhaät. Hôn nöõa tieáng Trieàu Tieân coå vaø tieáng Nhaät laïi raát gaàn nhau. Trong soá nhöõng ngöôøi Trieàu Tieân sang Nhaät trong giai ñoaïn naøy coù nhöõng ngöôøi coù tri thöùc saâu saéc veà chöõ Haùn, ñoàng thôøi coù theå söû duïng caû tieáng Trieàu Tieân vaø tieáng Nhaät. Trong cuoán Kojiki (古 事 記) coù vieát raèng vaøo thôøi vua Ojin coù moät ngöôøi Trieàu Tieân teân laø Wani (鰐) töø moät nöôùc coå Kudara - ôû giöõa bieån Nhaät Baûn gaàn phía taây nam baùn ñaûo Trieàu Tieân – ñaõ sang Nhaät mang theo hai cuoán saùch laø Rongo (論 語) vaø Tenjibun (天 字 分) (coù taøi lieäu cho laø cuoán Thieân töï vaên (千字文 - Senjimon)). Rongo vöøa laø saùch giaùo khoa veà Khoång giaùo vöøa laø cuoán saùch giôùi thieäu caùc tri thöùc khoa hoïc cuûa Trung Quoác thôøi baáy giôø, coøn Tenjobun laø cuoán giaùo khoa veà chöõ Haùn. Wani ñaõ môû lôùp daïy hoïc, truyeàn baù nhöõng tri thöùc môùi cho ngöôøi Nhaät. Haàu heát caùc quan laïi trieàu ñình ñeàu laø caùc theá heä hoïc troø cuûa Wani
Nhaät ngöõ coå ñaïi chæ laø khaåu ngöõ. Nhöõng thoâng tin ñöôïc truyeàn ñi do nhöõng ngöôøi goïi laø Kataribe (語 部 – ngöõ boä). Hoï ñi khaép nôi, keå chuyeän vaø truyeàn ñaït caùc thoâng tin quan troïng.
Tuy nhieân trong moät thôøi gian daøi, hoïc chöõ Haùn ñoàng nghóa vôùi vieäc hoïc tieáng Trung Quoác. Lòch söû coøn löu giöõ trong vaên baûn phaùp luaät haønh chính cuûa trieàu ñình hay nhöõng cuoán saùch veà Phaät Giaùo cuûa thaùi töû Seitoku vieát hoaøn toaøn baèng chöõ Haùn vaø theo loái haønh vaên cuûa Trung Quoác. Daàn daàn soá ngöôøi vieát chöõ Haùn ngaøy caøng taêng, töø ñaây chöõ Haùn ñöôïc coâng nhaän laø vaên töï chính thöùc cuûa Nhaät.
Luùc ñaàu, ngöôøi Nhaät chæ duøng chöõ Haùn ñeå vieát tieáng Trung Quoác hoaëc vieát moät theå loaïi Haùn Nhaät gheùp laïi (cuoán Coå Söï Kyù ñöôïc saùng taùc naêm 712 laø taùc phaåm tieâu bieåu). Ngoaøi ra, chöõ Haùn coøn ñöôïc ngöôøi Nhaät söû duïng ñeå ghi caùc yeáu toá ngöõ phaùp khoâng coù trong tieáng Trung Quoác. Ví duï ñeå hieån thò chöõ “fa” trong tieáng Nhaät coå (tieáng Nhaät hieän ñaïi laø “wa”) ngöôøi Nhaät choïn nhöõng chöõ Haùn coù phaùt aâm gaàn gioáng chöõ “ha” (波 : soùng).
Heä phieân aâm naøy goïi laø vaïn dieäp giaû danh (万仮葉名 – Manyoâgana), chöõ giaû ôû ñaây coù nghóa laø giaû taù (仮借 - vay möôïn) yù noùi Nhaät ngöõ coå ñaïi khoâng coù chöõ vieát phaûi vay möôïn caùc neùt buùt cuûa chöõ haùn ñeå ghi laïi lôøi noùi. Phöông thöùc Manyoâgana (万仮葉名) naøy ñöôïc söû duïng roäng raõi trong caùc taäp thô ca Nhaät Baûn theá kyû thöù VIII. Ngoaøi ra, ngöôøi Nhaät coøn möôïn giaù trò ngöõ aâm cuûa caùc kyù töï Trung Quoác vaø ñaët chuùng gaàn nhau ñeå theå hieän töø vöïng tieáng Nhaät. Ví duï töø Nhaät Baûn ñòa thì “yama” coù nghóa laø nuùi ñöôïc vieát laø 也麻 töùc laø laáy 也 bieåu thò aâm “ya” vaø 麻 bieåu thò aâm “ma”.
Hoaøn caûnh ra ñôøi cuûa heä chöõ Kana
Chöõ Haùn laø vaên töï cuûa moät ngoân ngöõ thuoäc loaïi hình khaùc vôùi tieáng Nhaät neân vieäc söû duïng chöõ Haùn ñeå ghi tieáng Nhaät gaëp khoâng ít khoù khaên.
Tieáng Nhaät thuoäc ngoân ngöõ loaïi hình chaép dính maø yù nghóa ngöõ phaùp ñöôïc bieåu thò qua caùc trôï töø vaø nhöõng bieán ñoåi cuûa phuï toá caáu taïo töø hoaøn toaøn khaùc vôùi tieáng Trung Quoác. Ngoaøi ra, trong tieáng Nhaät coøn toàn taïi nhöõng töø hoaëc nhöõng bieåu hieän maø khoâng tìm thaáy söï töông ñöông trong tieáng Trung Quoác nhö teân ngöôøi, ñòa danh hay laø nhöõng hieän töôïng thieân nhieân, ñaëc tröng cuûa xaõ hoäi…
Do vaäy, sau moät thôøi gian vay möôïn söû duïng chöõ Haùn ngöôøi Nhaät ñaõ suy nghó ñeå tìm ra nhieàu caùch hôïp lyù deã duøng vaø deã hieåu nhaát.
Noùi chung coù hai phöông thöùc möôïn cô baûn :
Phöông thöùc thöù nhaát laø möôïn chöõ Haùn ñoàng thôøi vôùi vieäc möôïn nghóa maø chöõ Haùn ñoù bieåu thò vôùi hai kieåu aâm ñoïc : aâm ñoïc On (ñoïc theo aâm Haùn) vaø aâm ñoïc Kun (ñoïc theo aâm Nhaät). Ví duï nhö 花 nghóa laø hoa) ñoïc theo aâm Kun laø “hana”.
Phöông thöùc thöù hai laø möôïn chöõ Haùn ñoàng thôøi möôïc aâm ñoïc cuûa chöõ Haùn ñoù maø hoaøn toaøn khoâng chuù yù ñeán nghóa maø chuùng bieåu thò.
Phöông thöùc thöù 2 naøy ñöôïc thöïc hieän theo chính kinh nghieäm cuûa Trung Quoác khi dòch boä kinh Phaät voán ñöôïc vieát baèng chöõ AÁn Ñoä sang chöõ Trung Quoác. Nhöõng töø khoâng coù nghóa töông ñöông ôû Trung Quoác ñeàu ñöôïc ghi baèng chöõ Haùn coù aâm töông ñöông hoaëc gaàn gioáng vôùi aâm ñoïc trong tieáng AÁn Ñoä nhaèm baøo ñaûm söï töông ñoàng veà aâm thanh. Trieàu Tieân sau ñoù cuõng ñaõ söû duïng phöông thöùc naøy khi duøng chöõ Haùn ñeå ghi teân ngöôøi, ñòa danh hay caùc phaân töø ngöõ phaùp ôû ngoân ngöõ mình.
ÔÛ Nhaät Baûn, vaên baûn ñaàu tieân ñöôïc ghi baèng phöông thöùc möôïn aâm laø boä Manyoâgana ( 万仮葉名) goàm 5000 baøi dieãn ca, hoø veø ñöôïc choïn loïc töø neàn vaên hoùa daân gian luùc baáy giôø. Ñaây laø moät taøi lieäu raát quyù giaù veà lòch söû chöõ vieát cuûa Nhaät Baûn ñaùnh daáu söï saùng taïo trong vieäc söû duïng chöõ Haùn cuûa ngöôøi Nhaät.
Maëc duø toaøn boä vaên baûn ñeàu ñöôc vieát baèng chöõ Haùn nhöng chæ thuaàn tuùy laø söû duïng aâm ñoïc cuûa chöõ Haùn maø khoâng söû duïng maët yù nghóa cuûa chuùng. Ví duï ñeå vieát teân ngoïn nuùi Phuù Só (Fuji) noåi tieáng cuûa Nhaät Baûn, ngöôøi ta ñaõ möôïn hai chöõ Haùn coù aâm ñoïc gaàn gioáng laø 富 (fu) vaø 士 (shi) gheùp thaønh töø 富士 (Fuji). Veà ngöõ nghóa thì nghóa cuûa chöõ Haùn laø “nhöõng voõ só giaøu coù” cho thaáy treân thöïc teá khoâng coù moái lieân heä giöõa teân ngoïn nuùi vaø nghóa cuûa chöõ Haùn.
Tuy vaäy, duø sao chöõ Haùn cuõng khoâng phaûi laø loaïi vaên töï ñôn giaûn ñoái vôùi ngöôøi Nhaät, ñaëc bieät laø ñoái vôùi taàng lôùp trung löu vaø daân lao ñoäng. Do vaäy, ngöôøi Nhaät luoân coù yù thöùc söûa ñoåi chöõ Haùn, vay möôïn theo höôùng ñôn giaûn hoùa, ñaëc bieät laø coá gaéng tìm caùch thích hôïp ñeå ghi caùc phuï toá cuûa danh töø, tính töø, ñoäng töø hay caùc trôï töø ngöõ phaùp.
Ngoaøi ra, maëc duø duøng phöông thöùc möôïn aâm nhöng ñeå ñeå bieåu thò moät aâm naøo ñoù cuûa tieáng Nhaät laïi coù theå duøng nhieàu chöõ Haùn ñoàng aâm khaùc nhau. Ví duï nhö ñeå ghi aâm “ma” ñoàng thôøi coù theå duøng caùc chöõ Haùn 間, 摩, 馬,… Tình traïng naøy gaây nhieàu khoù khaên cho ngöôøi ñoïc khoâng hieåu chöõ Haùn naøy bieåu thò cho aâm ñoïc naøo, hay ghi moät aâm ñoïc naøo ñoù thì phaûi vieát chöõ Haùn naøo cho thích hôïp.
Ñoù laø nhöõng nhu caàu thöïc teá thuùc ñaåy söï xuaát hieän cuûa heä chöõ Kana.
Quaù trình phaùt trieån cuûa heä chöõ Kana
Heä chöõ Kana ñi ñeán tình traïng thoáng nhaát vaø oån ñònh nhö ngaøy nay phaûi traûi qua hôn 1000 naêm. Coù giai ñoaïn bieán ñoåi nhöõng phaùt aâm trong tieáng Nhaät ñaõ gaây neân nhöõng luùng tuùng cho ngöôøi söû duïng chöõ Kana.
Theo moät soá taøi lieäu, tröôùc ñaây aâm o (お) vaø o (を) laø hai aâm khaùc nhau ñöôïc phaân bieät qua hai troïng aâm : (お) mang troïng aâm thaáp coøn (を) ñöôïc phaùt aâm vôùi troïng aâm cao nhöng coù luùc chuùng bò nhaäp laøm moät khoâng phaân bieät nöõa nhö töø “shio” (muoái) coù hai caùch vieát laø (しお) hoaëc (しを). Tình traïng naøy cuõng xaûy ra töông töï nhö vaäy ñoái vôùi caùc chöõ e (え) vôùi he (へ), ha (は) vaø wa (わ).
Vieäc cuøng moät töø coù hôn moät caùch vieát vaø moãi moät caùch vieát laïi bieåu thò nhöõng töø coù yù nghóa khaùc nhau ñaõ khieán cho vieäc söû duïng chöõ Kana ñeå ghi tieáng Nhaät gaëp khoù khaên. Ñeán cuoái thôøi kyø Edo ñaõ coù moät taùc giaû vieát trong moät cuoán saùch trong ñoù ñeà nghò caùch vieát chuaån cho khoaûng 2000 töø vôùi luaän ñieåm chính laø moãi töø chæ neân coù moät caùch vieát theo kieåu ghi aâm. Nhöng maõi ñeán taän naêm Meiji 33 (1900), nhaø nöôùc môùi thöïc söï ñöa ra caùc quy ñònh thoáng nhaát veà vieäc söû duïng vaên töï noùi chung, trong coù coù caû chöõ Kana.
Tuy vaäy, nhöõng daáu veát veà caùc hieän töôïng bieán ñoåi ngöõ aâm gaây aûnh höôûng ñeán vaên töï ngaøy nay vaãn coøn coù theå tìm trong tieáng Nhaät hieän ñaïi, ñaët bieät trong heä thoáng trôï töø. Ví duï nhö trôï töø quan heä bieåu thò yù nghóa chuû theå ñöôïc vieát laø (は) ha nhöng phaûi ñoïc laø wa (わ), hay trò töø bieåu thò yù nghóa nôi choán, phöông höôùng ñöôïc vieát laø (へ) he nhöng ñöôïc ñoïc laø e (へ).
Ñeán cuoái thôøi Heian baét ñaàu xuaát hieän nhöõng vaên baûn duøng laãn loän hai loaïi vaên töï, trong ñoù chöõ Haùn ñöôïc vieát cuøng vôùi chöõ Hiragana. Töø thôøi Kamakure (1185-1833) caùch vieát naøy caøng trôû neân phoå bieán, ñaëc bieät laø trong giôùi sö saõi. Caùc baøi haùt, truyeän daân gian tröôùc kia chæ ñöôïc ghi baèng Hiragana, nay ñaõ ñöôïc ghi laãn cuøng chöõ Haùn.
Sau ñoù moät thôøi gian laïi coù nhöõng vaên baûn ñöôïc vieát baèng hai loaïi chöõ Haùn vaø chöõ Katakana ñaët tröng cho caùch vieát cuûa caùc hoïc giaû, caùc nhaø trí thöùc thôøi ñoù ñeå ghi doøng vaên baùc hoïc. Caøng ngaøy söï xuaát hieän cuûa chöõ Haùn ôû caùc vaên baûn Haùn – Kana ngaøy caøng taêng, hieän töôïng naøy ñaëc bieät thaáy roõ trong caùc cuoán tieåu thuyeát thôøi Edo. Nhöng ñeå giuùp ngöôøi ñoïc deã hieåu yù nghó vaø caùch ñoïc thì beân caïnh chöõ Haùn vaãn coù ghi kí hieäu aâm ñoïc. Kích thöôùc cuûa töøng loaïi vaên töï cuõng thay ñoåi qua caùc thôøi kyø khaùc nhau.
Vaøo giai ñoaïn ñaàu, chöõ Kana ñöôïc vieát nhoû, chöõ Haùn ñöôïc vieát to. Daàn daàn, chöõ Kana ñuôïc vieát vôùi kích thöôùc gaàn ngang baèng chöõ Haùn. Tuy vaäy nhöng ñeán thôøi Edo vaãn coù söï phaân bieät hai loaïi vaên baûn vôùi hai kieåu söû duïng vaên töï taùch bieät nhau. Loaïi vaên töï Haùn-Kana duø sao cuõng chæ duøng trong vaên baûn khoâng chính thöùc, chæ coù tính chaát caù nhaân. Coøn nhöõng taøi lieäu coâng vaên haønh chính cuûa nhaø nöôùc vaãn ñöôïc vieát hoaøn toaøn baèng chöõ Haùn theo kieåu haønh vaên Trung Quoác.
Töø thôøi Meiji (1868 - 1912) loaïi vaên töï Haùn–Kana môùi ñöôïc söû duïng trong caùc coâng vaên nhaø nöôùc. Sau ñoù do phong traøo vaän ñoäng “thoáng nhaát ngoân vaên” neân tieåu thuyeát, baùo chí ñeàu chuyeån sang vieát baèng chöõ Haùn –Hiragana voán laø loaïi chöõ vieát cuûa khaåu ngöõ daân daõ. Töø sau chieán tranh theá giôùi thöù hai, caùc coâng vaên cuûa nhaø nöôùc ñeàu ñöôïc vieát baèng Haùn – Hiragana vaø caùch vieát naøy ñöôïc duy trì oån ñònh cho ñeán ngaøy nay.
Trong tieáng Nhaät hieän nay toàn taïi cuøng luùc 3 loaïi vaên töï : chöõ Haùn (Kanji), chöõ Kana (goàm Hiragana vaø Katakana) vaø heä chöõ Romaji, ngoaøi ra coøn coù heä soá ñeám La Maõ (1, 2, 3,…) toàn taïi song song vôùi heä ñeám cuûa Trung Quoác (nhaát, nhò, tam,…). Cuøng moät caâu coù theå dieãn ñaït baèng nhieàu loaïi chöõ, nhieàu caùch.
Ví duï caâu “trôøi möa” coù nhöõng caùch vieát sau :
雨 が 降ります
あめ が ふります
雨 が ふるます
あめ が 降ります
ame ga furimasu
Trong ñoù caùch vieát soá 1 laø caùch vieát chuaån
Ñaëc ñieåm cuûa heä chöõ Kana.
Kana laø teân chung cuûa hai loaïi chöõ Hiragana vaø Katakana. Ñaây laø loaïi vaên töï bieåu aâm coù khaû naêng theå hieän toaøn boä heä thoáng ngöõ aâm tieáng Nhaät vôùi 5 nguyeân aâm cô baûn vaø 46 daïng aâm tieát.
Hai loaïi chöõ naøy ñöôïc taïo neân töø nhöõng nguyeân taéc khaùc nhau. Ngöôøi Nhaät söû duïng hai hình thöùc chöõ vieát naøy cuøng haøng nghìn chöõ Haùn ñeå ghi laïi ngoân ngöõ cuûa mình. Hiragana ñöôïc söû duïng chuû yeáu ñeå vieát caùc thaønh toá ngöõ phaùp vaø nhöõng töø Nhaät ngöõ baûn ñòa, coøn Katakana chuû yeáu ñöôïc söû duïng ñeå vieát caùc töø vay möôïn töø nöôùc ngoaøi.
Caùch vieát chöõ Kana tröôùc chieán tranh raát phöùc taïp. sau chieán tranh theá giôùi thöù hai, traûi qua nhieâu cuoäc caûi caùch lôùn ñeå ñöa ñeán caùch vieát chöõ Kana hieän nay.
Heä chöõ Kana laø loaïi vaên töï ghi aâm tieát ñieån hình, tröø caùc con chöõ ghi nguyeân aâm ñoâi ya (や), yu (ゆ), yo (よ), vaø moät aâm muõi ん thì taát caû caùc con chöõ khaùc cuûa moãi chöõ ñeàu ghi moät aâm tieát vôùi caáu truùc môû (~ + nguyeân aâm) nhö a (あ ), i(い), u(う), e(え), o(お) hoaëc (phuï aâm + nguyeân aâm ) nhö ka (か), na (な), ta (た),…
Moãi aâm tieát ñeàu coù theå ghi baèng chöõ Hiragana hoaëc Katakana. Ví duï caùc aâm ta, sa, mu coù theå ghi baèng Hiragana た, さ, む hoaëc Katakana タ, サ, ム. Moãi töø thay vì ghi aâm Haùn ñeàu coù theå ghi ñöôïc baèng caùc chöõ Kana bieåu thò aâm ñoïc cuûa töø ñoù, ví duï nhö chöõ Haùn 日本語 thì ñöôïc ghi vôùi chöõ Kana laø にほんご.
Moãi kí töï Kana dieãn taû moät aâm tieát. Nhöõng aâm tieát caên baûn ñöôïc saép xeáp trong moät baûng goïi laø Gojuonzu (五十音図) töùc laø 50 aâm tieát. Baûng naøy goàm 5 coät theo thöù töï töø traùi qua phaûi vaø 10 doøng, coù theå vieát döôùi daïng Hiragana hoaëc Katakana
Chöõ Hiragana.
Nguoàn goác chöõ Hiragana
Hiragana laø loaïi chöõ vieát thaûo, hay vieát ñôn giaûn ñi cuûa chöõ Haùn coù cuøng hay töông töï caùch phaùt aâm. Do ñoù caùc kyù töï naøy coù nhöõng ñöôøng cong laû löôùt vaø coù hình thöùc ñeïp
Theo truyeàn thuyeát thì trong suoát thôøi Bình An (平安 - Heian) (794 - 1185), trieàu ñình vaø giôùi quyù toäc raát haâm moä vaên chöông chöõ Haùn. Moät soá nöõ quyù toäc baét ñaàu saùng taùc thi vaên goàm nhöõng thi ca, vaên hoïc vaø caùc theå loaïi khaùc, hoï khoâng thích neùt chöõ cöùng coûi cuûa Manyoâgana ( 万仮葉名) vì theá hoï cheá taùc moät loái uyeån chuyeån nhö chöõ thaûo, kieåu chöõ naøy goïi laø nöõ thuû (女手 - onnade) ñeå cheùp caùc thi vaên. Noù ñöôïc xem laø tieàn thaân cuûa Hiragana.
Sau ñaây laø baûng Haùn töï goác cuûa caùc kyù töï Hiragana
あ
阿
い
う
宇
え
江
お
於
か
加
き
く
久
け
介
こ
巳
さ
し
之
す
せ
世
そ
曽
た
多
ち
千
つ
川
て
天
と
止
な
奈
に
仁
ぬ
ね
祢
の
乃
は
波
ひ
比
ふ
不
へ
ほ
保
ま
未
み
美
む
武
め
女
も
毛
や
也
ゆ
由
よ
与
ら
食
り
利
る
留
れ
礼
ろ
呂
わ
和
を
ん
无
Vaøo giai ñoaïn ñaàu thôøi Heian, chöõ Hiragana vaø Katakana chöa ñöôïc phaân bieät raïch roøi ñeàu mang teân chung laø chöõ thaûo Kana, ñeán giöõa thôùi Heian thì phaïm vi söû duïng chuùng môùi ñöôïc phaân bieät roõ raøng. Vaø khi ñoù soá löôïng chöõ Hiragana lôùn hôn nhieàu so vôùi chöõ Katakana. Töø thôøi Edo trôû ñi soá löôïng vaø daïng thöùc cuûa Hiragana môùi daàn daàn ñöôïc oån ñònh.
Phaïm vi söû duïng
Hiragana chuû yeáu ñöôïc söû duïng ñeå vieát nhöõng töø vöïng vaø thaønh toá ngöõ phaùp nhö caùc tieáp vó ngöõ bieán toá, tieàn toá, haäu toá, lieân töø vaø trôï ñoäng töø . Caùc tieáp vó ngöõ Kana bieán toá ñöôïc goïi laø Okurigana ( 送り仮名 )
Ví duï :
Tieáp vó ngöõ Kana 書いた kaita ñaõ vieát
Trôï töø を o
Tính töø chæ ñònh これ kore caùi naøy
Lieân töø ですから desukara do ñoù
Ñoäng töø theå töø ñieån くる kuru ñi
Hiragana cuõng ñöôïc söû duïng ñeå vieát nhieàu töø vöïng Nhaät ngöõ baûn ñòa voán thöôøng khoâng ñöôïc vieát baèng Haùn töï nhö caùc traïng töø, caùc danh töø cuï theå, caùc tinh töø… hoaëc nhöõng töø maø chöõ Haùn khoù vieát hay khoâng hieän ñaïi.
Ví duï :
はっきり Hakkiri roõ raøng
ほとんど Hotondo haàu heát
じゃっぱり Jappari quaû ñuùng laø
Baûng kyù töï Hiragana
あ
a
い
i
う
u
え
e
お
o
か
ka
き
ki
く
ku
け
ke
こ
ko
さ
sa
し
shi
す
su
せ
se
そ
so
た
ta
ち
chi
つ
tsu
て
te
と
to
な
na
に
ni
ぬ
nu
ね
ne
の
no
は
ha
ひ
hi
ふ
fu
へ
he
ほ
ho
ま
ma
み
mi
む
mu
め
me
も
mo
や
ya
ゆ
yu
よ
yo
ら
ra
り
ri
る
ru
れ
re
ろ
ro
わ
wa
を
o
ん
n
AÂm höõu thanh
Caùc phuï aâm voâ thanh k, s, t, h trôû thaønh aâm höõu thanh g, z, d, b, p baèng caùch theâm vaøo daáu phuï (“) thöôøng goïi laø tenten (hoaëc dakuten, nigori) vaø daáu ( °) thöôøng goïi laø maru (hoaëc handakuten) vaøo beân phaûi treân cuûa kí töï Kana.
が
ga
ぎ
gi
ぐ
gu
げ
ge
ご
Go
ざ
za
じ
ji
ず
zu
ぜ
ze
ぞ
Zo
だ
da
ぢ
ji
づ
zu
で
de
ど
Do
ば
ba
び
bi
ぶ
bu
べ
be
ぼ
Bo
ぱ
pa
ぴ
pi
ぷ
pu
ぺ
pe
ぽ
Po
AÛo aâm
Caùc kyù töï ñöôïc phaùt aâm vôùi aâm taän cuøng laø “i” coù theå ñaët theo sau moät ya(や), yu (ゆ), yo(よ) nhoû ñeå hình thaønh nhöõng toå hôïp phaùt aâm nhö laø moät kyù töï ñoäc laäp.
きゃ
kya
きゅ
kyu
きょ
kyo
しゃ
sha
しゅ
shu
しょ
sho
ちゃ
cha
ちゅ
chu
ちょ
cho
にゃ
nya
にゅ
nyu
にょ
nyo
ひゃ
hya
ひゅ
hyu
ひょ
hyo
みゃ
mya
みゅ
my
みょ
myo
りゃ
rya
りゅ
ryu
りょ
ryo
Caùc aâm höõu thanh aûo
ぎゃ
gya
ぎゅ
gyu
ぎょ
gyo
じゃ
ja
じゅ
ju
じょ
jo
びゃ
bya
びゅ
byu
びょ
byo
ぴゃ
pya
ぴゅ
pyu
ぴょ
pyo
Nguyeân aâm
Nguyeân aâm tieáng Nhaät goàm hai loaïi laø nguyeân aâm daøi thöôøng goïi laø tröôøng aâm (choon - ちょうおん) vaø nguyeân aâm ngaén coøn goïi laø ñoaûn aâm (tan’on - たんおん).
Taát caû nhöõng aâm caên baûng trong baûng Kana, ngoaøi ん, ñeàu taän cuøng baèng moät nguyeân aâm ngaén.
Moät nguyeân aâm daøi thöôøng gaáp hai laàn veà ñoä daøi so vôùi moät nguyeân aâm ngaén vaø ñöôïc vieát baèng laäp laïi nguyeân aâm cuûa nhöõng aâm taän cuøng laø a, i hoaëc u. Ngoaøi ra, ngöôøi ta coøn theâm nguyeân aâm vaøo nhöõng aâm taän cuøng laø o khi muoán keùo daøi nhöõng aâm naøy.
Moät soá tröôøng hôïp ngoaïi leä :
お ñöôïc duøng thay う vì moät soá lyù do lòch söû.
Nhöõng aâm taän cuøng laø e thöôøng ñöôïc keùo daøi theâm baèng caùch theâm え hay い
ね + え = ねえ ne
Nguyeân aâm cuûa moät aûo aâm ñöôïc keùo daøi töông töï nhö aâm bình thöôøng
きょ + う = きょう kyo
Xuùc aâm
Caùc phuï aâm k, s, t, p,… coù theå ñöôïc gaáp ñoâi thì khi ñoù nhöõng phuï aâm keùp naøy goïi laø xuùc aâm vaø ñöôïc phaùt aâm rôøi ra nhö kyù töï rieàng bieät. Chuùng ñöôïc bieåu hieän baèng chöõ つ nhoû ñaët tröôùc phuï aâm gaáp ñoâi.
Ví duï : けっか ñöôïc ñoïc laø kek-ka trong ñoù phuï aâm k trong chöõ か ñaõ ñöôïc gaáp ñoâi leân.
Chöõ Katakana
Nguoàn goác hình thaønh chöõ Katakana
Kyù töï Katakana baét nguoàn töø caùc kyù töï Trung Quoác coù cuøng caùch ñoïc, neáu Hiragana laø söï ñôn giaûn hoùa toaøn boä caùc kyù töï Trung Quoác thì Katakana ñöôïc taïo ra baèng caùch laáy moät boä phaän naøo ñoù cuûa chöõ Haùn vaø boä phaän taùch ra naøy ñaïi dieän cho caû chöõ khi ghi aâm. Ví duï chöõ か xuaát phaùt töø chöõ 加 ñeå ghi aâm ñoïc “ka”.
Vì caên baûn döïa treân hình thöùc chöõ vuoâng cuûa kyù töï Trung Quoác neân Katakana coù ñöôøng neùt vuoâng, coù goùc caïnh vaø roõ raøng ñeå ai cuõng coù theå hieàu vaø ñoïc ñöôïc. Katakana thöôøng ñöôïc cho laø vaên töï cuûa ñaøn oâng.
Trong moät thôøi gian khaù daøi chöõ Katakana thuôøng ñöôïc vieát nhoû beân caïnh chöõ Haùn ñeå ghi aâm ñoïc cuûa chöõ Haùn ñoù. Trong caùc vaên baûn coå coøn löu laïi ngaøy nay beân caïnh caùch vieát theo kieåu Haùn thì moãi chöõ Haùn ñöôïc ghi chuù aâm ñoïc baèng chöõ Katakana, theo aâm ñoïc naøy thì ngöôøi Nhaät seõ ñoïc daõy chöõ Haùn treân thaønh moät ñoaïn vaên baèng tieáng Nhaät theo kieåu Nhaät. Ngaøy nay nhieäm vuï chuù aâm naøy ñöôïc giao laïi cho Hiragana
Sau ñaây laø baûng Haùn töï goác cuûa caùc kyù töï Katakana
ア
阿
イ
ウ
宇
エ
江
オ
於
カ
加
キ
ク
久
ケ
介
コ
巳
サ
シ
之
ス
セ
世
ソ
曽
タ
多
チ
千
ツ
川
テ
天
ト
止
ナ
奈
ニ
仁
ヌ
ネ
祢
ノ
乃
ハ
波
ヒ
比
フ
不
ヘ
ホ
保
マ
未
ミ
美
ム
武
メ
女
モ
毛
ヤ
也
ユ
由
ヨ
与
ラ
食
リ
利
ル
留
レ
礼
ロ
呂
ワ
和
を
ン
无
Phaïm vi söû duïng
Khoaûng cuoái thaäp nieân 1970 xuaát hieän khaù nhieàu saùch vaø töø ñieån vieát veà chöõ Katakana vôùi caùc töïa nhö Katakanakotoba hay Katakanago, trong ñoù ñeà caäp phaïm vi söû duïng cuûa chöõ Katakana:
Ghi caùc töø ñöôïc vay möôïn töø nöôùc ngoaøi vaøo Nhaät Baûn (tröø Trung Quoác).
Ghi teân ngöôøi vaø ñòa danh nöôùc ngoaøi.
Ghi caùc töø chuyeân moân, ñaëc bieät laø caùc töø khoa hoïc kyõ thuaät.
Ghi töø caàn nhaán maïnh trong nhöõng boái caûnh ñaëc bieät.
Ghi caùc töø töôïng thanh, töôïng hình.
Ghi tieáng ñòa phöông möôïn töø moät phöông ngöõ naøo ñoù ñöôïc duøng laãn trong ngoân ngöõ vaên hoïc.
Töø thaân maät coù tính chaát noäi boä.
Trong caùc chöùc naêng treân thì chöùc naêng ghi töø ngoaïi lai vaø teân rieâng nöôùc ngoaøi laø quan troïng nhaát. Trong moät chuoãi töø chæ caàn thaáy moät töø ghi baèng chöõ Katakana laø coù theå ñoaùn laø töø vay möôïn töø nöôùc ngoaøi vaøo.
Baûng kyù töï Katakana.
ア
a
イ
i
ウ
u
エ
e
オ
o
カ
ka
キ
ki
ク
ku
ケ
ke
コ
ko
サ
sa
シ
shi
ス
su
セ
se
ソ
so
タ
ta
チ
chi
ツ
tsu
テ
te
ト
to
ナ
na
ニ
ni
ヌ
nu
ネ
ne
ノ
no
ハ
ha
ヒ
hi
フ
fu
ヘ
he
ホ
ho
マ
ma
ミ
mi
ム
mu
メ
me
モ
mo
ヤ
ya
ユ
yu
ヨ
yo
ラ
ra
リ
ri
ル
ru
レ
re
ロ
ro
ワ
wa
ン
h
Caùc aâm höõu thanh
ガ
ga
ギ
gi
グ
gu
ゲ
ge
ゴ
go
ザ
za
ジ
ji
ズ
zu
ゼ
ze
ゾ
zo
ダ
da
デ
de
ド
do
バ
ba
ビ
bi
ブ
bu
ベ
be
ボ
bo
パ
pa
ピ
pi
プ
pu
ぺ
pe
ポ
po
AÛo aâm
キャ
kya
キュ
kyu
キョ
kyo
シャ
sha
シュ
shu
ショ
sho
チャ
cha
チュ
chu
チョ
cho
ニャ
nya
ニュ
nyu
ニョ
nyo
ヒャ
hya
ヒュ
hyu
ヒョ
hyo
ミャ
mya
ミュ
myu
ミョ
myo
リャ
rya
リュ
ryu
リョ
ryo
ギャ
gya
ギュ
gyu
ギョ
gyo
ジャ
ja
ジュ
ju
ジョ
jo
ビャ
bya
ビュ
byu
ビョ
byo
ピャ
pya
ピュ
pyu
ピョ
pyo
ウィ
wi
ウェ
we
ウォ
wo
クァ
kwa
ツァ
tsa
ツェ
tse
ツォ
tso
ティ
ti
ファ
fa
フィ
fi
フェ
fe
フォ
fo
ディ
di
デュ
du
ヴァ
va
ヴィ
vi
ヴ
vu
ヴェ
ve
ヴォ
vo
Caùch vieát chöõ Katakana
Chöõ Katakana dieãn ñaït chính xaùc nhöõng aâm thanh töông öùng vôùi caùc chöõ Hiragana.
Veà nguyeân taéc vieát chöõ Hiragana nhö theá naøo thì cuõng vieát chöõ Katakana nhö theá aáy.
Xuùc aâm ñöôïc bieåu thò baèng chöõ ツnhoû (ベッド)
AÛo aâm ñöôïc toå hôïp baèng chöõ ヤ, ユ, ヨ nhoû
Tröôøng aâm laø söï khaùc bieät chuû yeáu giöõa Katakana vaø Hiragana, trong Katakana tröôøng aâm ñöôïc bieåu thò baèng daáu gaïch ngang ( - ) goïi laø daáu tröôøng aâm.
Ví duï : カ + — = カ— ka
Ñoái vôùi nhöõng töø khoâng phaûi laø töø vay möôïn töø nöôùc ngoaøi thì tröôøng aâm cuûa chuùng cuõng keùo daøi töông töï nhö vôùi Hiragana
Ví duï : 京都 キョウト kyoto
Nhöõng töø vay möôïn vieát döôùi daïng Katakana coá gaéng baét chöôùc caùch phaùt aâm cuûa töø vöïng goác trong heä thoáng ngöõ aâm tieáng Nhaät, ñieàu naøy daãn ñeán nhöõng caùch phaùt aâm khaùc bieät roõ reät so vôùi ngoân ngöõ goác.
Ví duï : England イギリス igirisu
Hotel ホテル hoteru
Thoâng thöôøng ngöôøi ta khoâng theå vieát moät soá aâm cuï theå naøo ñoù baèng nhöõng kyù töï Kana truyeàn thoáng. Ví duï nhö khoâng coù toå hôïp aâm truyeàn thoáng naøo dieãn taû aâm “je” trong töø “jet” do ñoù moät soá toå hôïp Kana ñaët bieät ñöôïc taïo ra ñeå vieát nhöõng caâu nhö vaäy.
Tuy nhieân caùch vieát nhöõng töø vay möôïn baèng Katakana khoâng ñöôïc tieâu chuaån hoùa hoaøn toaøn do ñoù moä soá töø coù theå ñöôïc vieát baèng nhieàu caùch. Ví duï nhö töø “gesture” ñöôïc vieát laø zesucha (ゼスチャー) hoaëc jeshucha (ジェスチャ).
Ngoaøi nhöõng toå hôïp naøy, nhöõng töø vay möôïn vieát baèng Katakana ñoâi khi bao goàm nhöõng xuùc aâm khoâng ñöôïc söû duïng trong chöõ Hiragana nhö d, g.
Ví duï nhö beddo ( ベッド)
Vieäc kyù aâm caùc töø vay möôïn töø tieáng nöôùc ngoaøi
Ngöôøi Nhaät Baûn laàn ñaàu tieân tieáp xuùc vôùi ngöôøi phöông Taây thoâng qua cuoäc vieãn du cuûa moät nhoùm ngöôøi Boà Ñaøo Nha naêm 1543 ñeán ñaûo Tanega vaø cuõng laø laàn ñaàu tieân Ngöôøi Nhaät tieáp xuùc vôùi neàn vaên minh phöông Taây. Keå töø ñoù cuøng vôùi vieäc giao löu buoân baùn cuûa Nhaät vôùi nöôùc ngoaøi thì haøng loaït caùc töø tieáng Taây Ban Nha, Boà Ñaøo Nha, Haø Lan daàn daàn du nhaäp vaøo Nhaät Baûn, trong ñoù tieáng Haø Lan chieám ña soá vì trong suoát 200 naêm thöïc hieän chính saùch beá quan toûa caûng (töø 1633 ñeán 1854) Nhaät Baûn chæ quan heä thöông maïi vôùi Haø Lan.
Ví duï moät soá töø sau :
Töø goác Boà Ñaøo Nha : タバコ (tabaco), カッパ (capa),…
Töø goác taây Ban Nha : メリアス (meias), シボン (sabao), …
Töø goác Haø La._.n : ガラス (glas), スコップ(schopbier), ゴム (gom),…
Khi môû cöûa giao bang vôùi nöôùc ngoaøi trong quaù trình Nhaät Baûn ñaõ tìm kieám moät moâ thöùc ñeå tieán haønh coâng cuoäc hieän ñaïi hoùa ñaát nöôùc theo caùc nöôùc AÂu Myõ thì cuõng coù haøng loaït caùch töø Anh, Phaùp, Ñöùc… du nhaäp vaøo Nhaät Baûn.
Töø sau theá chieán thöù hai, Nhaät bò Myõ chieám ñoùng quaän söï neân chính trò vaø vaên hoùa chòu aûnh höôøng to lôùn töø phía Myõ, beân caïnh ñoù tieáng Anh trôû thaønh ngoaïi ngöõ phoå bieán coù öu theá taïi Nhaät luùc baáy giôø neân ngaøy nay tieáng Anh laø ngoaïi ngöõ phoå bieán nhaát taïi Nhaät laø ñieàu khoâng theå phuû nhaän.
Ngoaøi ra trong tieáng Nhaät cuõng toàn taïi moät soá töø vöïng coù nguoàn goác töø tieáng YÙ, Nga, Latin, Hy Laïp coå,…
Trong quaù trình hoäi nhaäp vaø phaùt trieån kinh teá nhö hieän nay soá löôïng caùc töø ngoaïi lai xuaát hieän ngaøy caøng nhieàu treân baùo chí, saùch vôû, quaûng caùo vôùi toác ñoä raát nhanh. Neáu nhö tröôùc chieán tranh theá giôùi thöù hai, khi dòch caùc töø nöôùc ngoaøi caùc taùc giaû phaûi raát coâng phu chuyeån dòch thaønh caùc chöõ Kanji coù nghóa töông ñöông hoaëc coù aâm ñpoïc gaàn gioáng thì ngaøy nay caùc töø nöôùc ngoaøi ñöôïc ñöa tröïc tieáp vaøo tieáng Nhaät baèng caùch chuyeån töï thaønh chöõ Kana maø thoâi.
Caùc kieåu chöõ khaùc trong Nhaät ngöõ.
Beân caïnh Hiragana, Katakana, Kanji coøn coù Furigana (振仮名 – Phuï ngöõ ) töùc laø caùc chöõ nhoû xíu ñaët saùt hay treân chöõ Kanji ñeå ghi aâm ñoïc cuûa Kanji. Keå töø 1947, quoác hoäi Nhaät chaáp thuaän khoâng in keøm Fukigana beân caïnh caùc chöõ Kanji trong caùc saùch vôû baùo chí daønh cho caùc ñoäc giaû trung bình trôû leân. Chæ in keøm Furigana beân caïnh caùc chöõ Kanji hieám gaëp vaø caùc saùch vôû baùo chí cho caùc ñoäc giaû bình daân.
Nhaät ngöõ hieän ñaïi duøng ba theå Kanji, Hiragana, vaø Katakana. Kanji duøng dieãn ñaït yù cô baûn cuûa töø. Hiragana duøng sau Kanji ñeå tu boå yù nghóa vaø cho thuaän theo ngöõ phaùp Nhaät. Katakana duøng ñeå chæ nhöõng töø phieân aâm hoaëc vay möôïn cuûa nöôùc ngoaøi.
Ví duï : 私は アメリカへ 友達と ひこうきで いきます。
Caùc daáu caâu trong Nhaät ngöõ.
Caùch chaám caâu cuûa Nhaät theo Haùn ngöõ coå ñaïi. Chaám heát caâu baèng moät khuyeân troøn goïi laø kuten ( 。), ngaét caâu baèng daáu taïm döøng ( 、). Daáu chaám hoûi (?) vaø daáu chaám than (!) ñoâi khi cuõng duøng nhöng khoâng ñöôïc xem laø chuaån möïc.
Hieän nay Nhaät duøng caùc daáu chaám caâu nhö sau :
Daáu
Teân
YÙ nghóa
。
kuten (句点), maru (丸)
daáu chaám heát caâu
、
toten (読点)
daáu phaåy
・
nakaten (中点), nakaguro (中黒)
chaám giöõa chöõ, bullet
「」
kagi kakko (かぎ括弧)
ngoaëc thaúng ñôn
『』
futae kagi (二重かぎ)
ngoaëc thaúng keùp
( )
kakko (括弧)
ngoaëc troøn
. . .
tensen (点線)
ba chaám
Quaù trình phaùt trieån font chöõ 2 byte
Boä kí töï tieáng Nhaät
Khi Nhaät baét ñaàu xaây döïng nhöõng heä thoáng maùy tính ñaàu tieân vaøo nhöõng naêm 1980. Loaïi maùy tính naøy ñöôïc xaây döïng gioáng nhö cuûa Myõ vaø söû duïng cuøng moät loaïi boä kí töï goïi laø ASCII. Vì luùc naøy raát khoù khi xöû lyù nhöõng kyù töï ñaëc bieät cuûa Nhaät nhö nhöõng chöõ caùi Hiragana vaø Katakana hay haøng ngaøn chöõ töôïng hình vay möôïn cuûa Trung Quoác ñöôïc goïi laø Haùn töï. Loaïi maùy tính duøng Romaji naøy khoâng phuø hôïp cho ngöôøi söû duïng laø ngöôøi Nhaät. Coù theå deã daøng vieát teân vaø ñòa chæ baèng tieáng Nhaät baèng chöõ Romaji nhöng laïi raát khoù khaên ñeå ñoïc moät ñoaïn vaên baûn tieáng Nhaät ñöôïc vieát toaøn baèng Romaji.
Tieáng Nhaät thì söû duïng nhieàu Kanji, laø nhöõng chöõ töôïng hình. Ñieàu naøy coù nghóa laø caùc kyù töï Kanji (hay caùc cuïm töø cuûa chuùng) theå hieän moät yù nghóa hay moät suy nghó. Noù coù theå vieát caùch phaùt aâm cuûa moät töø nhöng ñieàu naøy thì hoaøn toaøn khoù khaên bôûi vì phaûi coù nhöõng heä thoáng khaùc nhau ñeå chuyeån kyù töï töø moät Japanese Yomi (phaùt aâm kieåu Nhaät) sang moät kyù töï Latinh (Romaji). Moät kyù töï Kanji coù theå coù nhieàu caùch phaùt aâm tuøy thuoäc vaøo söï löïa choïn chuyeån töø cuûa heä thoáng.
Ngoaøi ra, moät kyù töï Kanji coù theå coù nhieàu Yomi khaùc nhau hay moät Yomi coù theå coù nhieàu kyù töï Kanji khaùc tuøy thuoäc vaøo yù nghóa. Hieän töôïng dò aâm, ñoàng aâm khoù khaên ñoái vôùi ngöôøi Nhaät khi chæ söû duïng duy nhaát chöõ Romaji.
ASCII vaø Katakana
Böôùc keá tieáp cuûa ngaønh coâng ngheä maùy tính Nhaät Baûn laø ñöa ñöôïc baûng chöõ caùi Katakana vaøo baûng maõ cuûa maùy tính. Ñieàu naøy coù moät soá lyù do nhö sau:
Soá löôïng caùc kyù töï coù giôùi haïn.
Giuùp cho caùc töø nöôùc ngoaøi vaø caùc töø cuûa tieáng Nhaät ñöôïc roõ raøng
Deã daøng ñeå thöïc thi treân maùy tính.
Chuùng deã daøng in hay hieån thò tuøy thuoäc vaøo hình daïng cuûa chuùng.
Khoâng ñoøi hoûi moät trình xöû lyù font cho vieäc xuaát caùc kyù töï. Deã daøng thöïc hieän vôùi moät möùc môùi caùc kyù töï vaøo baøn phím chuaån.
Caùch thöïc hieän caùc kyù töï Katakana deã daøng nhaát laø theâm nhöõng khaû naêng tieáng Nhaät vaøo heä thoáng maùy tính. Noù coù giôùi haïn soá löôïng kyù töï (vöøa vôùi khoâng gian treân 127 kí töï) cho neân noù coù theå söû duïng ñöôïc caáu truùc 7(8) bit. Moät byte maõ naøy (Single Byte Chacracter Set - SBCS) ñöôïc goïi laø JIS X0201-1989 (ñöôïc ñoåi vaøo thaùng 3/1987 töø teân cuõ laø JISC 6220 - 1076) vaø ñaõ cho thaáy söï taêng cöôøng theâm cuûa baûng maõ ASCII vôùi caùc kyù töï Katakana.
Vieäc söû duïng cuûa nhöõng kyù töï Katakana naøy coù moät thuaän lôïi laø noù coù theå söû duïng baøn phím chuaån vaø thay ñoåi giöõa vieäc xuaát ra chöõ ASCII vaø Katakana, vôùi soá löôïng kyù töï coù giôùi haïn. Caùch boá trí baøn phím naøy ñöôïc xaùc ñònh bôûi moät chuaån rieâng goïi laø JIS X6002-1984 (hay IIS C6233-1980 tröôùc ñoù). Caùch boá trí baøn phím coù theâm 52 kyù töï chöõ caùi Latinh thöôøng vaø hoa, 10 chöõ soá, 32 kyù töï ñaëc bieät nhö ( !, $, &, @, +, _ ,v.v) , 8 kyù töï ñaëc bieät tieáng Nhaät, 17 kyù töï ñieàu khieån (nhö CR, LF, ETX, DEL, ESC,…) vaø 55 kyù töï Katakana.
Ñaõ coù moät chuaån ñöôïc xaùc ñònh nhö theá nhöng khoâng coù nghóa laø buoäc moïi ngöôøi phaûi theo chuaån möïc naøy. Ñieàu naøy ñaõ laøm cho coù nhieàu loaïi baøn phím coù caùch boá trí saün khaùc nhau.
Hình caùc kyù töï Katatana ban ñaàu trong boä maõ ASCII.
7 bit JIS
Maõ naøy toàn taïi ôû phieân baûn 7 bit vaø 8 bit. Söï khaùc nhau giöõa 2 phieân baûn naøy laø ôû phieân baûn 7 bit (töø 00 ñeán 7F Hex) coù moät kyù töï Shifl In ( coøn goïi laø SI hoaëc laø Kanji out (KO), ôû 0E Hex) ñöôïc duøng ñeå thay ñoåi giöõa baûng maõ ASCII va Katakana.
Ñieàu naøy coù nghóa laø ban ñaàu heä thoáng in caùc kyù töï ASCII cho tôùi khi noù chaïy treân SO thì taát caû caùc kyù töï sau ñoù ñöôïc in ra laø kyù töï Katakana. Noù ngöøng khi heä thoáng tìm ra ñöôïc kyù töï SI, ñoù laø söï chuyeån ñoåi töø cheá ñoä Katakana sang cheá ñoä ASCII. Vieäc söû duïng moät kyù töï SI vaø moät kyù töï SO ñeå chuyeån ñoåi giöõa 2 baûng maõ ñaõ xaûy ra moät soá vaán ñeà, vaán ñeà naøy seõ ñöôïc ñeà caäp ôû phaàn sau.
8 bit JIS
Vaán ñeà xaûy naøy khoâng xaûy ra khi heä thoáng cuûa baïn coù theå söû duïng phieân baûn 8 bit cuûa JIS X0201- 1989. Trong tröôøng hôp naøy heä thoáng phaûi coù theå laøm vieäc vôùi nhöõng kyù töï 8 bit (ñöôïc goïi laø 8 bit clean, maø noù thì thöôøng coù theå khoâng xaûy ra, trong nhöõng boå sung môùi nhaát cuûa UNIX, thænh thoaûng chuùng ñöôïc söû duïng bit cao nhaát laø moät bit chaün leû).
Vôùi phieân baûn 8 bit baïn khoâng phaûi duøng kí töï SI vaø SO ñeå chuyeån ñoåi giöõa baûng maõ ASCII vaø Katakana. Kyù töï Katakana ñöôïc ñònh vò ôû vuøng treân 7F Hex ( vuøng khoâng duøng ñeán). Vieäc söû duïng vuøng naøy ñaõ naûy sinh moät soá vaán ñeà khi baïn laøm vieäc vôùi phaàm meàm maùy tính PC IBC cuõ cuûa Myõ chaúng haïn, ôû maùy PC IBM coù moät baûng maõ hoaøn toaøn khaùc trong vuøng töø 7F Hex ñeán FF Hex. Neáu baïn baét ñaàu duøng phaàm meàm nöôùc ngoaøi thì coù theå xaûy ra moät maøn hình neàn troâng raát töùc cöôøi bôûi vì coù söï xuaát hieän cuûa nhöõng kyù töï Katakana ñaõ ñöôïc thay theá maø khoâng coù luaät leä naøo caû. Keát quaû laø baûng maõ ASCII gaàn nhö khoâng töông thích.
ÔÛ version 8 bit, vuøng döôùi 7F Hex gaàn nhö töông thích. Chæ khaùc laø noù laøm cho moät soá caùc kyù töï chæ gaàn nhö töông thích nhö laø coù daáu \ (5C Hex) thay theá cho kyù töï yeân vaø daáu “ (7Fhex) ñöôïc thay theá baèng daáu (-). Coøn taát caû caùc kyù töï khaùc thì ñuùng vôùi ASCII töông öùng.
Nhöõng kyù töï Katakana coù cuøng kích thöôùc vôùi kí tö ASCII naøy ñöôïc goïi laø Half-Width Katakana (trong Japanese Hankaku). Ñieàu naøy vaãn chöa laø giaûi phaùp thoõa maõn cho nhöõng ngöôøi söû duïng maùy tính tieáng Nhaät tröôùc ñaây. Söï thieáu caùc kyù töï Kanji laø moät ñieàu quan troïng laøm cho hoï baét ñaàu nghó ñeán caùch ñeå tích hôïp caùc kyù töï Kanji vaøo heä thoáng maùy tính.
Söï phaùt trieån cuûa boä kí töï Kanji
Ñeå hieåu veà quaù trình phaùt trieån cuûa baûng maõ Kanji chuùng ta phaûi xem boä kyù töï non-electric maø ñang ñöôïc duøng ñeå ñònh nghóa cho JIS C6226-1978 ñang ñi theo höôùng JIS X0208-1990, laø chuaån hieän nay.
Nhaät ngöõ coù khoaûng 40000 ñeán 60000 chöõ Kanji ñöôïc bieát. Vaán ñeà laø khoâng ai coù theå nhôù ñöôïc taát caû chuùng. Boä Giaùo Duïc ñaõ baét ñaàu giôùi haïn soá löôïng chöõ Kanji ñöôïc duøng trong giaùo duïc. Ngaøy nay moät sinh vieân Nhaät hoïc khoaûng 2000 chöõ Kanji.
Lòch söû phaùt trieån cuûa chuaån ñöôïc baét ñaàu vôùi nhöõng chöõ Kanji ñöôïc cho pheùp trong giaùo duïc. Baûng ñaàu tieân naøy ñöôïc goïi laø Toyo Kanji vaø vaøo naêm 1946 noù coù 1850 chöõ Kanji. Vaøo 1981 baûng naøy ñöôïc thay theá baèng baûng Yoyo Kanji, coù 1946 chöõ Kanji.
Nhöõng baûng khaùc ñöôïc duøng ñeå ñònh daïng boä kyù töï chuaån laø Gakushu Kanji vôùi 1006 chöõ Kanji thay theá cho baûng Koyiku Kanji cuõ coù 881 chöõ Kanji, noù taêng theâm 996 chöõ Kanji ( naêm 1992 ) vaø baûng kyù töï Jimei-yo Kanji coù 85 chöõ (naêm 1946), 112 chöõ (naêm 1976), 166 chöõ (naêm 1981) vaø ñeán naêm 1990 coù 284 chöõ . Moät söï vieäc thuù vò laø Gatushu Kanji laø moät taäp hôïp con cuûa Joyo Kanji.
Boä kyù töï 2 byte (DBCS)
Boä kyù töï non-electric naøy ñöôïc duøng ñeå xaùc ñònh boä kyù töï chuaån DBCS JIS X0208-1990 hieän nay. Ngoaøi nhöõng kí töï Kanji, 83 kí töï Hiragana vaø 86 kí töï Katakana thì chuaån naøy coøn bao goàm caùc kyù töï xeáp theo chöõ caùi (10 kí töï soá, 52 kyù töï Latinh), kyù töï ñaëc bieät coù 147 kyù töï), kyù töï Hylaïp coù 48 kí töï vaø kyù töï Nga coù 66 kí töï vaø nhöõng thaønh phaàn khoâng luaät leä khaùc. Suoát nhöõng naêm sau ñaõ coù nhöõng thay ñoåi (X208 ñöôïc phaùt haønh ñaàu tieân vaøo naêm 1978, söï thay ñoåi ñaàu tieân ñöôïc thaáy naêm 1983, phieân baûn hieän nay laø coù töø 1990) noù ñöôïc theâm vaøo moät soá chöõ Kanji môùi, hình daïng moät soá chöõ thay ñoåi vaø coù söï thay ñoåi ôû vò trí cuûa moät soá chöõ ñöôïc thay theá.
Ngaøy nay chuaån naøy chöùa 2 caáp ñoä vôùi 2965 kyù töï ôû caáp ñoä 1 vaø 3388 kyù töï ôû caáp ñoä 2. Vaøo naêm 1990 JSA ñaõ giôùi thieäu moät boä kyù töï DBCS boå sung ñöôïc goïi laø JIS X0212- 1990 (ñoâi khi coøn goïi laø JIS caáp ñoä 3) vôùi 6067 chöõ theâm vaøo. Vôùi söï theâm vaøo 5801 chöõ Kanji thì chuaån naøy coù 21 kyù töï ñaëc bieät vaø 245 chöõ Latinh, chöõ Kirin, chöõ Hy Laïp (haàu heát coù caùc daáu troïng aâm nhö caùc kyù töï cuûa German Umlauts, Phaùp, Taây Ban Nha, Ñan Maïch).
Caùi naøy cho chuùng ta toång coäng 12156 kyù töï chuaån, ñöôïc chia thaønh 3 caáp ñoä. Nhìn theo khía caïnh naøy thì JIS X0212-1990 laø moät chuaån raát toát cho haàu heát caùc heä thoáng duøng chæ nhöõng kyù töï ñöôïc ñònh nghóa bôûi chuaån JIS X0212-19XX, tuy nhieân soá löôïng töø raát lôùn naøy caàn nhieàu boä nhôù vaø noù cuõng khoâng theå cho hieån thò kyù töï ñöôïc duøng bôûi SBCS. Do ñoù ñeå maø hieån thò soá löôïng töø khoång loà naøy chuùng tai caàn ít nhaát laø moät boä kyù töï 2 byte (DBCS).
ÔÛ moâi tröôøng chuaån 7 (hay 8 bit) chuùng ta coù theå duøng baûng maõ coù 127 (hay 255) kyù töï. Noù thì ñuû cho boä kí töï ASCII chuaån vaø moät soá caùi môû roäng cho moãi quoác gia nhöng noù khoâng ñuû lôùn ñeå xöû lyù haøng ngaøn kyù töï töôïng hình Kanji.Ñeå xöû lyù moät soá löôïng kyù töï raát lôùn chuùng ta caàn môû roäng soá bit ñeå löu thoâng tin cuûa kyù töï. ÔÛ moâi tröôøng 7 bit moät böôùc logic laø duøng 2 byte 7 bit (töùc laø 14 bit) ñeå löu thoâng tin, caùi naøy seõ cho chuùng ta khaû naêng löu tröõ leân 214 töùc laø 16384 kyù töï. Neáu chuùng ta duøng 2 byte 8bit thì chuùng ta coù theå löu ñeán 216 töùc laø 65536 kyù töï). Vaán ñeà naûy sinh laø laøm caùch naøo ñeå phaân bieät giöõa kyù töï SBCS vaø kyù töï DBCS.
Ñeå maø tieáp tuïc töông thích vôùi boä kyù töï SBCS cuõ, baïn phaûi tìm moät giaûi phaùp ñeå ñònh roõ moät byte thaät söï laø moät kyù töï SBCS hay laø moät phaàn cuûa boä kyù töï DBCS .
Söï chuyeån ñoåi giöõa SBCS vaø DBCS
Ñaùp laïi söï ñeà caäp ôû treân, noù thì coù khaû naêng söû duïng cô cheá Shift In/Out ñeå phaân bieät giöõa SBCS vaø DBCS. Ñieàu naøy hoaøn toaøn coù ích trong moâi tröôøng 7 bit. Noù cuõng coù theå ñöôïc duøng trong moät moâi tröôûng 8 bit. Khaû naêng coù theå khaùc laø trong moät moâi tröôøng 8 bit noù duøng MSB (Most Significant Big) nhö laø côù ñeå cho thaáy raèng byte naøy laø moät kyù töï SBCS (MSB=0) hoaëc moät phaàn cuûa moät kyù töï DBCS (MSB=1). Moät SBCS coù theå thaáy söï bieåu dieãn cuøa soá nhò phaân nhö 0XXXXXXX vaø DBCS seõ laø 1XXXXXXX.
Ngaøy nay haàu heát caùc heä thoáng côõ vöøa hoaëc lôùn ñeàu duøng moät trình töï SI/SO (hay coøn goïi laø KI /KO) ñeå thay ñoåi giöõa nhöõng kyù töï SBCS vaø DBCS. Coù moät caùch khaùc laø JSA cho daõy SI /SO naøy nhöng ñaùng tieác laø haàu heát nhöõng cöûa haøng ñaïi lyù phaàn cöùng ñaõ choïn daõy SI /SO khaùc (thöôøng laø giöõa 1 vaø 3 byte).
Ñoâi khi coù 2 daõy SI/KO khaùc nhau, moät caùi chuyeãn ñoåi veà boä kí töï JIS Roman, caùi coøn laïi chuyeån ñoåi veà boä kí tö ASCII.
Khoâng chæ daõy SI/SO (KI/KO) coù khaùc nhau veà söï thöïc thi cuûa boä kí töï Kana/Kanji maø coøn khaùc nhau veà vò trí trong ma traän ñöôïc xaùc ñònh baèng hai byte. Ngoaøi ra moät soá coâng ty nhö IBM thì khoâng duøng chuaån JIS.
Neáu nhö baïn nhìn kyõ hôn vaøo nhöõng ma traän naøy, baïn seõ nhaän ra raèng taát caû caùc nhaø buoân ñaõ thay theá vuøng JIS hoaëc vuøng môû roäng ôû nhöõng nôi khaùc nhau. Maëc duø neáu caùc ma traän coù cuøng moät nôi thì khoâng coù nghóa laø seõ coù cuøng moät kí töï Kanji ôû cuøng choã ñoù.
Trong theá giôùi maùy PC tieáng Nhaät thì Shift JIS laø chuaån cho boä kí töï. Phieân baûn naøy cuûa boä kí töï JIS ñaõ ñöôïc di chuyeån ñeán nhöõng nôi khaùc nhau vì ôû vò trí naøy noù coù teåh duøng boä kí töï 7 bit cuõ vaø DBCS maø khoâng caàn coù daõy SI/SO ( hoaëc KI/KO). Trong Shift JIS taát caû caùc kí töï 7 bit (SBSC) coù MSB laø 0, gioáng nhö 0XXXXXXX. neáu MSB ñöôïc baät leân 1 thì byte ñoù laø moät phaàn cuûa kí töï DBCS, gioáng nhö 1XXXXXXX 1XXXXXXX. Moät öu ñieåm cuûa Shift JIS laø noù thì deã daøng chuyeån ñoåi töø maõ JIS DBCS sang maõ Shift JIS DBCS töông öùng.
Shift JIS and JIS
SJIS laø hieån thò hai byte cuûa maõ Shift JIS vaø hai byte JIS cuûa maõ JIS. SJIS1 laø byte ñaàu tieân JIS2 laø byte thöù hai cuûa maõ naøy. Giaù trò cuûa nhöõng byte naøy naèm töø 00Hex ñeán FFHex
SJIS1 = (JIS1 - 21Hex) / 2 +81Hex
if SJIS1 >= 9FHex then JIS1 = JIS1 + 40Hex
if odd(JIS1) then
begin
SJIS2 = JIS2 - 21Hex + 40Hex
if (SJIS2 >+ 7FHex then SJIS2 = SJIS2 + 1
end
else SJIS2 = JIS2 - 21Hex + 9Fhex
Shift JIS ñöôïc duøng chuû yeáu ôû PC vaø moät vaøi maùy chuû. Haàu heát nhöõng cöûa haøng ñaïi lyù thöôøng chuyeån ñoåi nhöõng ñoaïn maõ giöõa maõ cuûa hoï vaø JIS hoaëc Shift JIS.
Moät söï khaùc nhau nöõa cuûa caùc boä kí töï laø do ngöôøi söû duïng ñònh nghóa nhöõng kí töï ôû nôi khaùc nhau trong ma traän 2 byte. Nhöõng soá ñoù ñöôïc goïi laø kí töï Gaiji thì khaùc nhau ôû moãi phieân baûn cuûa cöûa haøng ñaïi lyù. Nhöõng kí töï Kaiji naøy raát caàn bôûi vì moät soá teân cuûa ngöôøi Nhaät thì ñöôïc vieát vôùi caùc kí töï Kanji khoâng coù chuaån.
Ví duï neáu moät coâng ty baûo hieåm muoán in moät hoùa ñôn vôùi teân cuûa khaùch haøng thì thoâng thöôøng seõ duøng nhöõng kí töï Gaiji do ngöôøi duøng ñònh nghóa cho muïc ñích naøy khi maø teân cuûa khaùch haøng chöùa nhöõng kí töï Kanji maø khoâng coù saün trong JIS.
Unicode vaø ISO 106-46
Unicode xuaát phaùt töø Xerox Parc. Naêm 1991, Apple vaø caùc coâng ty khaùc ñaõ lieân hieäp thaønh moät toå chöùc phi lôïi nhuaän goïi laø Unicode Consortium nhaèm phaùt trieån, duy trì vaø thuùc ñaåy chuaån Unicode. Unicode Consortium ñaõ phaùt haønh Unicode standard version 1.0 vaøo naêm 1991. Cuõng vaøo thôøi gian naøy toå chöùc ISO (International Standard Organization ) ñaõ hoaøn thaønh boä maõ töông töï goïi laø ISO10646. Xeùt thaáy hai boä maõ nhö vaäy laø quaù nhieàu, Unicode Consortium vaø ISO ñaõ coäng taùc vôùi nhau trong hai naêm 1991 – 1992 ñeå hôïp nhaát. Unicode 1.1 vaø ISO10646 ñeàu phaùt haønh vaøo naêm 1993.
Naêm 1994, Nhaät vaø Trung Quoác baét ñaàu saùng taïo boä maõ chuaån cho quoác gia mình treân cô sôû ISO10646. Boä maõ chuaån duøng taïi Trung Quoác laø ñöôïc goïi laø maõ quoác tieâu GB13000 (GB: guobiao).
Unicode laø boä maõ kyù töï coù chieàu roäng 16 bit, bao goàm taát caû caùc kyù töï duøng phoå bieán trong caùc maùy tính hieän nay. Noù bao quaùt caùc chöõ vieát treân theá giôùi, caùc chöõ aán loaùt, kyù hieäu kyõ thuaät vaø toaùn hoïc, hình daïng hình hoïc, daáu chaám caâu,… beân caïnh caùc ngoân ngöõ hieän ñaïi, Unicode coøn coù caùc coå ngöõ nhö coå Hy Laïp, Do Thaùi (hebrew), Pali, Sanskrit vaø Nhaät ngöõ (vaên vieát).
Ngoaøi ra coøn coù moät vuøng goàm 6500 choå troáng ñeå ngöôøi söû duïng coù theå taïo ra nhöõng kyù töï rieâng cho mình. Unicode standard khoâng phaân bieät kyù töï theo khía caïnh ngöõ nghóa (semantics) hay phaùt aâm (pronounciation).
Bôûi vì Haùn töï ñöôïc vay möôïn vaøo tieáng Nhaät vaø Trieàu Tieân töø laâu cho neân ba ngoân ngöõ naøy duøng chung vôùi nhau moät soá chöõ töôïng hình (ideographs). Unicode consortium löïa choïn theå hieän caùc chöõ töôïng hình chung naøy moät laàn vì muïc ñích cuûa Unicode Consortium laø maõ hoùa caùc kyù töï ñoäc laäp giöõa caùc ngoân ngöõ. Ñieàu naøy cuõng bao quaùt caùc kyù töï ñöôïc maõ hoùa theo chuaån rieâng hieän nay cuûa caùc nöôùc Trung Quoác, Ñaøi Loan, Nhaät, vaø Trieàu Tieân (Haøn Quoác).
Unicode khoâng phaân bieät aâm vaø nghóa. Thoâng qua söï thoáng nhaát cuûa chöõ Haùn, Unicode aán ñònh khoaûng 21.000 code point ñoái vôùi caùc chöõ töôïng hình thay vì laø 120.000 neáu phaûi xöû lyù rieâng bieät cho caùc ngoân ngöõ Chaâu AÙ.
Moät soá chöõ töôïng hình nom töông töï nhöng yù nghóa thì raát khaùc nhau vaø coù theå coù moät soá neùt khaùc nhau, nhöõng chöõ nhö vaäy thì coù code rieâng trong caùc chuaån cuûa caùc nöôùc Chaâu AÙ. Coù nhieàu chöõ (nhö chöõ Haùn giaûn theå vaø phoàn theå hoaëc Kanji cuûa Nhaät) khaùc nhau veà hình daïng nhöng yù nghóa laïi gioáng nhau thì ôû caùc chuaån maõ quoác gia chuùng coù code rieâng thì ôû Unicode chuùng cuõng coù code rieâng.
Maëc duø nhöõng töø ñöôïc nhìn thaáy treân maøn hình maùy tính nhöng maùy tính chæ bieát ñöôïc nhöõng chuoãi maõ, moãi soá chæ töông öùng vôùi moät kí töï duy nhaát treân maøn hình. Moät boä caùc kí töï ñöôïc aùnh xaï thaønh caùc code point ñöôïc goïi laø boä kí töï ñöôïc maõ hoùa (character set encoding). Moät söï ñoàng boä ñeå coù maõ ñôn giaûn cuûa söï thay theá moãi kyù töï trong baûng chöõ caùi vôùi moät con soá (a=1, b=2, c=3, …). Baûng maõ noåi tieáng ASCII coù code point ñöôïc gaùn cho nhöõng kyù töï hoa vaø thöôøng cuûa caùc kí töï Latin, caùc con soá, vaø caùc kyù töï thoâng duïng thöôøng duøng ôû Myõ. Nhöõng chöõ khaùc nhau duøng nhöõng caùch giaûi maõ khaùc nhau.
Baûng maõ cuûa Chaâu AÙ coù moät khoù khaên thöôøng gaëp laø thöôøng coù nhieàu hôn moät chuaån cho moãi ngoân ngöõ. Ví duï nhö tieáng Nhaät coù ñeán 3 chuaån chính ñöôïc söû duïng laø: SHIFT-JIS, ISO-2022-JP, vaø J-EUC. Moãi baûng maõ ñöôïc maõ hoùa baèng nhöõng caùch khoâng gioáng nhau, tuy cuøng moät kí töï nhöng vôùi moãi chuaån khaùc nhau coù code point khaùc nhau.
Caùc phaàn meàm hoã trôï vieäc nhaäp chöõ Kana vaø Kanji.
Coù theå hieåu raèng ngöôøi Nhaät khoâng theå xaây döïng nhöõng baøn phím vôùi haøng ngaøn phím ñeå nhaäp vaøo nhöõng kí töï Kana vaø Kanji. Vì lyù do naøy maø hoï ñaõ duøng nhieàu caùch khaùc nhau ñeå nhaäp vaøo caùc kí töï. Thöôøng thì vieäc nhaäp ñöôïc xöû lyù baèng moät chöông trình goïi laø FEP (Front End Processor – Xöû Lyù ñaàu cuoái). Chöông trình naøy nhaän döõ lieäu nhaäp vaøo töø ngöôøi söû duïng vaø xöû lyù vieäc chuyeån ñoåi caàn thieát thaønh maõ thích hôïp. Phaàn naøy giôùi thieäu vaø moâ taû moät vaøi phaàn meàm hoã trôï vieäc nhaäp caùc kí töï tieáng Nhaät thoâng duïng hieän nay.
IME (Input Method Editor)
IME laø moät öùng duïng cung caáp khaû naêng nhaäp haøng ngaøn caùc kí töï khaùc nhau, ñang ñöôïc söû duïng ôû caùc nöôùc Ñoâng AÙ, ñeå vieát caùc ngoân ngöõ cuûa caùc nöôùc naøy maø khoâng caàn coù nhöõng baøn phím rieâng bieät.
Phieân baûn tieáng Nhaät cuûa Microsoft Windows95, Windows98, vaø Windows NT4 ñaõ coù ñuû caùc chöùc naêng Microsoft IME (MSIME). Coù theå down load taïi trang web
Tuy nhieân MSIME chæ ñöôïc thieát keá ñeå chaïy treân caùc phieân baûn Windows tieáng Nhaät. Coøn Microsoft Global IME for Japanese thì môùi cho pheùp nhaäp caùc kí töï tieáng Nhaät trong caùc öùng duïng ñöôïc hoã trôï nhö Internet Explorer, Outlook Express, Microsoft Office trong caùc phieân baûn Windows ngoân ngöõ khaùc.
Khôûi ñoäng phaàn meàm IME
Tröôùc khi môû phaàn meàm IME, ñaàu tieân caàn phaûi môû chöông trình muoán nhaäp vaên baûn ra (ví duï nhö chöông trình email chaúng haïn) vaø laøm cho chöông trình ôû traïng thaùi active (chöông trình ôû traïng thaùi active töùc laø thanh tieâu ñeà coù maøu roõ ôû phía treân cöûa soå cuûa noù).
Sau ñoù nhaán toå hôïp phím ALT beân traùi vaø SHIFT cuøng moät luùc. Thanh coâng cuï cuûa IME seõ xuaát hieän treân maøn hình, noù nhö sau :
Chuù yù phaûi môû IME vaø taét noù cho moãi chöông trình. Neáu coù hai chöông trình cuøng môû vaø baïn cuõng môû chöông trình IME cho moãi caùi thì thanh IME seõ khoâng xuaát hieän khi baïn chuyeån ñoåi trong chöông trình thöù hai vaø xuaát hieän laïi khi baïn chuyeån veà chöông trình ñaàu tieân.
Thanh coâng cuï cuûa IME
Phaàn naøy trình baøy nhöõng phaàn phoå bieán cuûa thanh coâng cuï IME. ÔÛ moãi phieân baûn Windows khaùc nhau thanh coâng cuï seõ khaùc nhau vaø cuõng coù theå tuøy bieán baèng caùch theâm hoaëc boû ñi caùc nuùt.
Toolbar cho phieân baûn Windows95/98
Toolbar cho phieân baûn WindowsXP
Taét môû nhanh (Quick On/Off) : nuùt nhoû naøy cung caáp nhanh caùch chuyeån ñoåi giöõa cheá ñoä nhaäp tröïc tieáp vaø cheá ñoä nhaäp chöõ tieáng Nhaät.
Thanh keùo (Drag Tab) : baïn coù theå click vaø keùo ôû phaàn naøy ñeå di chuyeån thanh coâng cuï ñeán nhöõng vò trí khaùc nhau treân maøn hình.
Cheá ñoä nhaäp (Input Mode) : chuyeån ñoåi cheá ñoä nhaäp giöõa Kana vaø Roman.
Cheá ñoä chuyeån ñoåi (Conversion Mode) : cho IME bieát caùch tìm caùc töø Kanji töông öùng.
Baøn phím IME (IME Pad) : cung caáp nhöõng chöùc naêng khaùc nhau ñeå nhaäp kí töï Kanji, bao goàm caû caùch “veõ” kí töï.
Ñaêng kí töø môùi (Register Words) : cho pheùp theâm nhöõng töø môùi vaøo töï ñieån.
Thuoäc tính (Properties) : cho pheùp thieát laäp nhieàu ñaëc ñieåm hoaït ñoäng vaø söï öu tieân.
Bieân taäp töø ñieån (Edit Dictionary) : cho pheùp söûa chöõa töï ñieån.
Trôï giuùp (Help) : ñöa ra caùc thoâng tin giuùp ñôõ baèng tieáng Nhaät.
Khoùa cheá ñoä (Lock Modes) : baét buoäc IME duøng kí töï Kana hoaëc kí töï Roman in hoa
Löïa choïn cheá ñoä nhaäp
Nhaäp caùc kí töï vaøo IME baèng caùch goõ caùc kí töï Roman. IME coù theå töï ñoäng chuyeån thaønh Hiragana hoaëc Katakana tuyø thuoäc vaøo cheá ñoä nhaäp maø ñang choïn. Choïn theá ñoä naøy baèng caùch click vaøo nuùt “Input Mode” treân thanh coâng cuï. Nuùt naøy coù caùc choïn löïa nhö sau :
Hiragana : kí töï ñöôïc nhaäp vaøo thaønh Hiragana. Trong suoát quaù trình nhaäp vaøo coù theå chuyeån kí töï nhaäp Hiragana thaønh Kanji hoaëc Katakana.
Katakana : kí töï ñöôïc nhaäp vaøo laø Katakana. Trong suoát quaù trình nhaäp vaøo coù theå chuyeån kí töï nhaäp Katakana thaønh Kanji hoaëc Hiragana.
Full-Width ASCII : kí töï ñöôïc nhaäp vaøo laø full-width ASCII. Ñaây khoâng gioáng caùch nhaäp thoâng thöôøng maø laø maõ kí töï tieáng Nhaät. Neáu gôûi moät taøi lieäu chöùa nhöõng kí töï naøy cho ngöôøi khaùc thì ngöôøi ñoù seõ khoâng theå thaáy ñöôïc chuùng tröø khi maùy tính cuûa ngöôøi ñoù coù hoã trôï font tieáng Nhaät.
Half-Width Katakana : kí töï ñöôïc nhaäp vaøo laø half-width Katakana. Trong quaù trình nhaäp baïn coù theå chuyeån töø kí töï nhaäp Katakana sang Kanji hoaëc Hiragana
Half-Width ASCII : kí töï ñöôïc nhaäp vaøo laø half-width ASCII. Caùch naøy hoaøn toaøn khaùc vôùi caùch nhaäp tröïc tieáp ôû treân bôûi vì kí töï nhaäp vaøo duøng maõ tieáng Nhaät vaø boä font fixed-width. Neáu gôûi taøi lieäu coù chöùa nhöõng kí töï naøy cho ngöôøi khaùc thì ngöôøi ñoù cuõng khoâng thay ñöôïc chuùng tröø khi maùy tính cuûa ngöôøi ñoù coù hoã trôï font tieáng Nhaät.
Direct Input : caùc kí töï ñöôïc nhaäp tröïc tieáp khoâng caàn IME. Caùch naøy töông töï nhö khi taét IME
Nhaäp vaên baûn baèng caùc kí töï Romaji
Baïn nhaäp caùc kí töï vaøo IME baèng caùch nhaäp Romaji. Neáu nhaäp chöõ ôû moät trong nhöõng cheá ñoä kana thì kí töï seõ ñöôïc chuyeån thaønh kí töï Hiragana hoaëc Katakana töông öùng khi goõ. Ví duï khi goõ “nihongo” trong cheá ñoä Hiragana seõ cho keát quaû nhö sau:
after typing "n":
after typing "i":
after typing "h":
after typing "o":
after typing "n":
after typing "g":
after typing "o":
Coù theå goõ phím "backspace" khi goõ sai vaø muoán söûa noù.
Chuù yù raèng coù moät ñöôøng gaïch zig-zag döôùi chöõ ñöôïc nhaäp, ñöôøng naøy ñaùnh daáu ñoaïn vaên baûn nhö laø “xem tröôùc” töùc laø noù chöa saün saøng nhaäp vaøo taøi lieäu luùc ñoù. Baïn phaûi “cho pheùp” ñöa noù döôùi daïng Kanji vaøo taøi lieäu baèng caùch nhaán phím “Enter” sau khi ñaõ goõ xong.
Neáu muoán nhaäp vaøo kí töï Kanji thì sau ñoù caàn phaûi chuyeån kí töï Kana ñöôïc nhaäp vaøo sang Kanji tröôùc khi nhaán Enter.
Chuù yù khi nhaäp baèng Romaji
Moät soá ñieàu caàn chuù yù khi nhaäp baèng kí töï Romaji :
Nhôù goõ “ha” khi nhaäp “wa” trong caùc trôï tö cho chuû ngöû vì trong tieáng Nhaät noù ñöôïc vieát baèng chöõ “ha” Hiragana.
Nhôù goõ chöõ “he” khi nhaäp chöõ “e” trong trôï töø chæ nôi choán vì trong tieáng Nhaät noù ñöôïc vieát baèng chöõ “he” Hiragana.
Goõ chöõ “wo” cho trôï töø “o”
Goõ “n” hai laàn khi nhaäp aâm “n”. IME coù theå giaûi maõ aâm ñoïc “n”, nhöng neáu aâm tieáp theo baét ñaàu vôùi “n’ thì khi ñoù baïn seõ khoâng coù keát quaû ñuùng. Ví duï neáu goõ “konnichiha” seõ coù keát quaû sai, ñeå coù keát quaû ñuùng thì phaûi goõ “konnnichiha” : hai chöõ n ñaàu laø cho aâm “n”, chöõ n thöù ba laø baét ñaàu cuûa chöõ “ni”. Toát nhaát laø neân taäp thoùi quen nhaán n hai laàn khi nhaäp aâm ñoïc n.
Duøng “du” ñeå nhaäp kí töï “tsu” (töông töï laø “zu” cho “su”), vaø “di” cho “chi” (“ji” cho “shi”)
Chuyeån vaên baûn nhaäp sang Kanji
Khi baïn goõ vaên baûn duøng IME, noù ñöôïc nhaäp taïm thôøi vôùi moät ñöôøng gaïch zig- zag ôû döôùi. Tröôùc khi nhaäp vaøo taøi lieäu caàn chuyeån noù sang kí töï Kanji. Noù hoaït ñoäng nhö sau :
watashi ha kaerimasu
Coù theå nhaán phím ”Enter” ñeå doøng chöõ Hiragana ñöôïc ñöa vaøo taøi lieäu. Nhöng neáu muoán töø ”watashi” vaø “kaeri” thaønh chöõ Kanji thì nhaán ”space bar”, doøng vaên baûn seõ thay ñoåi nhö sau :
IME seõ queùt ñoaïn vaên baûn vaø thay theá nhöõng kí töï Hiragana ñoù vôùi kí töï Kanji maø noù nghó laø thích hôïp nhaát. Noù cuõng seõ thay ñöôøng zig - zag thaønh ñöôøng gaïch thaúng, cho thaáy IME ñang ôû trong cheá ñoä söûa chöõa nôi maø baïn coù theå thay ñoåi ñoaïn vaên baûn tröôùc khi ñoàng yù nhaäp noù vaøo taøi lieäu.
IME seõ choïn kí töï Kanji maø thích hôïp nhaát, neáu ñuùng töø caàn choïn thì nhaán phím ”Enter” ñeå ñöa vaøo vaên baûn.
Neáu khoâng ñuùng vôùi töø caàn choïn, laøm nhö sau :
Xem ñöôøng gaïch ñaäm döôùi chöõ “watashi”, ñoù laø ñöôøng gaïch cho bieát phaàn cuûa cuïm töø nhaäp coù theå thay ñoåi. Neáu muoán thay ñoåi cho töø “kaerimasu” thì phaûi dôøi ñöôøng gaïch ñaäm naøy sang chöõ “kaerimasu” baèng caùch nhaán phím muõi teân sang phaûi, noù seõ nhö sau :
Tieáp theo nhaán phím ”space bar”
Moät danh saùch caùc töø choïn khaùc nhau xuaát hieän.
Duøng phím muõi teân leân/xuoáng ñeå löïa choïn chöõ Kanji caàn nhaäp vaø nhaán phím ”Enter”. Keát quaû nhö sau :
Coù theå tieáp tuïc hieäu chænh caùc cuïm töø khaùc trong ñoaïn vaên baûn baèng caùch di chuyeån ñöôøng gaïch ñaäm baèng phím muõi teân traùi/phaûi. Khi taát caû ñaõ ñuùng nhaán ”Enter’ ñeå ñöa noù vaøo taøi lieäu. Sau ñoù tieáp tuïc nhaäp töø khaùc vaøo taøi lieäu.
Veõ kí töï Kanji
Khi khoâng bieát Romaji cuûa kí töï Kanji ñeå nhaäp vaøo, coù theå veõ kí töï vaø IME seõ nhaän daïng noù. Ñeå thöïc hieän thao taùc naøy, nhaán nuùt IME Pad treân thanh coâng cuï.
Neáu “Soft Keyboard” xuaát hieän thì click vaøo bieåu töôïng muõi teân treân ñaàu ñeå chuyeån sang baûng veõ.
Coøn neáu baûng veõ ñaõ coù thì click nuùt “clear” ñeå xoùa noù.
Veõ kí töï treân vuøng veõ naèm phía traùi baûng veõ. Khi baïn veõ thì phaàn ôû giöõa seõ xuaát hieän moät soá choïn löïa maø IME döï ñoaùn laø baïn ñang veõ noù. Neáu veõ sai click nuùt ”Revert” ñeå xoùa ñöôøng veõ môùi nhaát hoaëc nuùt ”Clear” ñeå xoùa heát toaøn boä chöõ ñang veõ.
Neáu ñeå con troû leân treân moät trong nhöõng chöõ ñöôïc IME ñöa ra ôû giöõa baûng veõ thì IME seõ hieån thò moät hoäp thoaïi cho bieát caùch ñoïc cuûa töø naøy.
Khi tìm thaáy kí töï ñuùng ôû phaàn naøy thì click vaøo noù ñeå cheøn vaøo doøng ñang nhaäp trong taøi lieäu. Ñoùng baûng veõ hoaëc môû noù laïi neáu muoán duøng tieáp.
Song Kieàu (TwinBridge ® MultiLingual Series)
TwinBridge laø phaàn meàm ña ngoân ngöõ cuûa haõng TwinBridge Software Corp. Haõng naøy cho ra ba chuûng loaïi : Chinese Partner (cho._.
Các file đính kèm theo tài liệu này:
- BaoCao.doc
- Bia.doc