Cần dùng phông chữ Unicode cho tiếng Việt trên mạng Internet 


Thời Báo Kinh Tế Sài Gòn - số 12-7-2001 - Trang 37

Ts. Trang Q. Sen (Hannover)

Những người sử dụng mạng Internet, không ai không có lần cảm thấy khó chịu khi đọc không được các thư điện tử của công ty đối tác hoặc các văn bản tiếng Việt được nạp từ các trang chủ trên mạng, chỉ vì thiếu phông (font) chữ Việt tương ứng. Trong khi nước Đức chỉ có một phông chữ duy nhất cho ngôn ngữ của mình thì Việt Nam có ít nhất 40 phông chữ Việt không tương thích do hơn 15 công ty, tổ chức trong và ngoài nước sản xuất. Ai cũng muốn độc lập với nhau. Ở phía Nam người ta dùng phông chữ VNI hay Bách Khoa HCM để viết văn bảng thì ở phía Bắc lại chuộng phông chữ TCVN và ABC. Việt Kiều ở Bắc Mỹ dùng phông của VIQR hay VNI trong khi ở châu Âu thì phông chữ VNI và VPS của Hội chuyên gia (Pháp) rất thịnh hành trong giới Việt kiều.

Vì bộ chữ 7-bit dùng cho máy vi tính trong ngôn ngữ tiếng Anh không đủ giá trị để diễn tả các mẫu tự tiếng Việt và các dấu nên các công ty sản xuất các chương trình tiếng Việt sử dụng bộ chữ 8-bit với các tiểu xảo riêng. Một số ký tự ít dùng của bộ mã này được thay thế bằng ký tự tiếng Việt. Vì vậy trong một số trường họp đưa đến tình trạng nhiều mẫu tự Việt không diễn tã được trên một số bàn phím với ngôn ngữ Pháp, Đức,...Đối các ngôn ngữ không thuộc hệ La Tinh như tiếng Trung quốc, Nhật hay Hàn Quốc thì bộ mã 8-bit với 256 giá trị cũng chưa đủ để diễn tả hết các ký tự này. Vì vậy vào năm 1991 các công ty phần mềm lớn trên thế giới gồm IBM, HP, Appel, SAP, Microsoft, Novell ... đã quyết định thành lập một tổ chức chung, Unicode consortium phi thương mại để tìm giải pháp khắc phục các khó khăn trên (www.unicode.org). Từ đó Unicode được ra đời. Unicode là một bộ chữ hoàn toàn mới, thống nhất cho tất cả các ngôn ngữ hiện có trên thế giới. Nó được ký tự bằng bộ mã 16-bit (hai Bytes) và phù hợp với tiêu chuẩn quốc tế ISO/IEC 10646.

Chữ Việt được xếp vào hệ La-tinh cơ bản và La-tinh mở rộng (Latin extended). Như vậy cũng có nghĩa là hiện nay với các hệ điều hành và các chương trình ứng dụng hỗ trợ phông Unicode, chúng ta có thể đọc dễ dàng các văn bản tiếng Việt với phông Unicode mà không cần phải nạp thêm các phông chữ khác. Theo ông Đỗ Bá Phước, chuyên gia tin học và ngôn ngữ học, bộ mã Unicode còn chứa, ngoài các ký tự chữ quốc ngữ, 5065 mã số cho chữ nôm. 4234 chữ thuần nôm đang đợi được chọn mã số.

Làm sao để sử dụng phông Unicode?

Hệ điều hành Windows 98 SE (Second Edition) của Microsoft đã có chứa sẳn kiểu chữ Tahoma thuộc phông Unicode. Windows NT, Windows 2000, XP cũng như chương trình ứng dụng Office 2000 còn cho thêm nhiều kiễu chữ thông dụng khác như Times New Roman hay Arial. Hệ điều hành Linux mới cũng hỗ trợ phông Unicode. Như vậy để đọc được các văn bản tiếng Việt với phông Unicode, người ta chỉ cần dùng hệ điều Windows 98SE, Me, NT, 2000, XP hay Linux. Trình duyệt ỊE 5.0 của Microsoft cho phép đọc dễ dàng các văn bản tiếng Việt trực tiếp trên mạng, kể cả các văn bảng được viết hổn hợp với nhiều ngôn ngữ khác nhau. Tuy nhiên để viết văn bảng tiếng Việt với phông Unicode, người ta còn cần thêm, ngoài Word của Microsoft (hay một chương trình viết văn bản tương tự), một chương trình ký tự hỗ trợ phông Unicode thí dụ như chương trình Vietkey 2000 (có thể nạp miễn phí trên mạng Internet, www.vietkey.com) hay VPS (từ biên bản 4.0). Các chương trình nói trên đều cho phép người sử dụng tiếp tục dùng nút cũ đánh dấu tiếng Việt theo thói quen của mình. Một điểm yếu hiện nay của phông chữ này là bạn có thể gặp khó khăn khi in các văn bảng Unicode trên máy in laser thuộc thế hệ cũ. Hầu hết các máy in Laser thuộc thế hệ mới đều chấp nhận phông chữ Unicode (thí dụ như máy in laser của công ty HP Laserjet 5l, 6l hay 1100).

So với một vài nhược điểm ít quan trọng, xảy ra trong thời gian chuyển tiếp thì các lợi điểm của phông chữ Unicode cho tiếng Việt rất rõ ràng:

1- Unicode là phông chữ thống nhất, quốc tế. Với một kiễu chữ người ta có thể sử dụng cho nhiều ngôn ngữ khác trong cùng một văn bảng mà không bắt buộc đổi kiểu chữ như hiện nay.

2- Các hệ điều hành mới của Microsoft Windows 98, Me, NT, 2000 va XP cũng như các chương trình ứng dụng mới Office 2000 và kể cả hệ điều hành Linux đều hỗ trợ trực tiếp Unicode. Các ngôn ngữ quan trọng dùng cho Internet như XML và Java cũng sử dụng Unicode. Mặc dù hiện nay chưa có nhiều kiểu chữ cho phông Unicode, nhưng các kiễu chữ Tahoma, New Times Roman, Arial, palatino linotyp…. đều có sẳn trong các chương trình nói trên cũng đủ để giải quyết các nhu cầu bình thường.

3- Chữ Việt hiện ra trên màn ảnh hay trên máy in rất rõ ràng và chắc chắn, không còn tình trạng diễn đạt sai của một vài mẫu tự như các phông chữ 8-bit.

4- Cho đến hiện nay nếu muốn tìm (search) các nguồn thông tin bằng tiếng Việt trên mạng Internet thật sự không đơn giản, vì người tìm không biết các trang chủ trên mạng được ký tự bằng phông chữ nào. Trong tương lai nếu mọi người (đây là điều chắc chắn, không sớm thì muộn) đều sử dụng phông chữ Unicode thì khả năng tìm các văn bảng tiếng Việt mới có thể thực hiện được.

5- Các trang chủ bằng tiếng Việt trên mạng Internet được chuyển sang phông Unicode ngày càng nhiều.

6- Thuận lợi quan trọng là Chính phủ Việt nam đã công nhận phông chữ Unicode cho ngôn ngữ Việt nam trong các ngành tin học. Như vậy không sớm thì muộn, phông Unicode sẽ là phông chữ thống nhất cho tiếng Việt.

Vì những điểm nêu trên, theo thiển ý chúng ta cần thực hiện càng sớm càng tốt việc chuyển phông chữ tiếng Việt sang Unicode, một mặt để dễ dàng trao đổi thông tin bằng tiếng Việt trên mạng Internet, mặt khác qua đó ngành công nghệ tin học trong nước có điều kiện thuận lợi hơn để phát triển.