Share
Regex là viết tắt của Regular expression, được sử dụng để kiểm tra tính hợp lệ của email hoặc số điện thoại. Nguyên tắc hoạt động của biểu thức Regex là so khớp dựa vào khuôn mẫu, khuôn mẫu được xây dựng từ các nguyên tắc căn bản của biểu thức Regex.
Làm việc cho các dự án của khách hàng từ Nhật Bản, chúng ta sẽ thường xuyên phải xử lý validate cho các dữ liệu tiếng Nhật. Trong đó chúng ta sẽ thường xuyên gặp phải ký tự fullwidth (zenkaku) và ký tự halfwidth (hankaku).
Xét với một phông chữ có chiều rộng và chiều cao là cố định, ký tự thuộc loại hankaku sẽ chiếm một nửa bề rộng so với ký tự zenkaku. Chiều cao thì không thay đổi.
Dưới đây sẽ là những regular expression thông dụng mà chúng ta hay gặp phải:
/^[ー]?[0-9]+(\.[0-9]+)?$/
/^[-]?[0-9]+(\.[0-9]+)?$/
/^[a-zA-Z]+$/
/^[ぁ-ん]+$/
/^([ァ-ン]|ー)+$/
/^[ぁ-んァ-ン]+$/
/^[ァ-ン゙゚]+$/
/^[一-龥]+$/
/^[一-龥ぁ-ん]/
/^[ぁ-んァ-ン一-龥]/
Có dấu gạch ngang, 3 chữ số: /^\d{3}[-]\d{2}$/
Có dấu gạch ngang, 3 chữ số: /^\d{3}[-]\d{4}$/
/^[0-9-]{6,9}$|^[0-9-]{12}$/
Trên đây mình đã giới thiệu qua những đoạn Regex thông dụng khi làm việc với các dự án đến từ Nhật Bản. Hy vọng bài viết đã giúp ích cho bạn trong quá trình làm dự án, tiết kiệm được nhiều thời gian để tìm hiểu Regex khi cần validate cho ký tự tiếng Nhật.
Share