Đinh Duy Chương Khóa luận tốt nghiệp
MỤC LỤC
Chương 1.
TỔNG QUAN 7
1.1.
Ngôn ngữ dấu hiệu 7
1.1.1.
Ngôn ngữ dấu hiệu là gì ? 7
1.1.2.
Một số chuẩn trên thế giới và Việt Nam 8
1.1.3.
Mục tiêu của khoá luận 9
1.2.
Các phương pháp nhận biết ngôn ngữ dấu hiệu 10
1.2.1.
Nhận biết ngôn ngữ bằng phân tích hình ảnh 10
1.2.2.
Nhận biết bằng cảm biến 15
1.2.3.
Nguyên tắc vận hành của việc sử dụng cảm biến 16
1.2.4.
So sánh hai phương pháp 25
Chương 2.
TÌM HIỂU VỀ CẢM BIẾN VÀ VI ĐIỀU KHIỂN 26
2.1.
Tìm hiểu về cảm biến gia tốc 26
2.1.1.
Nguyên lý làm việc của cảm biến 26
2.1.2.
Sensor gia tốc ADXL202 26
2.1.3.
Phương pháp chuẩn 31
2.2.
Tìm hiểu về vi điều khiển BasicStamp 32
2.2.1.
Nguyên lý vận hành 32
2.2.2.
Phần cứng 32
2.2.3.
Ngôn ngữ BasicStamp 34
Chương 3.
XÂY DỰNG THIẾT BỊ GĂNG TAY CẢM NHẬN GIA TỐC 35
3.1.
Thiết kế phần cứng 35
3.2.
Chuẩn hoá sensor 36
3.3.
Xây dựng phần mềm 40
3.3.1.
Viết chương trình cho vi điều khiển BasicStamp 40
3.3.2.
Chương trình trên máy tính 40
5
Đinh Duy Chương Khóa luận tốt nghiệp
Mở đầu
Hiện nay trên thế giới cũng như ở Việt Nam người ta có thể giao tiếp với nhau
bằng nhiều phương tiện, đặc biệt như: qua mạng Internet, mạng điện thoại. Những
phương tiện đó chỉ áp dụng khi cách trở về mặt địa lý. Còn bình thường khi gần nhau
người ta giạo tiếp với nhau bằng ngôn ngữ nói thông thường.
Việc giao tiếp đối với người bình thường thì không có v
ấn đề gì. Nhưng đối
với những người khiếm thính thì lại là chuyện khác. Người khiếm thính họ nói chuyện
với nhau chủ yếu bằng cử chỉ, hành động. Đặc biệt những người bình thường muốn
hiểu được họ nói gì thì không phải chuyện dễ dàng. Quan trọng nhất là việc học tập
của những người khiếm thính cũng gặp rất nhiều khó khăn.
Do đó
đề tài này em muốn xây dựng một thiết bị nhận biết ngôn ngữ dấu hiệu
để giúp cho việc giao tiếp và học tập của những người khiếm thính được dễ dàng hơn.
Giúp cho họ có thể hoà nhập vào cuộc sống như những người bình thường.
Hà Nội tháng 06 năm 2005
Đinh Duy Chương
6
Đinh Duy Chương Khóa luận tốt nghiệp
Chương 1. TỔNG QUAN
1.1. Ngôn ngữ dấu hiệu
1.1.1. Ngôn ngữ dấu hiệu là gì ?
9 Hiểu một cách đơn giản thì ngôn ngữ dấu hiệu chính là những cử chỉ, hành
động của con người, những động tác của tay hoặc có thể là của một bộ phận nào đó
trên cơ thể con người. Chính từ những cử chỉ hành động đó mà người ta có thể hiểu
được và giao tiếp với nhau.
9 Khi nghiên cứu về ngôn ngữ dấu hiệu ta cũng đặt một câu hỏi là t
ại sao phải
nghiên cứu ngôn ngữ dấu hiệu. Câu trả lời là để giao tiếp với những người khiếm thính
và ngoài ra có thể có một số ứng dụng đặc biệt khác.
9 Với những người khiếm thính thường gắn liền với bệnh câm. Do đó giao tiếp
của họ rất hạn chế. Trong hoàn cảnh như vậy những họ vẫn tìm cách để nói chuyện với
nhau, một cách
đơn giản là họ sẽ dùng hình thức viết chữ để nói chuyện với nhau. Mặc
dù vậy việc này thường rất mất thời gian đôi khi còn bất tiện. Để giải quyết vấn đề trên
họ đã đưa ra một ngôn ngữ gọi là ngôn ngữ dấu hiệu tức là họ không giao tiếp với
nhau như những người bình thường mà dùng những cử chỉ hành động của mình để nói
cho ngườ
i khác hiểu.
9 Trên thực tế việc học đối với những người khiếm thính là rất khó khăn. Như
ngày nay ở Việt Nam việc phổ cập giáo dục cho những người khiếm thính đã được
quan tâm, nhưng vẫn còn rất hạn chế. Vì chỉ với việc phổ cập mức tiểu học phải kéo
dài ít nhất là 9 năm. Nên đối việc phổ cập mức cao hơn là rất khó kh
ăn. Đối với những
người trước khi bị khiếm thính lại không biết chữ thì đòi hỏi việc đào tạo lại càng khó
khăn hơn.
9 Ngôn ngữ dấu hiệu chỉ được sử dụng trong một phạm vi hẹp nên rất ít người
bình thường hiểu được ngôn ngữ này. Điều này tạo nên một rào cản lớn trong giao tiếp
giữa người khiếm thính và người bình thường. Ng
ười khiếm thính và người câm sẽ
khó có cơ hội hoà nhập vào cộng đồng người bình thường.
9 Trên thế giới, hiện đã có nhiều nghiên cứu nhằm xây dựng các thiết bị có thể
trợ giúp sự giao tiếp giữa những người khiếm thính và những người bình thường.
7
Đinh Duy Chương Khóa luận tốt nghiệp
Trong khi đó, ở Việt Nam, hiện chưa có các nghiên cứu dành cho những người khiếm
thính.
9 Xuất phát điểm từ đó trong đề tài này em muốn tìm hiểu và bước đầu xây
dựng một hệ thống nhận biết dấu hiệu để giao tiếp với những người khiếm thính. Và từ
đó giao tiếp giữa những người khiếm thính và những người bình thường được cải thiện
hơn. Ngoài ra, thi
ết bị cũng có thể dùng trong mục đích học tập cho người khiếm
thính.
1.1.2. Một số chuẩn trên thế giới và Việt Nam
9 Để thống nhất trong giao thiếp, ngôn ngữ dấu hiệu cũng có những chuẩn nhất
định. Trên thế giới phổ biến nhất là ngôn ngữ ASL (American Sign Languague) của
Mỹ. Với chuẩn này các chữ trong bảng chữ cái và các số tự nhiên được mã hoá hết sức
đơn giản. Trong khi đó, các từ được mã hoá phức tạp hơn nhiều. Mỗi từ (khái niệm)
được miêu tả bởi 5 đặc tính của ký hiệu: hình dạng bàn tay, v
ị trí bàn tay so với cơ thể
người, hướng của bàn tay, chuyển động của bàn tay và ngón tay, biểu hiện của nét mặt
và cơ thể.
Hình 1a: Dấu hiệu của các chữ cái trong bảng chữ cái
Hình 1b: Dấu hiệu của các chữ số tự nhiên
9 Với các quốc gia khác nhau lại có những đặc trưng ngôn ngữ khác nhau. Vì
vậy, mỗi quốc gia thường có chuẩn riêng cho mình. Chuẩn ngôn ngữ dấu hiệu của Việt
Nam về cơ bản là giống chuẩn của Mỹ tuy nhiên cũng có một số khác biệt. Đó là sự
thêm vào đó những con dấu và có thêm một số chữ cái khác mà trong bảng trên không
có như chữ Ô,
Ơ, Ư, Ê, Â. Do đó ta phải tổ hợp thêm một số cử chỉ khác nữa để phân
8
Đinh Duy Chương Khóa luận tốt nghiệp
biệt các chữ cái và các con số. Và một số chữ số của ta cũng khác với chữ số trong
bảng trên.
Hình 2: Bảng chữ cái và chữ số tiếng Việt
1.1.3. Mục tiêu của khoá luận
Một thiết bị nhận biết và chuyển đổi ngôn ngữ dấu hiệu sang ngôn ngữ thông
thường có thể được xây dựng theo hai phương pháp:
9
Đinh Duy Chương Khóa luận tốt nghiệp
o Phương pháp nhận biết từng từ: Phương pháp này có ưu điểm là tốc độ
chuyển đổi nhanh, tiện cho người sử dụng nhất. Tuy nhiên, việc xây
dựng một hệ thống như vậy rất phức tạp ví dụ như:
• Cần nhiều tham số đầu vào
• Thuật toán xử lý phức tạp
• Đòi hỏi phải có bộ từ đi
ển
• Khi có từ mới thì phải huấn luyện cho hệ thống trước
o Phương pháp đánh vần: Người sử dụng sẽ đánh vần theo bảng chữ cái.
Phương pháp này có nhược điểm là tốc độ chuyển đổi sẽ chậm hơn nhiều
phương pháp dùng từ. Tuy nhiên, nó có một số ưu điểm sau:
• Tham số đầu vào không nhiều
• Có thể dùng các thuậ
t toán tương đối đơn giản
• Có thể tạo ra các từ tuỳ ý mà không cần bộ từ điển
Từ các phân tích trên, ta thấy rằng phương pháp đánh vần có khả năng dễ
dàng tích hợp với các bộ vi xử lý để tạo nên các thiết bị nhỏ gọn, tiện dụng cho người
sử dụng. Phương pháp này cũng là tiền đề cho việc xây dựng các thiết bị sử dụng
phương pháp nhận biết từng từ.
Vì vậy, trong khoá luận này, em tập trung vào việc tìm hiểu xây dựng một hệ
thống nhận biết ngôn ngữ dấu hiệu sử dụng phương pháp đánh vần.
1.2. Các phương pháp nhận biết ngôn ngữ dấu hiệu
Để xây dựng được một hệ thống nhận biết ngôn ngữ dấu hiệu, trước hết, em
xin trình bày về các phương pháp nhận biết đang được nghiên cứu trên thế giới.
1.2.1. Nhận biết ngôn ngữ bằng phân tích hình ảnh
1.2.1.1. Giới thiệu về phương pháp phân tích hình ảnh
Nhận biết ngôn ngữ dấu hiệu qua video (camera) từ xa là một yêu cầu trực
quan. Để đưa ra mã hình ảnh thành ngôn ngữ dấu hiệu, cần thiết phải tìm những vùng
có thông tin về hình ảnh. Camera sẽ dõi sự di chuyển của những người khiếm thính và
sẽ lọc ra chuỗi hình ảnh ngôn ngữ dấu hiệu phù hợp.
10
Đinh Duy Chương Khóa luận tốt nghiệp
1.2.1.2. Đặc điểm của phương pháp này
9 Người khiếm thính sử dụng phương tiện ngôn ngữ dấu hiệu để đọc và viết
chính tả. Nhận biết ngôn ngữ dấu hiệu được dựa trên hình ảnh và sự di chuyển của tay.
Cấu trúc trực quan của ngôn ngữ dấu hiệu có thể truyến đạt những khái niệm phức tạp
nhanh chóng và chính xác.
9 Việc đề cập nhận biết trực quan là rất quan trọng cho những ng
ười khiếm
thính vì khả năng của ngôn ngữ dấu hiệu là ở khoảng cách, tuỳ thuộc vào khoảng cách
mà cho ta sự nhận biết chính xác hay không chính xác. Tuy nhiên vẫn có lỗi và hệ
thống này có thể gây khó chịu cho người sử dụng.
9 Ngôn ngữ dấu hiệu cập nhật không nhanh, sự di chuyển cụ thể đưa ra những
khái niệm và những từ . Trong những lần thực nghiệm đã đưa ra dấu hiệ
u hình ảnh của
những từ ứng với miệng và ngôn ngữ cử chỉ. Hình dưới chỉ ra 2 khung từ 1 video clip
của ngôn ngữ dấu hiệu (BSL).
Hình 3: Các video clip
1.2.1.3. Phương thức
9 Thí nghiệm với 8 người khiếm thính. Trong suốt quá trình thực nghiệm hướng
nhìn của mỗi người được ghi vào một video clip.
11
Đinh Duy Chương Khóa luận tốt nghiệp
9 Từ việc kiểm tra video clip hình 3. Video clip đã được đưa ra trên màn hình
PC và người xem clip từ khoảng cách cố định. Sự di chuyển được ghi lại trong suốt
quá trình xem sử dụng một hệ thống nhìn “Quick Glance”. Hệ thống này sử dụng tia
hồng ngoại để ghi lại hình ảnh ở tốc độ 30Hz.
9 Hướng nhìn được ghi lại dưới dạng một file text và file này tương ứng với 2
phút video clip trong quá trình phân tích.
1.2.1.4. Kết quả của việc phân tích hình ảnh
9 Về mặt không gian: Việc đặt toạ độ (x,y) cho 3 sự kiện (User A, User B, User
C, và các vấn đề liên quan đến khiếm thính) được thể hiện trên hình 4, hình 5, hình 6
User A
Hình 4: Phân vùng trong không gian của User A
User B
Hình 5: Phân vùng trong không gian của User B
12
Đinh Duy Chương Khóa luận tốt nghiệp
User C
Hình 6: Phân vùng trong không gian của User C
9 Hình này tương ứng với video clip thứ hai, kết quả tương tự như video clip
thứ nhất. Quan sát sự di chuyển của 8 vật thể sẽ biết được những điểm giống nhau.
Trong mỗi trường hợp, việc quan sát được tập trung trên bề mặt của dấu hiệu video
clip, thỉnh thoảng có sự trệch tới những vùng khác nhau phổ biến trên trục X qua bề
mặ
t của dấu hiệu (User A và User C). Hai vật thể (một trong những vật thể đó là User
B) là trung tâm rất chuẩn xác với một vài sự trệch hướng. Độ chính xác là 10x10 pixel
trong mỗi một hình ảnh. Những điểm chính xác chủ yếu là quanh bề mặt trung tâm của
dấu hiệu.
9 Hình 8 chỉ ra trung tâm User B, được phủ vói những vòng đưa ra mô tả góc
quay quanh một điểm trung tâm
Hình 7: Với User B
13
Đinh Duy Chương Khóa luận tốt nghiệp
9 Vòng tròn là tâp trung vị trí trung bình của tất cả các mẫu và được vẽ ở góc cố
định 2.5o, 5o và 10o từ trung tâm và được làm sạch từ hình này. Phần lớn điểm quan
sát nằm trong khoảng 2.5o của trung tâm: hơn 75% các điểm rơi vào vòng tròn này với
User A và C, hơn 90% cho User B.
9 Về mặt thời gian: Hình 8 chỉ ra hình ảnh của User A trong video clip thứ hai.
Giá trị trung bình của trục Y là 185 và những điểm làm sạch được chỉ ra. Hướng nhìn
được tập trung ch
ủ yếu quanh vị trí này, thỉnh thoảng cũng có sự sai khác. Sự sai khác
này là từ phần cuối đặc trưng ít hơn 0.5 giây và được tập trung trong trục X thông qua
điểm trung tâm. Trong chuỗi hình ảnh, dấu hiệu được nhìn thấy bên dưới
Hình 8: Tín hiệu thu được từ hình ảnh
1.2.1.5. Phân tích hệ số dư thừa
9 Kiểm tra video clip được mã hoá sử dụng mã hoá Baseline H.263 ( với bước
lượng tử cố định là 8) và số hệ số non-zero vẫn trong mỗi block sau sự bù chuyển
động, DCT và bước lượng tử được đếm. Hình 9 mô tả tổng số hệ số lượng tử dư thừa
non-zero trong mỗi vị trí block cho những khung inter-code 200 của chuỗi.
14
Không có nhận xét nào:
Đăng nhận xét