Trang chủ Chuyên gia viết BLife - Công nghệ hỗ trợ giao tiếp cho người bị tổn...

BLife – Công nghệ hỗ trợ giao tiếp cho người bị tổn thương chức năng vận động

Tổn thương chức năng vận động 

Trao đổi thông tin là nhu cầu thiết yếu của mỗi con người, trong đó giao tiếp bằng lời nói là hình thức phổ biến nhất, cơ bản nhất, nhanh nhất, dễ hiểu nhất và thuận tiện nhất. Để giao tiếp được bằng lời nói, đòi hỏi có rất nhiều yếu tố chi phối. Thực tế cho thấy, có khá nhiều bệnh dẫn đến mất khả năng giao tiếp bằng lời nói, mặc dù khả năng hiểu và diễn đạt của người bệnh còn tốt. Những nhóm bệnh này thường có các tổn thương vùng vận động của hệ thần kinh trung ương như đột quỵ não, chấn thương sọ não, u não, áp xe não, viêm não, parkinson giai đoạn muộn, hoặc của các dây thần kinh sọ não chi phối vận động ngôn ngữ, hoặc của vùng cột sống tủy như chấn thương, vết thương tủy sống, xơ cột bên teo cơ giai đoạn nặng và của các cơ quan tham gia hoạt động nói.  

Những dạng bệnh lý trên làm cho người bệnh không thể hoặc rất khó khăn khi nói chuyện với người khác, mặc dù vẫn nhận thức được, hiểu được và muốn giao tiếp bằng lời nói. Đặc biệt với người bệnh nặng, họ hoàn toàn không có khả năng giao tiếp bằng các hình thức khác như viết, gõ máy tính, chỉ biểu tượng hoặc ký hiệu bằng tay. Những người bệnh này luôn cảm thấy bất lực trong cuộc sống và những người bên cạnh không thể, hoặc rất khó nhận thông tin từ họ để có sự hỗ trợ kịp thời, phù hợp. Do đó, sẽ cần có các thiết bị hỗ trợ giao tiếp giúp người bệnh trao đổi thông tin. 

Một trong những ví dụ điển hình về người bị tổn thương chức năng vận động và ngôn ngữ nhưng nhờ có các thiết bị hỗ trợ giao tiếp vẫn có thể có đóng góp lớn cho cộng đồng là giáo sư vật lý lý thuyết và vũ trụ học Stefan Hawking. Ông mắc chứng bệnh ALS (xơ cứng cột bên teo cơ) từ rất trẻ, khiến ông phải sống trong trạng thái liệt toàn thân và phải ngồi xe lăn trong phần lớn cuộc đời còn lại của mình. Căn bệnh cũng lấy đi của ông khả năng nói chuyện, buộc ông phải giao tiếp thông qua một thiết bị hỗ được gắn trực tiếp vào chiếc xe lăn của ông. Thiết bị này được Intel phát triển để giúp những người gặp khó khăn trong giao tiếp như Stephan Hawking. Với hệ thống này, người dùng có thể nhập thông tin vào máy tính thông qua một bộ cảm biến hồng ngoại gắn trên kính. Cảm biến này có thể phát hiện chuyển động nhỏ trên má và chuyển tới máy tính dưới dạng các tín hiệu điều khiển. 

Tại các quốc gia đang phát triển, người tổn thương chức năng vận động cần có sự quan tâm nhiều hơn nữa của xã hội nhằm tạo các phương tiện hỗ trợ hoặc thay thế chức năng giao tiếp. Thông thường, người bệnh gặp rất nhiều khó khăn hoặc phải chấp nhận chi phí lớn để có được sự hỗ trợ phù hợp. Do đó, việc nghiên cứu và xây dựng hệ thống hỗ trợ giao tiếp cho người bị tổn thương chức năng vận động nhằm hỗ trợ người bệnh giao tiếp dễ dàng hơn với chi phí phù hợp có ý nghĩa nhân văn lớn đặc biệt trong bối cảnh kinh tế, xã hội Việt Nam hiện tại.

BLife – Hệ thống hỗ trợ giao tiếp cho người tổn thương chức năng vận động 

BLife là hệ thống hỗ trợ giao tiếp cho bệnh nhận tổn thương chức năng vận động tương tự như giáo sư Stephan Hawking, được các nhà khoa học Việt Nam nghiên cứu và triển khai thành công. Hệ thống này đã và đang đem lại cơ hội được giao tiếp cho nhiều người bệnh. Nó đã góp phần nâng cao chất lượng cuộc sống và giảm gánh nặng tâm lý cho nhiều người bệnh và gia đình. 

Hình 1. Sơ đồ tổng quan các thành phần của hệ thống hỗ trợ giao tiếp BLife

Hệ thống BLife nhận tín hiệu điều khiển từ chuyển động mắt để tương tác lên bàn phím ảo trên màn hình, người dùng có thể sử dụng chuyển động mắt để điều khiển con trỏ và lựa chọn ký tự muốn đánh vần trên bàn phím ảo. Các ký tự sẽ được tập hợp thành câu hoàn chỉnh, sau đó được tổng hợp thành âm thanh Tiếng Việt và được phát ra loa. Bàn phím ảo có thể tự thay đổi bố trí các phím bấm tạo sự thuận tiện cho người sử dụng nhằm tối ưu hóa thời gian nhập liệu và giảm sai sót khi nhập liệu. Hệ thống nhập liệu có bộ thu nhận tín hiệu điều khiển từ người dùng ví dụ như chuyển động hướng mắt nhìn và chuyển thành tọa độ con trỏ trên màn hình. Người dùng chỉ cần sử dụng chuyển động mắt để có thể nhanh chóng đưa ra các yêu cầu hỗ trợ, thể hiện tình trạng sức khỏe, ghi nhớ và giao tiếp với mọi người xung quanh. Thậm chí họ có thể sử dụng Internet để nhận và gửi email, tra cứu thông tin, tương tác với mạng xã hội, … 

Hình 2. Bệnh nhân đầu tiên sử dụng hệ thống BLife – TS. Phạm Hồng Thái, nguyên giảng viên Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội 

Cơ chế và nguyên tắc hoạt động cơ bản của BLife 

Thay bằng sử dụng ngón tay để nhấn từng chữ trên bàn phím, người bệnh sử dụng chuyển động mắt để lựa chọn một phím bấm trên bàn phím ảo. Mỗi lần nhấn được một phím sau khi tập trung điểm nhìn của mắt vào vị trí phím cần bấm và chờ trong một khoảng thời gian nhất định (dwell giây, thực nghiệm cho thấy dwell nằm trong khoảng từ 0.75 đến 2 giây tùy theo thể trạng của người sử dụng). Người bình thường có 10 ngón tay và đôi mắt cùng hoạt động trong quá trình tương tác với máy tính, nhưng người bệnh chỉ có chuyển động của đôi mắt để đồng thời vừa quan sát thu nhận thông tin vừa thực hiện các lệnh điều khiển máy. Điều này gây nhiều lỗi khi thao tác và người bệnh dễ bị mỏi mắt dẫn đến mệt rất nhanh. Do đó, nhóm phát triển BLife đã nghiên cứu và xây dựng một số cơ chế gợi ý đánh vần (spelling recommendation) giúp người sử dụng nhập liệu nhanh hơn, ít lỗi hơn dựa trên cấu trúc đặc biệt của tiếng Việt, dữ liệu tiếng Việt và tín hiệu điện não EEG của người sử dụng. 

Gợi ý nhập liệu nhanh dựa trên cấu trúc ghép tiếng Việt: Cấu trúc chữ tiếng Việt có đặc điểm đặc biệt là việc ghép các phụ âm và nguyên âm để tạo nên một tiếng giúp người nói phát âm chính xác. Bàn phím được thiết kế sao cho kích thước của các phím ký tự đủ lớn để người dùng có năng lực thị giác yếu hơn dễ dàng sử dụng và cấu trúc đặc biệt của từ tiếng Việt được sử dụng để giảm thiểu số lượng các phím ký tự ở mỗi bước để người dùng nhập hoàn chỉnh một từ tiếng Việt [1, 2]. 

Gợi ý nhập phím nhanh dựa trên tín hiệu điện não: Việc nhập phím nhanh có thể được thực hiện bằng cách giảm thời gian dwell ngay khi phát hiện được sự tập trung chọn phím trong tín hiệu điện não của người dùng. Trong nghiên cứu này chúng tôi khai thác tín hiệu điện não EEG để phát hiện sự tập trung của người dùng khi chọn phím. Hai phương pháp chính được phát triển: Phương pháp dựa trên mô hình học máy cổ điển và phương pháp dựa trên học sâu. Đối với học máy cổ điển, các đặc trưng mật độ phổ công suất (Power Spectral Density – PSD) được trích xuất từ tín hiệu điện não làm đầu vào cho mô hình phân loại. Các mô hình phân loại được lựa chọn bao gồm Máy Vector Hỗ trợ (Support Vector Machine – SVM) và Mạng nơ-ron nhiều lớp (Multilayer Perceptron). Đối với phương pháp học sâu, tín hiệu điện não trải qua các bước tiền xử lý như loại bỏ nhiễu, lọc thông dải (bandpass), và phân đoạn dữ liệu. Tiếp theo, các đặc trưng của tín hiệu điện não, cụ thể là entropy vi phân, được trích xuất. Ngoài ra, tín hiệu điện não được đưa vào mô hình Bộ mã hóa tự động biến thiên (Variational Autoencoder) để trích xuất các đặc trưng véc-tơ không gian tiềm ẩn. Các đặc trưng về điểm cố định (fixation) và đường trượt (saccade) từ tín hiệu chuyển động mắt cũng được trích xuất để cung cấp dữ liệu đa phương thức cho việc phân loại. Tất cả các đặc trưng này sau đó được xử lý thông qua mô hình học sâu dựa trên CNN, EEGNET và EEGIT-NET để phát hiện mức độ tập trung của người dùng. Cả hai phương pháp đều cho kết quả ấn tượng trong đó phương pháp học sâu đạt độ chính xác cao nhất là 96,60% khi kiểm tra chéo đối tượng. Xem chi tiết trong [3, 4]. 

Gợi ý nhập câu hoàn chỉnh nhanh: Quan sát cho thấy người sử dụng mất thời gian đáng kể để gõ những câu quá dài. Do đó, chúng tôi đã phát triển phương pháp gợi ý nhập liệu nhanh dựa trên phân tích bi-gram với mục đích giảm thời gian cần thiết để người dùng nhập nội dung. Phương pháp này được xây dựng dựa trên đặc tính thống kê của câu tiếng Việt đơn giản. Cơ chế này cho phép đưa ra gợi ý một câu hoàn chỉnh mà người sử dụng có thể muốn nhập dựa vào nội dung mà họ đã nhập. 

Sửa lỗi chính tả: Do phải dùng chuyển động mắt cho cả hai nhiệm vụ là quan sát để thu nhập thông tin và lựa phím để chọn từng chữ, việc bị lỗi một ký tự sẽ mất nhiều thời gian để nhập lại. Do đó, chúng tôi đã phát triển 1 phương pháp sửa lỗi chính tả sử dụng mô hình ngôn ngữ hai chiều quy mô lớn BARTpho. 

Tối ưu hóa tương tác khi sử dụng trình duyệt: Người bình thường khi sử dụng trình duyệt đồng thời kết hợp thông tin hình ảnh được thu nhận từ mắt và các lệnh click, scroll up, scroll down, v.v. bằng thiết bị chuột. Người bệnh khi chỉ có đôi mắt để đồng thời thực hiện hai chức năng này thì rất nhanh mệt do các thao phải lặp lại nhiều lần. Vì thế, chúng tôi đã phát triển một phương pháp tương tác trên nền web hoàn toàn mới [5]. Phương pháp này tối ưu trình tự và giảm thiểu số lần người bệnh phải thực hiện tương tác trên màn hình. Các thao tác duyệt tin như scroll up, scroll down, v.v. được hệ thống thực hiện đồng thời trong lúc người sử dụng đang đọc thông tin trên màn hình. Với cách này, người đọc không bị gián đoạn thông tin khi buộc phải sử dụng mắt để điều khiển scroll up hoặc scroll down. 

Tích hợp module điều khiển nhà thông minh: Cùng với hạn chế về khả năng vận động và khó khăn trong giao tiếp, khó khăn trong tương tác với không gian sống để nâng cao chất lượng cuộc sống sẽ là rào cản lớn đối với những người bệnh. Do đó, chúng tôi đã phát triển và tích hợp chức năng điều khiển các thiết bị IOT trong nhà vào hệ thống BLife để giúp người bệnh tự lập hơn trong cuộc sống [6]. Chức năng này cho phép người bệnh điều khiển các thiết bị điện tử quen thuộc trong nhà như điều hòa, đèn, quạt, TV,  v.v. chỉ bằng chuyển động mắt và tín hiệu điện não. 

Tác động xã hội 

Hệ thống BLife hiện đã và đang hỗ trợ được nhiều người bệnh ALS ở Việt Nam giúp họ được giao tiếp trở lại [7-10]. Nhờ đó họ đã được chăm sóc tốt hơn và tiếp tục tìm lại được giá trị của mình trong gia đình, trong cộng đồng và trong xã hội. Nhiều người bệnh sử dụng hệ thống đến những giây phút cuối cùng của họ. 

Hình 3. Hình ảnh một số người bệnh ALS sử dụng hệ thống hỗ trợ giao tiếp BLife 

Ngoài ra, trong quá trình triển khai hệ thống, các thành viên nhóm nghiên cứu đã tiếp xúc với nhiều người bệnh ALS. Chứng kiến nhiều hoàn cảnh bệnh nhân rất đặc biệt này, trưởng nhóm nghiên cứu đã viết và xuất bản cuốn sách đại chúng “Mắt nói – Những tiếng được hồi sinh từ ánh mắt” và cùng cộng sự xây dựng Sáng kiến Mắt nói nhằm khơi dậy sự quan tâm tới cộng đồng và xã hội nhiều hơn tới nhóm những người bệnh này [11]. 

Tác giả: PGS.TS Lê Thanh Hà, Trường Đại học Công nghệ, Đại học Quốc gia Hà Nội. 

Biên tập: Quỹ Đổi mới sáng tạo Vingroup (VinIF). 

Tài liệu tham khảo 

[1]. Nguyen Minh Hoa, Ngo Thi Duyen, Nguyen Ba Hung, Can Van Mao, Kieu Hai Dang, Le Thanh Ha. On-screen keyboard controlled by gaze for Vietnamese people with amyotrophic lateral sclerosis. Technology and Disability 35.1 (2023): 53-65.

[2]. Lê Thanh Hà, Bùi Thế Duy, Ngô Thị Duyên, Nguyễn Văn Tùng, Nguyễn Thế Hoàng Anh, Nguyễn Minh Hoà. Phương pháp và hệ thống nhập liệu dựa trên bàn phím ảo và chuyển thành âm thanh. Bằng độc quyền sáng chế số 36073 cấp bởi Cục Sở hữu trí tuệ, theo quyết định số 30963/QĐ-SHTT ngày 17/05/2023.

[3]. Ngo Thi Duyen, Kieu Hai Dang, Nguyen Minh Hoa, Nguyen The Hoang Anh, Can Van Mao, Nguyen Ba Hung, Le Thanh Ha. An EEG & Eye-Tracking Dataset of ALS Patients & Healthy People during Eye-Tracking-Based Spelling System Usage. Nature Scientific Data 11, 664 (2024). https://doi.org/10.1038/s41597-024-03501-y.

[4]. Le Thanh Ha, Kieu Hai Dang, Nguyen Minh Hoa, Nguyen Viet Anh, Ngo Thi Duyen, Nguyen Ba Hung, Man Quoc Khanh. Method for processing data to adjust data inputting speed in Human-Computer Interface system controlled by eye gaze and electrencephalography data. Bằng độc quyền sáng chế tại Mỹ (USPTO) số US12118190B2.

[5]. Le Thanh Ha, Nguyen Thanh Bong, Ngo Di Duyen. Interaction method using eye tracking data. Bằng độc quyền sáng chế tại Mỹ (USPTO) số US12093516B2.

[6]. Ma Thi Chau, Truong Duc Toan, Ngo Thi Duyen, Le Thanh Ha. An assistive IOT smart control system for people with severe mobility disabilities. Technology and Disability, vol. 36, no. 3, pp. 85-98, 2024.

[7]. Báo VnExpress. PGS Việt phát triển thiết bị giao tiếp cho người mất khả năng nói (https://vnexpress.net/pgs-viet-phat-trien-thiet-bi-giao-tiep-cho-nguoi-mat-kha-nang-noi-4471747.html).

[8]. Báo Khoa học & Phát triển. Đem lại khả năng giao tiếp cho người bệnh ALS (https://khoahocphattrien.vn/khoa-hoc/dem-lai-kha-nang-giao-tiep-cho-nguoi-benh-als/2022081810108445p1c160.htm). 2022.

[9]. Báo Phụ nữ Việt Nam. Phát triển thiết bị giao tiếp cho người mất khả năng nói (https://phunuvietnam.vn/phat-trien-thiet-bi-giao-tiep-cho-nguoi-mat-kha-nang-noi-20240710163356605.htm).

[10]. Báo Sức khỏe Cộng đồng Người bệnh bị mất khả năng nói được hỗ trợ bởi thiết bị “nói qua ánh mắt” (https://suckhoecongdongonline.vn/nguoi-benh-bi-mat-kha-nang-noi-duoc-ho-tro-boi-thiet-bi-noi-qua-anh-mat-d283756.html)

[11]. Website https://matnoi.vn

BÀI MỚI NHẤT

Cluster nguyên tử: Cấu trúc đặc sắc và ứng dụng đa dạng

Trong vài thập kỷ vừa qua, vật liệu nano đã nổi lên và chiếm giữ một một vị trí quan trọng trong khoa học...

Tinh thần giáo dục đại học đại chúng tại Việt Nam Dân chủ Cộng hòa giai đoạn 1955 – 1975

Suốt nhiều thế kỷ qua, giáo dục đại học luôn là một thiết chế quan trọng trong xã hội Việt Nam. Trong những năm gần đây, các thảo luận về triết lý và tư tưởng của giáo dục Việt Nam ngày càng trở trên sôi nổi, thu hút không chỉ các chuyên gia, những nhà lý luận, mà cả hàng triệu phụ huynh và học sinh. Các thảo luận diễn ra từ nghị trường Quốc hội cho đến không gian gia đình. Tuy vậy, đến nay, câu hỏi tưởng chừng như rất đơn giản “Triết lý giáo dục của Việt Nam là gì?” lại chưa thể có đáp án.

Dấu ấn methyl hóa DNA trong sàng lọc, chẩn đoán ung thư

Trong tế bào nhân thực, phân tử DNA được quấn quanh lõi histone (còn gọi là nucleosome) tạo thành sợi nhiễm sắc. Một nucleosome gồm các tiểu đơn vị histone H2A, H2B, H3 và H4. Một cách hiểu đơn giản, DNA được đóng gói trong cấu trúc nucleosome; các nucleosome có thể rất gần nhau làm cho sợi DNA co đặc lại hoặc chúng phân bố xa nhau làm cho sợi DNA tháo xoắn, bộc lộ các trình tự nucleotide ở dạng tự do.

Những đột phá mới trong công nghệ chỉnh sửa gen

Công nghệ chỉnh sửa gen là một phát minh mang tính đột phá trong lĩnh vực công nghệ sinh học, cho phép các nhà khoa học chỉnh sửa mật mã di truyền của sinh vật chính xác theo ý muốn. Chính vì vậy, giải Nobel Hóa học năm 2020 đã được trao cho hai nhà khoa học nữ là Emmanuelle Charpentier và Jennifer Doudna cho công nghệ chỉnh sửa CRISPR-Cas9. Đây là sự công nhận to lớn đối với tính đột phá và tiềm năng ứng dụng vượt trội của công nghệ này, mở ra kỷ nguyên mới trong y học, nông nghiệp và sinh học, đồng thời mang lại hy vọng cho những tiến bộ chưa từng có trong việc điều trị các bệnh di truyền và cải thiện giống cây trồng.

BÀI ĐỌC NHIỀU

Khái quát về mô hình dữ liệu quan hệ

Phần lớn hệ thống cơ sở dữ liệu hiện nay đều được xây dựng bằng mô hình dữ liệu quan hệ. Vậy mô hình...

Supervised Learning và Unsupervised Learning: Khác biệt là gì?

Supervised learning (Học có giám sát) và Unsupervised learning (Học không giám sát) là hai trong số những phương pháp kỹ thuật cơ bản...

Khái quát về Data Pipeline

Dữ liệu là chìa khóa trong việc khám phá tri thức sâu rộng, nâng cao hiệu quả quy trình và thúc đẩy đưa ra...

Transformer Neural Network – Mô hình học máy biến đổi thế giới NLP

Năm 2017, Google công bố bài báo “Attention Is All You Need” thông tin về Transformer như tạo ra bước ngoặt mới trong lĩnh...