KHOA HỌC VÀ CÔNG NGHỆ

Nghiệm thu đề tài cấp ĐHQG-HCM loại C tại Trường Đại học Bách khoa: Xử lý các thể rút gọn trong văn bản lâm sàng tiếng Việt của các bệnh án điện tử

1.

Tên đề tài: Xử lý các thể rút gọn trong văn bản lâm sàng tiếng Việt của các bệnh án điện tử
2. Mã số C2022-20-11
3. Chủ nhiệm đề tài:

PGS.TS. Võ Thị Ngọc Châu

Nhóm nghiên cứu gồm: 1PGS.TS và 1TS.

4. Đơn vị: Trường Đại học Bách Khoa, ĐHQG-HCM
5. Lĩnh vực: Công Nghệ Thông Tin và Truyền Thông
6. Loại hình : Nguyên cứu cơ bản
7. Thời gian thực hiện:

24 tháng (2022-2024)

8. Kinh phí nghiên cứu: 110 triệu đồng
9 Thời gian nghiệm thu Ngày 05 tháng 7 năm 2024
10 Chủ tịch Hội đồng và quyết định thành lập HĐ Quyết định 513/QĐ-ĐHQG ngày 20/5/2024 của Giám đốc ĐHQG-HCM bao gồm các thành viên cụ thể như sau:
1) Chủ tịch Hội đồng: GS.TS. Phan Thị Tươi, Trường Đại học Bách khoa, ĐHQG-HCM.
2) Ủy viên Phản biện: PGS.TS. Nguyễn Lưu Thùy Ngân, Trường Đại học Công nghệ Thông tin, ĐHQG-HCM.
3) Ủy viên Phản biện: PGS.TS. Nguyễn Thị Thúy Loan, Trường Đại học Quốc tế, ĐHQG-HCM.
4) Ủy viên Hội đồng: TS. Nguyễn Thị Thanh Sang, Trường Đại học Quốc tế, ĐHQG-HCM.
5) Ủy viên Thư ký: TS. Nguyễn Huỳnh Thông, Trường Đại học Bách khoa, ĐHQG-HCM.
11. Nội dung thực hiện 

– Nội dung 1: Xây dựng cơ sở dữ liệu cho các thể rút gọn trong văn bản lâm sàng tiếng Việt

. Kết quả: Cơ sở dữ liệu của các thể rút gọn trong văn bản lâm sàng tiếng Việt: 222 thể rút gọn, 304 cặp (thể rút gọn – thể đầy đủ)

– Nội dung 2: Xây dựng phương pháp xử lý các thể rút gọn trong văn bản lâm sàng tiếng Việt

. Kết quả: Mô hình học máy xử lý các thể rút gọn trong văn bản lâm sàng tiếng Việt ở các giai đoạn khác nhau trong các ngữ cảnh thực tế với độ chính xác lớn hơn 90%

12. Kết quả

* Sản phẩm mềm: Cơ sở dữ liệu và các mô hình học máy

* Sản phẩm cứng: Không.

* Sản phẩm đào tạo và khoa học:

. Đào tạo: 01 thạc sỹ và 02 cử nhân

. Khoa học:

. 01 bài báo trong kỷ yếu của hội nghị quốc tế hạng B: The 15th Asian Conference on Intelligent Information and Database Systems

. 03 bài báo Scopus trong kỷ yếu của hội nghị quốc tế IEEE và ACM: The 2022 9th NAFOSTED Conference on Information and Computer Science (IEEE), The 2023 7th International Conference on Big Data and Internet of Things (ACM), The 2024 18th International Conference on Ubiquitous Information Management and Communication (IEEE)

13. Hình ảnh giới thiệu kết quả

Hình 1. Giải pháp tổng thể để xử lý thể rút gọn trong văn bản lâm sàng tiếng ViệtHình 2. Giải pháp Nested Semi-supervised Learning cho bài toán nhận diện các thể rút gọn trong các văn bản lâm sàng tiếng việt của các loại ghi chú khác nhauHình 3. Giải pháp cho bài toán phân giải nhập nhằng cho các thể rút gọn trong các văn bản lâm sàng tiếng Việt trong ngữ cảnh liên miền và xử lý trực tuyến

14. Thông tin liên hệ CNĐT

Email: chauvtn@hcmut.edu.vn

15. Liên hệ ĐHQG-HCM Ban Khoa học và Công nghệ (Phòng 309, NĐH) và Trang điện tử thông tin về hoạt động KH&CN (https://research.vnuhcm.edu.vn/)

 

Trường ĐH Bách Khoa, ĐHQG-HCM

Scroll to Top