HCMUS-Hệ thống xử lý dữ liệu khuyết và các ứng dụng cho dữ liệu kinh tế và môi trường
1. |
Tên đề tài: |
Hệ thống xử lý dữ liệu khuyết và các ứng dụng cho dữ liệu kinh tế và môi trường |
2. | Mã số | D2023-18-01 |
3. | Chủ nhiệm đề tài: |
PGS.TS. Nguyễn Thanh Bình Nhóm nghiên cứu gồm: 2PGS.TS, 3TS, 1ThS và 3HVCH |
4. | Đơn vị: | Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM |
5. | Lĩnh vực: | Công nghệ thông tin |
6. | Loại hình : | Nghiên cứu cơ bản |
7. | Thời gian thực hiện: |
36 tháng (2023-2026) |
8. | Kinh phí nghiên cứu: | 1420 triệu đồng |
9 | Thời gian nghiệm thu | Ngày 02 tháng 6 năm 2025 |
10 | Chủ tịch Hội đồng và quyết định thành lập HĐ |
GS.TS Phan Thị Tươi (đơn vị Trường Đại học Bách khoa, ĐHQG-HCM) theo Quyết định 494/QĐ-ĐHQG-KHCN ngày 8/5/2025 của Giám đốc ĐHQG-HCM. |
11. | Nội dung thực hiện |
– Nội dung 1: Khảo sát các bộ dữ liệu và xây dựng kho dữ liệu liên quan đến các bài toán xử lý dữ liệu khuyết. – Kết quả:
– Nội dung 2: Thuật toán ước lượng tham số khi có dữ liệu khuyết. . Kết quả:
– Nội dung 3: Nghiên cứu và phát triển thuật toán cho dữ liệu mất cân bằng. – Kết quả:
– Nội dung 4: Nghiên cứu và phát triển thuật toán cho bài toán xử lý dữ liệu khuyết cho dữ liệu dạng chuỗi thời gian. – Kết quả:
– Nội dung 5: Nghiên cứu và phát triển thuật toán cho bài toán xử lý dữ liệu khuyết cho dữ liệu đa phương thức. – Kết quả:
|
12. | Kết quả |
* Sản phẩm mềm: – Giải pháp xử lý dữ liệu khuyết
– Bộ dữ liệu cho các bài toán xử lý dữ liệu mất cân bằng Bộ dữ liệu thu thập từ thị trường chứng khoán: thu thập từ các sàn giao dịch chứng khoán (HNX, HOSE, UPCOM), đây là các dữ liệu theo ngày, trong khoảng thời gian 6 năm, từ đầu năm 2016 đến hết năm 2021 (gồm 1,731 mã cổ phiếu). Bộ dữ liệu thu thập từ các trạm quan trắc không khí tại Hà Nội: tại Cầu Giấy (14,689 mẫu), tại Minh Khai (15,924 mẫu). Bộ dữ liệu trên IMDB (50,000 mẫu), Fashion MNIST (70,000 mẫu), và MNIST (70,000 mẫu), Cifar10 (60,000 mẫu). Bộ dữ liệu Ecoli (336 mẫu), US Crime (1,994 mẫu), Ozone level (2,500 mẫu), Page Blocks (5,473 mẫu), Statlog Landsat (6,435 mẫu). Bộ dữ liệu “Thyroid Disease” (7,200 mẫu), Iris (150 mẫu), Parkinson (188 mẫu), Digits (43 mẫu).
|
13. | Hình ảnh giới thiệu kết quả |
Ứng dụng trong phân tích và xử lý dữ liệu trong lĩnh vực Y Tế |
14. | Thông tin liên hệ CNĐT |
Email: ngtbinh@hcmus.edu.vn |
15. | Liên hệ ĐHQG-HCM | Ban Khoa học và Công nghệ (Phòng 309, NĐH) và Trang điện tử thông tin về hoạt động KH&CN (https://research.vnuhcm.edu.vn/) |
Đơn vị đăng tin: Trường Đại học Khoa học Tự nhiên, ĐHQG-HCM