KHOA HỌC VÀ CÔNG NGHỆ

Nghiệm thu đề tài cấp ĐHQG-HCM loại B tại Trường Đại học Công nghệ Thông tin: Phát hiện và nhận dạng thông tin văn bản trong ảnh

1.
Tên đề tài: Phát hiện và nhận dạng thông tin văn bản trong ảnh
2. Mã số DS2021-26-02
3. Chủ nhiệm đề tài:

TS Ngô Đức Thành

Nhóm nghiên cứu gồm: 2 TS, 2ThS và 2CN.

4. Đơn vị: Trường Đại học Công nghệ Thông tin, ĐHQG-HCM
5. Lĩnh vực: Công nghệ Thông tin
6. Loại hình : Nghiên cứu  cơ bản
7. Thời gian thực hiện: 24 tháng (2021-2023)
8. Kinh phí nghiên cứu: 500 triệu đồng
9 Thời gian nghiệm thu Ngày 4 tháng 10 năm 2024
10 Chủ tịch Hội đồng và quyết định thành lập HĐ PGS.TS Lý Quốc Ngọc (đơn vị trường Đại học Khoa Học Tự Nhiên, ĐHQG TP.HCM) theo Quyết định 1423 ngày 2/10/2024 của Giám đốc ĐHQG-HCM
11. Nội dung thực hiện (chi tiết theo nội dung thực hiện/đăng ký; không quá  800 từ)

– Nội dung 1:

  • Báo cáo khoa học tổng kết, phân tích và đánh giá các phương pháp tiên tiến nhất hiện nay (state-of-the-art) liên quan đến bài toán.
  • Đề xuất và hướng dẫn 01 chuyên đề NCS.
  • Demo minh hoạ từ mã nguồn cung cấp bởi các tác giả đã công bố.

 Kết quả:

  • Báo cáo khoa học tổng kết, phân tích và đánh giá các phương pháp tiên tiến nhất hiện nay (state-of-the-art) liên quan đến bài toán.
  • Demo minh hoạ từ mã nguồn cung cấp bởi các tác giả đã công bố
  • Hướng dẫn 01 chuyên đề NCS.

– Nội dung 2:

  • Báo cáo khoa học phân tích và đánh giá các phương pháp sinh dữ liệu văn bản cho ảnh tiên tiến nhất hiện nay (state-of-the-art).
  • 01 Khóa luận tốt nghiệp Đại học 
  • Demo minh họa việc tạo dữ liệu từ các nghiên cứu mới nhất.

Kết quả:

  • Báo cáo khoa học phân tích và đánh giá các phương pháp sinh dữ liệu văn bản cho ảnh tiên tiến nhất hiện nay (state-of-the-art).
  • 01 Khóa luận tốt nghiệp Đại học 
  • Demo minh họa việc tạo dữ liệu từ các nghiên cứu mới nhất.
  • 02 báo tại hội nghị MAPR 2021

 Nội dung 3:

  • 01 bộ dữ liệu có chú thích với văn bản tiếng Việt trong ảnh, bao gồm ảnh chú thích thủ công và ảnh tạo sinh tự động, theo format của ICDAR.
  • 01 bộ dữ liệu có chú thích với văn bản đa ngôn ngữ (tiếng Việt và tiếng Anh) trong ảnh, bao gồm ảnh chú thích thủ công và ảnh tạo sinh tự động, theo format của ICDAR.
  • Các bộ dữ liệu được công bố công khai cho cộng đồng nghiên cứu.
  • Đề xuất và hướng dẫn 01 đề tài luận văn Thạc sĩ.
  • 01 bài tạp chí.
  • 01 Giải pháp hữu ích.

Kết quả:

  • 01 bộ dữ liệu có chú thích với văn bản tiếng Việt trong ảnh theo format của ICDAR.
  • 01 bộ dữ liệu có chú thích với văn bản đa ngôn ngữ (tiếng Việt và tiếng Anh) trong ảnh theo format của ICDAR.
  • Các bộ dữ liệu được công bố công khai cho cộng đồng nghiên cứu.
  • Hướng dẫn 01 đề tài luận văn Thạc sĩ.
    • 01 bài báo tại hội nghị quốc gia FAIR 2023
    • 01 bài tạp chí (VJCS)
    • 01 bài báo tại hội nghị MAPR 2022
    • 01 đơn chấp nhận sáng chế

     Nội dung 4:

    • 01 bài báo ISI/Scopus.
    • 01 Giải pháp hữu ích.
    • Đề xuất 01 phương pháp khai thác, kết hợp thông tin/đặc trưng ngôn ngữ và thông tin/đặc trưng thị giác.

    Kết quả:

    • 01 bài tạp chí (IEEE ACCESS)
    • 01 đơn chấp nhận sáng chế
    • 01 bài báo tại hội nghị ICIP

     Nội dung 5:

    • 01 ứng dụng minh họa và thử nghiệm.
    • 01 báo cáo mô tả tính năng và hướng dẫn sử dụng.
    • 02 Khóa luận tốt nghiệp Đại học
    • Báo cáo tổng kết đề tài.

    . Kết quả:

    01 báo cáo tổng kết đề tài
12. Kết quả

* Sản phẩm mềm: 1 báo cáo tổng kết

* Sản phẩm cứng: Không.

* Sản phẩm đào tạo và khoa học:

[1] Do, Tien, Thuyen Tran, Thua Nguyen, Duy-Dinh Le, and Thanh Duc Ngo. “SignboardText: Text Detection and Recognition in In-the-Wild Signboard Images.” IEEE Access (2024).

[2] Do, Tien, Thuyen Tran Doan, Khiem Le, Thua Nguyen, Duy-Dinh Le, and Thanh Duc Ngo. “Key information extraction and recognition from rich text images.” Vietnam Journal of Computer Science (2024).

[3]  Manh-Khanh Ngo HuuSy-Tuyen HoVinh-Tiep Nguyen, Thanh Duc Ngo: Multilingual-GAN: A Multilingual GAN-based Approach for Handwritten Generation. MAPR 2021

[4] Minh TranTri PhamTien NguyenTien Do, Thanh Duc Ngo: A robust framework for mathematical formula detection. MAPR 2021

[5] Nguyen-Thi, Bich-Van, Triet Le Phan, Thua Ngoc Nguyen, and Thanh Duc Ngo. “A Crowdsourcing Data Annotation System For Vietnamese Scene Text Detection.” In 2022 International Conference on Multimedia Analysis and Pattern Recognition (MAPR), pp. 1-6. IEEE, 2022.

Tien, Hung Tran, and Thanh Duc Ngo. “Unsupervised Domain Adaptation with Imbalanced Character Distribution for Scene Text Recognition.” In 2023 IEEE International Conference on Image Processing (ICIP), pp. 3493-3497. IEEE, 2023.

[8] Lê Xuân Tùng, Phạm Nguyễn Xuân Trường, Trần Thanh Tùng, Lê Trần Trọng Khiêm, Đỗ Văn Tiến, Ngô Đức Thành.“ ViCalliGarphy: Tập dữ liệu chobafi toán nhận dạng chữ thư pháp tiếng Việt và một số đánh giá”, Hội nghị khoa học Quốc Gia lần thứ XVI (FAIR 2023)

13. Hình ảnh giới thiệu kết quả (1-2 hình tiêu biểu)
14. Thông tin liên hệ CNĐT

Email:thanhnd@uit.edu.vn

Điện thoại: 0918145729

15. Liên hệ ĐHQG-HCM Ban Khoa học và Công nghệ (Phòng 309, NĐH) và Trang điện tử thông tin về hoạt động KH&CN (https://research.vnuhcm.edu.vn/)

Trường Đại học Công nghệ Thông tin, ĐHQG-HCM

Lên đầu trang