Các nhà nghiên cứu đã xây dựng hệ thống nhằm tạo ra một tập dữ liệu lớn hơn và đa dạng hơn để đào tạo AI y tế.

Nguồn: MIT Technology Review

Bạn chỉ đạt được hiệu quả nhờ vào tập dữ liệu mà bạn có: Hầu hết các chương trình trí tuệ nhân tạo đều dựa vào một tập hợp lớn các thông tin mà chúng học được. Tuy nhiên, nếu dữ liệu không đại diện cho tất cả các quần thể hoặc các trường hợp, hệ thống có thể bị thiên lệch hoặc không hiệu quả.

Một nghiên cứu mới của công ty chip đồ họa Nvidia, phòng khám Mayo, và Trung tâm khoa học dữ liệu lâm sàng MGH và BWH (CCDS) đã tạo ra một thuật toán đưa ra một bộ dữ liệu y tế đa dạng hơn. Nhờ sử dụng các mạng đối kháng sinh mẫu (Generative Adversarial Networks – GANs), các máy chụp MRI hiện có về các khối u não có thể thực hiện các thao tác quét tổng hợp mô tả rõ các bất thường.

Tầm quan trọng của nghiên cứu?

“Sự đa dạng rất quan trọng đối với sự thành công khi đào tạo các mạng thần kinh nhưng dữ liệu hình ảnh y khoa thường thiếu cân bằng”, Hoo Chang Shin, nhà khoa học nghiên cứu tại Nvidia, chia sẻ với ZDNet. “Hiện các ca bình thường có nhiều hơn so với các ca bất thường, tuy nhiên, các ca bất thường lại là những gì chúng ta quan tâm, cố gắng phát hiện và chẩn đoán”.

Hoài Thu

Lược dịch theo MIT Technology Review


Tác giả Erin Winick: Biên tập viên phụ trách mảng Việc làm tương lai tại MIT Technology Review, chuyên môn về kĩ thuật cơ khí, tự động hóa và sản xuất tiến bộ. Trước đó, cô là một nhà báo khoa học, nhà thành lập công ty in ấn 3-D và làm việc tại Economist.