Các thuật toán học máy sẽ theo dõi các hành vi của tin tặc và chống lại các chiến thuật phát triển của chúng.

Năm ngoái, nhóm bảo mật Microsoft Corp Azure Azure đã phát hiện hoạt động đáng ngờ trong việc sử dụng điện toán đám mây của một nhà bán lẻ lớn: Một trong những quản trị viên của công ty, người thường đăng nhập từ New York, đã cố gắng thâm nhập từ Romania. Nhưng sự thật thì người quản trị viên đang trong kì nghỉ, và người đột nhập vào hệ thống là một tin tặc. Microsoft đã nhanh chóng cảnh báo cho khách hàng của mình và cuộc tấn công đã được dập tắt trước khi kẻ xâm nhập đi quá xa.

Học máy là một công nghệ bảo mật rất mạnh. Nó đa năng, trong khi các hệ thống dựa trên quy tắc thì rất cứng nhắc, theo Dawn Song, giáo sư  tại Phòng thí nghiệm nghiên cứu trí tuệ nhân tạo của Berkeley của Đại học California. Tất nhiên, các tin tặc nổi tiếng có khả năng thích nghi, vì vậy chúng cũng có thể khai thác việc học máy để tạo ra những trò nghịch ngợm mới và áp đảo các phòng thủ mới. Các công ty dịch vụ đám mây lớn nhận thức sâu sắc rằng kẻ thù là mục tiêu di động nhưng họ cũng cho rằng công nghệ mới sẽ đem đến bất lợi lớn cho các tin tặc.

Trước khi học máy ra đời, các đội bảo mật đã sử dụng công cụ blunter. Ví dụ: nếu ai đó tại trụ sở cố gắng đăng nhập từ một địa điểm xa lạ, họ sẽ bị cấm đăng nhập. Hoặc các email spam có nhiều lỗi sai chính tả của từ Viagra sẽ bị chặn.

Một hệ thống của Microsoft được thiết kế để bảo vệ khách hàng khỏi các thông tin đăng nhập giả mạo có tỷ lệ dương tính giả là 2,8%, theo Giám đốc Công nghệ Azure Mark Russinovich. Nghe có vẻ không nhiều nhưng con số này lại được coi là không thể chấp nhận được, vì các khách hàng lớn hơn của Microsoft có thể tạo ra hàng tỷ thông tin đăng nhập.

Để làm tốt hơn việc tìm ra ai hợp pháp và ai không hợp pháp, công nghệ Microsoft đã tìm thông tin người dùng từ dữ liệu của từng công ty, tùy chỉnh bảo mật cho khách hàng đó về hành vi và lịch sử trực tuyến điển hình. Kể từ khi triển khai dịch vụ, công ty đã cố gắng giảm tỷ lệ dương tính giả xuống 0,001%. Đây là hệ thống đã vượt qua việc bị xâm nhập ở Romania.

Việc đào tạo các thuật toán bảo mật này thuộc về những người như Ram Shankar Siva Kumar, một quản lý của Microsoft với danh hiệu Data Cowboy. Ông quản lý một nhóm khoảng 18 kỹ sư phát triển các thuật toán học máy và sau đó đảm bảo rằng họ đủ thông minh và đủ nhanh để ngăn chặn các tin tặc và làm việc liên tục với các hệ thống phần mềm của các công ty trả nhiều tiền cho các dịch vụ đám mây của Microsoft.

Siva Kumar là một trong những người nhận được cuộc gọi khi các thuật toán phát hiện ra một cuộc tấn công. Anh thức dậy vào nửa đêm, thử thách thật nan giải. Hàng triệu người đăng nhập vào Google Gmail mỗi ngày. “Số lượng dữ liệu chúng tôi cần để xem xét đảm bảo đây là bạn hay kẻ mạo danh tiếp tục phát triển với tốc độ quá lớn để con người viết ra quy luật từng cái một,” Mark Risher, Giám đốc quản lý sản phẩm giúp ngăn chặn các cuộc tấn ông đến khách hàng của Google.

Ram Shankar Siva Kumar, một quản lý của Microsoft với danh hiệu Data Cowboy. Ảnh: Internet

Google kiểm tra các vi phạm bảo mật ngay cả sau khi người dùng đã đăng nhập, điều này rất hữu ích cho các tin tặc ban đầu trông giống như người dùng thực. Với việc học máy có thể phân tích nhiều mẩu dữ liệu khác nhau, việc đăng nhập trái phép không còn là vấn đề. Thay vào đó, Google giám sát các khía cạnh khác nhau của hành vi trong suốt phiên người dùng. Một số người ban đầu trông có vẻ hợp pháp, nhưng sau đó có thể thể hiện các dấu hiệu lạ. Trong trường hợp này, phần mềm Google ED sẽ kích chúng ra để ngăn chặn thiệt hại.

Bên cạnh việc sử dụng máy học để bảo mật các mạng và dịch vụ đám mây của riêng họ, Amazon và Microsoft đang cung cấp công nghệ cho khách hàng. Công ty bảo hiểm Hà Lan có tên NN Group NV sử dụng công cụ bảo vệ mối đe dọa nâng cao của Microsoft để quản lý quyền truy cập 27.000 công nhân và các đối tác thân thiết của họ.

Các hệ thống bảo mật học máy không làm việc trong mọi trường hợp, đặc biệt là khi không có đủ dữ liệu. Các nhà nghiên cứu và các công ty đang rất lo lắng về việc thông tin của họ có thể bị tin tặc khai thác. Ví dụ, họ có thể bắt chước hoạt động của người dùng trên các thuật toán để sàng lọc các hành vi điển hình. Đó là lý do tại sao đối với các công ty, việc giữ bí mật các tiêu chí thuật toán của họ và thay đổi công thức thường xuyên là ưu tiên hàng đầu, theo Battista Biggio, giáo sư tại Phòng thí nghiệm ứng dụng và nhận dạng mẫu của Đại học Cagliari tại Sardinia, Ý.

Cho đến nay, những mối đe dọa này có nhiều trong các tài liệu nghiên cứu hơn so với thực tế. Nhưng điều đó có khả năng thay đổi như Biggio đã viết trong một bài báo năm ngoái: Bảo mật là một cuộc chạy đua vũ trang, bảo mật của hệ thống học học máy và nhận dạng mẫu không phải là một ngoại lệ.

Thùy Vân

Lược dịch theo Dina Bass, Bloomberg


Công nghệ trí tuệ nhân tạo sẽ trở thành trợ thủ đắc lực trong nhiều lĩnh vực cho cộng đồng xã hội, mang lại những tiềm năng vô cùng to lớn khi được ứng dụng một cách hợp lý và đúng đắn. Đây cũng chính là nội dung Lớp 7 trong mô hình AIWS 7 lớp do Viện Michael Dukakis xây dựng. Lớp 7 nói riêng hay toàn bộ mô hình nói chung, AIWS hi vọng sẽ đảm bảo việc đưa trí tuệ nhân tạo vào cuộc sống chúng ta và mang lại những tác động tích cực.