AI City Challenge diễn ra trong khuôn khổ CVPR - hội nghị thường niên hàng đầu thế giới về Thị giác máy tính và Nhận dạng mẫu, được tổ chức tại Mỹ vào tháng 6. Cuộc thi năm nay tập trung vào việc khai thác AI để nâng cao hiệu quả trong các hoạt động về giao thông thông minh, bán lẻ, kho bãi.
Theo kết quả mới được ban tổ chức công bố, nhóm kỹ sư thuộc VNPT AI, Đại học Phenikaa và Đại học Giao thông Vận tải đạt điểm số 64,06%, cao hơn nhất trong các đội và cách biệt với độ về nhì (61,96%), với phần thi về "Phương pháp tăng cường dữ liệu và tổng hợp để phát hiện đối tượng trong hình ảnh camera Fisheye".
Phát hiện vật thể từ camera fisheye (mắt cá), tức camera góc siêu rộng, là hạng mục mới được đưa vào năm nay, bên cạnh các đề bài quen thuộc như theo dõi chủ thể trên nhiều camera, phân tích và mô tả tình huống giao thông, hay phát hiện hành vi không đội mũ bảo hiểm của người lái xe máy. Đề bài mới được đánh giá có độ phức tạp cao, khi yêu cầu xử lý dữ liệu hình ảnh từ ống kính camera giao thông góc siêu rộng, bao gồm toàn cảnh 180 độ và 360 độ quan sát.
Các đội thi phải đối mặt với thách thức xác định các đối tượng như xe buýt, xe máy, ôtô, người đi bộ, và xe tải từ hình ảnh bị cong vênh, bóp méo, nhỏ và mất cân bằng dữ liệu. Trong tổng số 726 đội tham gia AI City Challenge năm nay, có 403 đội đăng ký tranh tài ở thử thách này, trong đó các kỹ sư Việt giành vị trí cao nhất.
Điểm đặc biệt trong phương thức của nhóm là phát triển một phương pháp tăng cường dữ liệu mới, sử dụng từ VisDrone và Fisheye8K để làm phong phú dữ liệu đào tạo. Sau đó, nhóm sử dụng nhiều mô hình phát hiện vật thể hiện đại, ứng dụng trên các tập dữ liệu này để nâng cao hơn nữa hiệu suất phát hiện vật thể tổng thể.
Theo nhóm phát triển, bài toán phát hiện đối tượng trong camera mắt cá tuy thách thức, nhưng có tính ứng dụng cao khi camera góc siêu rộng đang được sử dụng rộng rãi trong hệ thống giao thông thông minh tại nhiều quốc gia. Camera này giúp giảm thiểu điểm mù và mở rộng tầm quan sát mà không cần tăng số lượng thiết bị.
"Bài toán này là cơ hội để cọ xát, đồng thời, khẳng định vị thế công nghệ Việt Nam trên bản đồ trí tuệ nhân tạo thế giới", đại diện nhóm cho biết.
Mô hình AI này cũng là một trong những mô hình đang được ứng dụng để phát triển nền tảng nhận diện hình ảnh VNPT SmartVision. Đây là nền tảng chuyên về nghiệp vụ xử lý hình ảnh với bốn nhóm tính năng chính là giám sát giao thông, giám sát an ninh, số hóa văn bản, nhận diện và tìm kiếm khuôn mặt. Giải pháp đã được triển khai tại nhiều tỉnh thành như Bình Phước, Cao Bằng, Hà Giang, Hà Nam, Tây Ninh, Bắc Giang, và Ninh Bình.
Theo công bố của VNPT, tại thành phố Tân An, tỉnh Long An, Smart Vision đã được tích hợp tại hơn 120 camera, giúp phát hiện hành vi vi phạm giao thông, giúp giảm 80% số vi phạm trên địa bàn.