Home/Browse/Multimodal/Visual Question Answering

Visual Question Answering

Answering questions about images (VQA, GQA).

Benchmarks & Datasets

265K images with 1.1M questions. Balanced dataset to reduce language biases found in v1.