微软联手马里兰大学:视觉语言模型的“深度广度融合”革新