Storia in 1 fonti

MolmoPoint: Better pointing architecture for vision-language models | Ai2

MolmoPoint is a new vision-language model architecture that replaces text-based coordinate outputs with a more natural, token-based pointing mechanism that directly selects regions from visual features.

Raccontata da

allenai.org

Timeline cronologica

giovedì 28 maggio 2026·allenai.org
Molmo learns to point and act | Ai2
MolmoPoint and MolmoWeb extend the Molmo family from visual understanding to visual action, giving researchers open tools for models that can point, navigate, and interact with…
venerdì 29 maggio 2026·allenai.org
MolmoPoint: Better pointing architecture for vision-language models | Ai2
MolmoPoint is a new vision-language model architecture that replaces text-based coordinate outputs with a more natural, token-based pointing mechanism that directly selects…

Timeline cronologica

Molmo learns to point and act | Ai2

MolmoPoint: Better pointing architecture for vision-language models | Ai2

Timeline cronologica

Molmo learns to point and act | Ai2

MolmoPoint: Better pointing architecture for vision-language models | Ai2