About this role

Aqua-IT B.V. is seeking an AI/ML Engineer specializing in Computer Vision. The role involves designing and executing fine-tuning pipelines for Vision-Language Models and developing evaluation frameworks for multimodal model performance.

Responsibilities:

Design and execute fine-tuning pipelines for Vision-Language Models (VLMs) on domain-specific imagery datasets, including data preprocessing, training orchestration, and hyperparameter optimization
Develop and implement evaluation frameworks for multimodal model performance, including task-specific metrics for image understanding, visual question answering, and spatial reasoning
Build scalable training infrastructure on AWS (SageMaker, EC2 GPU instances) for distributed fine-tuning of large multimodal models
Engineer data pipelines for curating, annotating, and transforming geospatial imagery datasets into model-ready formats for supervised and instruction-tuning workflows
Collaborate with applied scientists and solutions architects to iterate on model architectures, adapter strategies (LoRA/QLoRA), and inference optimization techniques

AI/ML Engineer (Computer Vision)

Key skills

About this role

Responsibilities: