Language models are on Replicate – Replicate blog

You can now deploy, run, and fine-tune large language models on Replicate.

domenica 17 maggio 2026 New tab

322 words~1 min read

You can now deploy, run, and fine-tune large language models on Replicate.

We’ve got official versions of FLAN-T5, GPT-J, and LLaMA, and you can also push any other custom model. We’re also releasing a preview of fine-tuning language models.

Language models can be run with just a couple of lines of code, like any other model on Replicate:

You can run them from Python, Node.js, or with an HTTP API, without having to set up servers or GPUs.

Try them out:

Language models are on Replicate – Replicate blog

Language models are on Replicate – Replicate blog

Other newsrooms on this story

Related reading

Language model roundup, April 2023 – Replicate blog

Fine-tune Llama 2 on Replicate – Replicate blog

Run OpenAI’s latest models on Replicate – Replicate blog

Run Llama 2 with an API – Replicate blog

Streaming output for language models – Replicate blog

Machine learning needs better tools – Replicate blog

Other newsrooms on this story

Related reading

Language model roundup, April 2023 – Replicate blog

Fine-tune Llama 2 on Replicate – Replicate blog

Run OpenAI’s latest models on Replicate – Replicate blog

Run Llama 2 with an API – Replicate blog

Streaming output for language models – Replicate blog

Machine learning needs better tools – Replicate blog